Big DataTechnique and Its Challenges

बिग डाटा तकनीक और इसकी चुनौतियां!


नमस्कार साथियों, आज इस पोस्ट में मैं एक बहुत ही गंभीर विषय पर चर्चा करने जा रहा हूं जो हम सब से जुड़ा हुआ विषय है, अतः कृपया अंत तक जरूर पढ़ें तत्पश्चात बैठकर विचार करें।

         यदि आप से मैं यह कहूं कि आप अपनी दिनचर्या में जो कार्य कर रहे हैं वह दरअसल आप नहीं बल्कि कोई और तय कर रहा है। या दूसरे शब्दों में यूं कहें कि आपको कोई और संचालित कर रहा है। आप सोच रहे होंगे कि नहीं नहीं मैं अपनी मर्जी का मालिक हूं और मैं सारे कार्य अपनी स्वेच्छा से करता हूं। जी नहीं आप सोच भी नहीं सकते कि आप जो प्रोडक्ट खरीद रहे हैं वह आपसे सुनियोजित तरीके से खरिदवाया जा रहा है। आपके खाने और आपके पहनने की पसंद भी स्वयं आप की नहीं है यहां तक की आप जो बातें कर रहे हैं आप जो सोच रहे हैं उसका एक बड़ा हिस्सा कहीं और से संचालित है। मुझे पता है कि आप को यकीन नहीं आ रहा होगा परंतु सच तो यह है कि विज्ञान और तकनीक के इस युग में आप मानसिक गुलाम बन चुके हैं या बनने की कगार पर हैं। अब आप एक निश्चित समय अंतराल में आए अपने वैचारिक रुझान पसंद नापसंद जैसे परिवर्तन के बारे में जरूर सोचिएगा।


दरअसल हम मोबाइल और इंटरनेट की इस दुनिया में जाने अनजाने बहुत सारी छोटी बड़ी निजी जानकारियां बाजार को देते रहते हैं। चाहे आप इंटरनेट पर ब्राउजिंग कर रहे हो या सोशल मीडिया पर समय बिता रहे हों या फिर खाने का ऑर्डर बुक कर रहे हो या ओला जैसे कैब से कहीं सफर कर रहे हो यह सभी जानकारी किसी कंपनी विशेष के पास स्टोर होती रहती है। यहां तक कि आप अपनी  जिन बारीक खूबियों या बुराइयों को नहीं जानते होंगे कंपनियां उनके बारे में भी जानकारी रखती हैं। आप क्या खाते हैं, क्या पसंद करते हैं, कैसा कपड़ा पहनते हैं, कहां जाते हैं, किन से मिलते हैं, आपके वैचारिक रुझान क्या हैं, किस धर्म के बारे में क्या सोचते हैं, आपका राजनीतिक विचार क्या है, आपके शौक क्या हैं, आपकी इच्छाएं क्या हैं, आप कौन सी फिल्में पसंद करते हैं, आपको कैसे गाने पसंद हैं आदि आदि। आगे बढ़ने से पहले एक व्यवहारिक उदाहरण देकर बात को और स्पष्ट करता चलूं आप सब स्मार्टफोन यूज़र ने यह नोटिस किया होगा कि आप अपने यूट्यूब या सोशल मीडिया अकाउंट्स में जिस प्रकार के कंटेंट्स सर्च करते हैं या एक बार देख लेते हैं कंपनी उसी प्रकार के कंटेंट आपको रिकमेंड करने लगती है यहां तक की अब एडवर्टाइजमेंट भी उसी कंटेंट से रिलेटेड आने लगते हैं। यह सब बिग डाटा का कमाल होता है। कंपनियां आपकी इन छोटी-छोटी जानकारियों को एकत्र करके बड़े रूप में बिग डाटा में संग्रहित करती हैं, यह डाटा इतना पर्याप्त होता है कि इसके द्वारा आपके बारे में कुछ भी पता किया जा सकता है और इनके आधार पर आपके मस्तिष्क या फिर कहें कि आपकी दिनचर्या को कंट्रोल किया जा सकता है। अब आप समझ ही गए होंगे कि वर्तमान बिग डाटा तकनीक के इस युग में हमारी जानकारियां अब निजी नहीं रह गई हैं, साथ‌ ही लोगों की निजी जानकारियों की सुरक्षा कितनी आवश्यक हो गई है।



बिग डाटा क्या है?

             बिग डाटा छोटी-छोटी सूचनाओं का वृहद स्तर पर संग्रहण है। यह सूचनाएं स्ट्रक्चर्ड अनस्ट्रक्चर्ड अथवा सेमी स्ट्रक्चर्ड स्वरूप में होती हैं। बिग डाटा किसी व्यक्ति वस्तु या स्थान आदि के विषय में हो सकता है। बिग डाटा के विश्लेषण द्वारा किसी व्यक्ति के बारे में 90 प्रतिशत की सटीकता से अनुमान लगाया जा सकता है। यह डाटा किसी भी रूप में हो सकता है जैसे टेक्स्ट इमेज ऑडियो वीडियो तथा इन सभी के मिश्रित स्वरूप में। सूचना की ये विविधता किसी के बारे में जानकारी को समग्रता और सटीकता प्रदान करती है तथा यह विश्लेषण के परिणाम में प्रभावोत्पादकता उत्पन्न करता है। बिग डाटा को मूलतः 3V (Volume velocity variety) मात्रा, गति, प्रकृति के स्वरूप में विशेषित किया जाता है। डाटा के संग्रहण के लिए विभिन्न कंपनियां अलग-अलग तौर तरीकों का इस्तेमाल करती है गूगल फेसबुक तथा अमेजॉन जैसी कंपनियों के पास करोड़ों लोगों की सूचनाएं उपलब्ध हैं। गूगल जैसी कंपनी के पास लोगों की प्राचीन हैबिट तथा उनके बारे में छोटी से छोटी सूचनाओं का संग्रह है इसी प्रकार फेसबुक तथा ट्विटर जैसी कंपनियां लोगों के प्रोफाइल विवरण उनके द्वरा फॉलो किए जाने वाले ग्रुप लिखे जाने वाले पोस्ट तथा लाइक आदि के आधार पर व्यक्ति का पूरा एक खाका तैयार कर लेती हैं। यह कंपनियां आपके बारे में 90% सटीकता के साथ अनुमान लगा सकती हैं। जैसे आप कौन सी कार चलाना पसंद करते हैं? कौन सी मैगजीन या अखबार पसंद करते हैं? किस समय क्या खाना पसंद करते हैं? किस ब्रांड की विस्की पीना पसंद करते हैं? आपकी आर्थिक स्थिति क्या है? आदि आदि। यह कंपनियां डाटा के इस विशाल संग्रह को बेचकर अच्छा खासा मुनाफा कमाती हैं तथा आपका डाटा खरीदने वाली कंपनियां जैसे बैंक बीमा कंपनी ई-कॉमर्स वेबसाइट आदि इस डेटा का उपयोग करके आप तक आकर्षक उत्पाद लेकर पहुंच जाती हैं। सॉफ्टवेयर और सेवाओं के लिए वैश्विक बिग डेटा मार्केट रेवेन्यू वर्ष 2027 तक 42 बिलियन डॉलर से बढ़कर 103 बिलियन डॉलर होने की उम्मीद है। हर दिन, 2.5 क्विंटिलियन बाइट्स डेटा एकत्र किया जाता है, और पिछले‌ केवल दो वर्षों में दुनिया का 90% डेटा जेनरेट किया गया है।


बिग डाटा कैसे काम करता है?

             आज की दुनिया डेटा से संचालित होती है, और इसका हर सेकंड विश्लेषण किया जा रहा है। बिग डाटा किसी भी व्यक्ति के बारे में छोटी से छोटी जानकारियों को इकट्ठा कर उसे भिन्न-भिन्न एल्गोरिदम द्वारा एक सूचना से दूसरी सूचना की तुलना करता है उसके बीच सहसंबंध तलाशने का प्रयास करता है तथा इस आधार पर कुछ प्रत्यक्ष और अप्रत्यक्ष निष्कर्ष निकालता है। इसमें कंप्यूटर द्वारा करोड़ों सूचनाओं पर एक साथ अध्ययन किया जाता है तथा सभी संभावित सूचना सैट्स को तब तक ट्रायल किया जाता है जब तक एक निश्चित निष्कर्ष नहीं मिल जाता है। जैसे-जैसे डेटा की पीढ़ी बढ़ती है, वैसे-वैसे इसे प्रबंधित करने वाली विभिन्न तकनीकें भी बढ़ती है। जैसे-जैसे डेटा अपनी गति, पैमाने और गहराई में अधिक व्यावहारिक होता जाता है, उतना ही यह नवाचार को बढ़ावा देता है। यहां हम ६ प्रमुख बिग डेटा विश्लेषण तकनीक के तरीकों को संक्षेप में जानेंगे।
  1. ए / बी परीक्षण डेटा विश्लेषण तकनीक के इस विधि में विभिन्न प्रकार के परीक्षण समूहों के साथ एक नियंत्रण समूह की तुलना की जाती है जिससे यह पता लगाया जा सके कि कौन से उपचार या परिवर्तन कर के किसी दिए गए उद्देश्य में सुधार किया जा सकता है। बिग डेटा इस मॉडल में फिट बैठता है क्योंकि यह बड़ी संख्या में परीक्षण कर सकता है, हालांकि, यह केवल तभी प्राप्त किया जा सकता है जब समूह सार्थक अंतर हासिल करने के लिए पर्याप्त आकार के हों।
  2. डेटा विलय और डेटा एकीकरण कई स्रोतों से प्राप्त डेटा का विलय और एकीकरण करने वाली तकनीकों के प्रयोग द्वारा एक समुच्चय के संयोजन से किए गए डाटा विश्लेषण मे, डेटा के एकल स्रोत के माध्यम से विकसित डाटा‌‌ विश्लेषण की तुलना में डाटा को परखने की शक्ति (अंतर्दृष्टि) अधिक कुशल और संभावित रूप से अधिक सटीक होती है।
  3. डाटा माइनिंग यह बिग डेटा विश्लेषण के लिए उपयोग किया जाने वाला एक सामान्य उपकरण है जो डेटाबेस प्रबंधन के भीतर सांख्यिकी और मशीन लर्निंग के तरीकों को मिलाकर बिग डेटा समुच्चय से पैटर्न निकालता है। उदाहरण के लिए जब किसी ग्राहक के डेटा को यह निर्धारित करने के लिए‌ माइनिंग किया जाता है कि कौन से सेगमेंट किसी ऑफ़र पर प्रतिक्रिया करने की सबसे अधिक संभावना रखते हैं।
  4. मशीन लर्निंग आर्टिफिशियल इंटेलिजेंस के क्षेत्र में प्रसिद्ध मशीन लर्निंग का उपयोग डेटा विश्लेषण के लिए भी किया जाता है। कंप्यूटर विज्ञान से उभरकर निकली यह तकनीक डेटा के आधार पर विभिन्न धारणा बनाने के लिए कंप्यूटर एल्गोरिदम के साथ काम करती है। यह सटीक भविष्यवाणियाँ प्रदान करती है जो मानव विश्लेषकों के लिए असंभव होगी।
  5. प्राकृतिक भाषा प्रसंस्करण (NLP) यह कंप्यूटर विज्ञान की कृत्रिम बुद्धिमत्ता और भाषा विज्ञान की एक उप-विशेषता के रूप में जाना जाता है‌, तथा यह डेटा विश्लेषण उपकरण मानव भाषा का विश्लेषण करने के लिए एल्गोरिदम का उपयोग करता है।
  6. सांख्यिकी यह तकनीक सर्वेक्षणों और प्रयोगों के भीतर डेटा एकत्र करने, व्यवस्थित करने और व्याख्या करने का काम करती है।

आप अपना डाटा कैसे देते हैं?

             दरअसल "इंटरनेट आफ थिंग्स" IOT जैसी तकनीक के आ जाने के बाद बाजार में डाटा की बाढ़ आ गई है। आपको बताता चलूं कि इंटरनेट आफ थिंग्स भौतिक उपकरणों, वाहनों, घरेलू उपकरणों, और अन्य वस्तुओं का नेटवर्क होता है जो इलेक्ट्रॉनिक्स सॉफ्टवेयर सेंसर एक्चुएटर्स और कनेक्टिविटी के साथ जुड़ी होती हैं। तथा इन वस्तुओं को इंटरनेट से कनेक्ट कर उन्हें एक दूसरे के साथ डाटा एक्सचेंज के लिए सक्षम बनाती हैं। वर्तमान में जब हम कोई भी कार्य करते हैं तो उसके पीछे एक डिजिटल चिन्ह छोड़ते चलते हैं जैसे जब हम इंटरनेट का प्रयोग करते हैं तब डाटा जनरेट करते हैं जब हम अपने जीपीएस युक्त स्मार्टफोन को साथ लेकर चलते हैं तब डाटा जनरेट करते हैं अपने मित्रों से सोशल मीडिया के द्वारा कनेक्ट होते हैं या सोशल मीडिया पर पोस्ट को लाइक डिसलाइक करते हैं कमेंट करते हैं तब डाटा जनरेट करते हैं या फिर कोई खरीदारी करते हैं तब डाटा जनरेट करते हैं यहां तक कि हम अपने द्वारा घरों में उपयोग किए जाने वाले स्मार्ट उपकरणों जैसे एलेक्सा गूगल असिस्टेंट से भी बड़ी मात्रा में डाटा जनरेट करते हैं। यानी आप यह समझ लीजिए कि आपका प्रत्येक डिजिटल कार्य एक डिजिटल फुटप्रिंट बनाता हुआ चलता है और आप अपने जीवन के लगभग हर कार्य से बाजार को अपने बारे में सूचनाएं देते रहते हैं।


बिग डाटा के लाभ-

बिग डाटा के विश्लेषण द्वारा किसी भी व्यक्ति के बारे में 90 प्रतिशत तक की सटीकता का अनुमान लगाया जा सकता है अतः इसका उचित उपयोग कर न केवल प्रशासन में पारदर्शिता ही लाई जा सकती है बल्कि नीतियों के स्तर पर भी क्रांतिकारी परिवर्तन संभव है। इसके उपयोग से सरकारी काम काज को आसान बनाया जा सकता है उदाहरण के लिए इसकी सहायता से कोई सरकार नागरिकों के लिए उनकी आवश्यकताओं एवं व्यवहार के अनुरूप सुनियोजित तरीके से नीतियाँ बना सकती है। इसके अलावा बिग डेटा तकनीक यातायात नियंत्रण जैसे भीड़ प्रबंधन कर के उन्नत परिवहन आदि में भी कारगर साबित हो सकती है। साथ ही स्वास्थ्य के क्षेत्र में इसका प्रयोग किसी व्यक्ति की आनुवंशिक प्रोफाइल का खाका बनाने में किया जा सकता है जिससे डॉक्टरों द्वारा रोगी के स्वास्थ्य का और सटीकता से अनुमान लगाया जा सकेगा। शिक्षा के क्षेत्र में इसके माध्यम से छात्रों के व्यवहार को समझते हुए उनका सही मूल्यांकन किया जा सकता है जिससे छात्रों का सही दिशा में मार्गदर्शन किया जा सके। इसकी सहायता से बाज़ार में नवीनतम रोजगार आधारित विशेष कौशल को पहचानकर उसे विकसित किया जा सकता है जो शिक्षा के अतिरिक्त रोजगार को भी बढ़ावा देगा। वहीं गुड गवर्नेंस, आपदा प्रबंधन के साथ कृषि क्षेत्र में भी किया जा सकता है। उदाहरण के लिए कृषि में इसका प्रयोग कर किसान बदलते मौसम की घटनाओं या फसल में होने वाले रोगों का ध्यान रख कर यह तय कर सकते हैं की फसल को किस प्रकार के अनुकूलन की आवश्यकता है।



बिग डाटा की चुनौतियां-

             वर्तमान कंप्यूटर युग में डेटा सुरक्षा एक महत्वपूर्ण पहलू है किसी भी व्यक्ति के लिए निजी डेटा की सुरक्षा उसके सुरक्षित तथा स्वतंत्र जीवन के लिए अनिवार्य है। आज महिला व पुरुष दोनों ही डिजिटल उपकरणों का इस्तेमाल करते हैं अतः महिलाओं के लिए डेटा सुरक्षा एक गंभीर विषय है। सामाजिक लैंगिक संवेदनशीलता के आधार पर देखें तो महिलाओं की डेटा सुरक्षा पुरुषों की तुलना में कहीं अधिक महत्वपूर्ण मालूम होती है। वर्तमान समय में इंटरनेट पर व्यक्ति की सामान्य जानकारी आसानी से उपलब्ध है जिसमें किसी व्यक्ति की प्रोफाइल फोटो उसकी पहचान उसकी स्थिति उसकी उम्र आदि शामिल है ऐसे में किसी महिला से संबंधित जानकारियों के दुष्प्रयोग का खतरा बना रहता है। उदाहरण के लिए इस बात की पर्याप्त संभावना पाई जाती है कि किसी महिला के सोशल मीडिया अकाउंट से उसकी तस्वीरों को डाउनलोड करके उसे गलत प्लेटफार्म पर डालकर संबंधित महिला को ब्लैकमेल अथवा ट्रोल किया जा सकता है या उस फोटो का इस्तेमाल अपयश फैलाने के लिए भी किया जा सकता है। बिग डाटा के दुरुपयोग को लेकर कुछ मूल समस्याएं या चिंताएं सामने आती हैं जैसे डेटा की निजता, डेटा की सुरक्षा तथा डेटा के माध्यम से भेदभाव
  • डेटा की निजता जहां तक बात निजी सूचनाओं की है वर्तमान दौर में व्यक्ति की निजी सूचनाएं अब ना के बराबर रह गई हैं। अब समस्त निजी जानकारी इंटरनेट क्लाउड में एक मेमोरी में कैद हो चुकी हैं। परंतु समस्या तब शुरू होती है जब इन सूचनाओं का किसी प्रकार से दुरुपयोग होने लगता है। चुकी आपके पास इतना समय नहीं होता है कि आप किसी एप्लीकेशन को इंस्टाल करने से पहले उसके टर्म एंड कंडीशन को ठीक से पढ़ लें अतः आपको नहीं मालूम होगा की आपके मोबाइल में इंस्टॉल अधिकांश एप्लीकेशन आपकी निजी जानकारियों को स्टोर करते हैं यह अलग बात है कि किसी भी वेबसाइट या ऐप के माध्यम से व्यक्ति की गैर जानकारी में कोई निजी सूचना संग्रहित करना एक प्रकार से आपराधिक कृत्य है। अब आप समझ ही गए होंगे कि इसके लिए ठोस कानूनों का होना कितना आवश्यक है।
  • डेटा की सुरक्षा डाटा की सुरक्षा से जुड़ी चिंता एक अत्यंत महत्वपूर्ण विषय है अगर इतनी बड़ी मात्रा में समस्त समाज का डाडा किसी प्रकार के असामाजिक तत्वों जैसे उपद्रवियों आतंकवादी समूहों आदि के हाथ में आ जाता है तो वे इसका कितना भयावह दुरुपयोग कर सकते हैं इसका अंदाजा लगाना भी कठिन है। साथ ही अगर इन सूचनाओं का प्रयोग किसी खास पार्टी द्वारा सुनियोजित तरीके से चुनाव के प्रबंधन में जैसे लोगों के वैचारिक मत बदलने या समाज के मस्तिष्क से छेड़छड़ करने में किया जाने लगा तो यह संपूर्ण विश्व के लिए विनाशकारी सिद्ध होगा। यह न केवल समाज और देश को नुकसान पहुंचाएगा बल्कि इससे लोकतंत्र की हत्या हो जाएगी। अतः इन समस्याओं के प्रति पूर्व सचेत होकर एक सहमति के साथ इस पर सख्त कानून बनाने की आवश्यकता है।
  • डेटा के माध्यम से भेदभाव विभिन्न प्रकार की कंपनियां या वित्तीय संस्थान जैसे बैंक आदि जिस प्रकार बिग डेटा का उपयोग करके एक टारगेट उपभोक्ता तक अपनी पहुंच बनाते हैं ऐसे में वे लोग जिनके आर्थिक तथा सामाजिक आधार मजबूत है इन सुविधाओं का लाभ ले पाएंगे परंतु एक बड़ा वर्ग जो अपनी सामाजिक तथा आर्थिक स्थिति को लेकर तंग अवस्था में है वह इन सुविधाओं के लाभ से वंचित रह जाएगा यह डाटा के आधार पर समाज में भेदभाव को जन्म देता है जो किसी भी सभ्य समाज के लिए सही नहीं कहा जा सकता।

एक टिप्पणी भेजें

Post a Comment (0)

और नया पुराने