ad1

Thursday, 9 January 2025

डेटा मायनिंग : सोन्यासारखा डेटा!

डेटा मायनिंग 
डेटा मायनिंग 

'डेटा मधून माहिती मिळते. माहितीतून ज्ञान मिळतं.  या ज्ञानाचा व्यवसाय वाढीसाठी खूप उपयोग होतो. म्हणून 
'डेटा' खूप महत्वाचा असतो.

डिजिटलच्या आभासी विश्वात वावरतांना कळत न कळत आपल्याशी संबंधित मौल्यवान डेटा आपण कसा इतरांना सामायिक करत जातो, हे स्वतःला कळत सुद्धा नाही.   गुगल, फेसबुक, इंस्टाग्राम सारखी समाज माध्यमामध्ये लॉग-इन करण्यासाठी आपल्याला इमेल ऍड्रेस, पासवर्ड किंवा मोबाईल नंबर द्यावा लागतो. एखादं ऍप्प डाउनलोड करतांना आपल्याला इमेल, यूजरनेम, पासवर्ड किंवा मोबाईल नंबर विचारल्या जातो. टर्म्स अँड कंडिशन्स वाचण्या इतका वेळ आपल्याकडे नसतोच.  लगेच क्लिक करुन त्यांना आपली सहमती देतो.  मुळात असं करत असतांना आपण आपला मौल्यवान डेटा गुगल आणि इतर ऍप्पला सामायिक करत असतो.  एव्हडंच नव्हे तर मॉलमध्ये शॉपिंग करतांना, ऑनलाईन शॉपिंग करतांना, रेल्वे/हवाई तिकीट, मुव्ही तिकिट, झोमॅटो-स्विगी, इन्शुरन्स, बँकेचे हप्ते भरताना, शाळेत, आरटीओ, विविध खाजगी शासकीय कार्यालयात आपण आपली माहिती देत असतो. हि माहिती कधी ऑनलाईन तर कधी ऑफलाईन असते. समाजमाध्यमावर  जेंव्हा आपण काही मजकूर टाईप करतो, पोस्ट, आपल्या आवाजातील ऑडिओ-व्हिडीओ अपलोड करतो, कमेंट, लाईक, फॉलो करतो तेंव्हा तो सुद्धा 'डेटा' म्हणून सेव्ह केल्या जात असतो. ऍमेझॉन, फ्लिपकार्ट सारख्या साईटवरं शॉपिंग करतांना आपल्याला आवडणारे पॅटर्न, लावलेले फिल्टर, डिजाईन, किंमत सारखा सर्चसुद्धा डेटा म्हणूनच गुगलवर सेव्ह होत असतो.

गोल्ड मायनिंग सर्वांना माहित आहे. सोन्याची खाण. जमिनीत खोल खणून त्या दगडमातीच्या खानीतून सोनं हे मौल्यवान धातू वेगळा करणे यालाच 'गोल्ड मायनिंग' म्हणतात. डिजिटल क्षेत्रात जमा केलेल्या प्रचंड डेटामधून 'सोन्या'सारखी अत्यन्त उपयुक्त माहिती शोधून काढली जाते, या प्रक्रियेलाच 'डेटा मायनिंग' म्हणतात. जमिनीतून थोडं सोनं काढण्यासाठी हजारो टन माती खनावी लागते. अशुद्ध धातूवर प्रक्रिया करुन 'शुद्ध सोनं' हाती लागतं. त्याचं प्रमाणे इंटरनेटवर जमा झालेल्या ग्राहकांच्या भरपूर डेटा (बिग डेटा) मधून कपन्या त्यांना उपयुक्त अशी नेमकी महत्वाची उपयुक्त माहिती मिळवत असतात. 

डाटा मायनिंग हा शब्द अलीकडे काही वर्षांपासून प्रचलित झाला असला तरी त्याची सुरुवात १९९० मध्ये झाली होती. पूर्वी सर्व उद्योग व्यवहार ऑफलाईन होते. मिळणारा डाटा खुपचं कमी होता. तो डेटा मिळवून त्यातून माहिती वेगळी करण्याचे काम सोपे नव्हते.  मागील काही वर्षात इंटरनेट आणि ऑनलाईन शॉपिंगमध्ये प्रचंड वाढ झाली. त्यामुळे 'डाटा मायनिंग' ला खुपचं महत्व प्राप्त झाले. विविध क्षेत्रात डाटा मायनिंग होत असली तरी हा प्रकार समजण्यासाठी या लेखामध्ये आपण प्रथम 'ऑफ लाईन' शॉपिंगमध्ये डाटा मायनिंग कशी होते याचं उदाहरनं बघणार आहोत.

एक शु मार्ट रिटेलर दुकानात येणाऱ्या सर्व ग्राहकांचा स्वीस्तर 'डाटा' जमा करतो. ग्राहक येण्याच्या वेळा, ग्राहकांच वय, मोबाईल नंबर, ग्राहक गर्दीचा वार, शुज घेणारे किती, चप्पल घेणारे किती, सपोर्ट शु खरेदी करणारे किती, लेसशुवाले किती, शुसोबत सॉक्स घेणारे किती, कोणत्या रंगाचे, कोणत्या नंबरचे, कोणत्या ब्रँडचे, किती किमतीचे, कोणत्या स्टाईलचे, आवडता रंग, नावडता रंग, किमतीसाठी घासघीस करणारा वर्ग कोणता ? वगैरे. हा एकूण डाटा निश्चितच खूप मोठा असणार.  पण या 'बिग डाटा' मधून अनावश्यक डाटा वेगळा करुन  दुकानदाराला उपयुक्त अशी माहिती मिळू शकेल.  जसेकी - दुकानात कोणत्या नंबरचे शूज, चप्पल जास्त विकले जातात. ग्राहकांचा खरेदीचा पॅटर्न कसा, शूजसोबत सॉक्स घेणारे कोण, स्पोर्ट शुज घेणारा वर्ग कोणता, कोणता नंबरचे शूज लवकर विकल्या जाईल, इत्यादी. दुकानदाराला या डेटाचा खूप फायदा होतो.   स्टॉक ठेवतांना, जाहिरात करतांना, नवीन आउटलेट उघडतांना  किंवा एकंदरीत व्यवसाय वाढीसाठी या माहितीचा उपयोग होतो. मॉलमध्ये शॉपिंग करतांनासुद्धा 'मार्केट बास्केट ऐनालिसीस' वरून मॉलमध्ये येणाऱ्या ग्राहकांचा पॅटर्न, आवड-निवड, एखाद्या वस्तूसोबत नेहमी विकली जाणारी इतर वस्तू अशी माहिती मिळत असते. हि झाली 'ऑफलाईन' व्यवसायातील डाटा मायनिंग. 

ऑनलाईन शॉपिंगमध्ये सुद्धा असंच घडतं. ऑनलाईन शॉपिंगची माहिती सर्च डेटा म्हणून सर्व्हरमध्ये जमा होत असते.  कृत्रिम बुद्धिमत्त्ता आणि मशीन लर्निंग अलगोरिदम मूळे आपण लावलेल्या फिल्टरनुसार आपल्याला हव्या असलेल्या पॅटर्न, डिजाईन, स्टाईलच्या वस्तू समोर उपलब्ध दिसतात. आपल्या खरेदी किंवा सर्चचा पॅटर्न बघून मशीन लर्निंग आपल्याला आवडणारी नेमकी वस्तू आपल्या समोर स्क्रीनवर दाखवते.   आपला डेटा एका वेअरहाऊस (गोडावून) मध्ये सेव्ह असतो. विविध सॉफ्टवेअरचा उपयोग करुन अनावश्यक डेटा वेगळा करुन त्यातून उपयुक्त माहिती मिळविली जाते. हजारो टन मातीतून सोनं मिळविण्यासारखी! हा डेटा तक्ते, एक्सेल टेबल किंवा आलेख स्वरूपात साठविला जातो. या डेटा मधून कंपन्याना ग्राहकांच्या खरेदी पॅटर्नची माहिती आकडे स्वरूपात मिळून उद्योग वाढीसाठी त्याची मदत होते.  पुढे उद्योगाच नियोजन करतांना उत्पादन नियंत्रित करने, जाहिरातीची दिशा ठरवने, नेमका ग्राहकवर्ग कोणता हे ठरवणे याची संपूर्ण माहिती कंपन्याना मिळत असते. ऑनलाईन शॉपिंग, रिटेल व्यवसाय करणारे मॉल्स, बँकिंग व विमा क्षेत्रातील कंपन्या, रेस्टॉरंटस, फार्मा उद्योजक, टेलिकॉम क्षेत्रातील कंपन्या इत्यादी डेटा मायनिंगचा उपयोग करुन कृत्रिम बुद्धीमत्तेच्या मदतीने ग्राहकांना 'ऑफर्स' देत असतात.

डाटा मायनिंगचे काही उदाहरनं 

लोन घेतलेल्या व्यक्तीचा पूर्व इतिहास तपासून बँका त्यांना नवनवीन लोनचे ऑफर्स देत असतात. कर्जाचे हप्ते नियमित चुकविणारे ग्राहक त्यांना हवे असतात. अशा विश्वासू कर्जदाराचा डेटा त्यांच्याकडे उपलब्ध असतो. क्रेडिट कार्ड फ्रॉडचा छडा लावण्यासाठी डेटा मायनिंगचा उपयोग होतो. क्रेडिट कार्डद्वारे झालेल्या शांसक आणि अनियमित व्यवहारावरून फ्रॉड व्यवहार शोधल्या जातात.

रेस्टॉरंटमध्ये येणाऱ्या ग्राहकांच्या आवडी निवडीचा डेटा तपासून मालकाला कोणत्या डिशेशला जास्त मागणी आहे हे सहज समजतं. 

डेटा मायनिंग कसं काम करतं? 
बिग डेटामधून नेमकी माहिती बाहेर काढण्यासाठी डेटावर बरीच प्रक्रिया घडत असते. प्रथम प्रचंड डेटामधून अनावश्यक, डुप्लिकेट, अयोग्य डेटा वेगळा केला जातो. त्याला डेटा क्लिनिंग म्हणतात. 
वेगळ्या केलेला डेटाचं एकत्रिकरण करण्यासाठी तो डेटा इंटिग्रेशन प्रक्रियेतून जातो.  डेटा रीडक्शन स्टेजमध्ये डेटा कमी करून त्याची गुणवत्ता वाढविली जाते. डेटा कमी जागेत साठविण्या योग्य होतो.  शेवटी छोट्या डेटाच माहितीत रूपांतर होतं, या स्टेजला डेटा ट्रान्सफॉर्मेशन असं म्हणतात. शेवटी शोधणाऱ्याला 
त्याच्या संबंधित माहिती दर्शविली जाते. 

डेटा मायनिंग फक्त ऑनलाईन ऑफलाईन शॉपिंगपुरती मर्यादित नसून शिक्षण, वैद्यकीय, फ्रॉड डिटेक्शन, लाय डिटेक्शन आणि मार्केट बास्केट ऐनालिसीसमध्ये सुद्धा डेटा मायनिंगचा उपयोग होत असतो. 

थोडक्यात, समाजमाध्यमावर माहिती शोधताना  लक्षात ठेवायला पाहिजे कि आपली सर्व माहिती डेटा म्हणून आपण इंटरनेटवर जमा होत असते आणि त्याचं माहितीचा उपयोग करुन आपल्याला शॉपिंगच्या मायाजाळ्यात अडकविण्यासाठी होणार असतो. किंबहुना 'बीट बाय बीट' आपलं एकूण व्यक्तिमत्वचं उघड पडतं जातं. याचे फायदे आणि तोटे सुद्धा. नेहमीच माहितीचा उपयोग होतो असं नाही तर दुरुपयोगसुद्धा. 

'कर्ज देण्यासाठी'  ज्या बँका उत्सुकतेने वारंवार कॉल करत असतात त्यांच्याकडे आपल्या बँकांची नियमित हप्ते चुकविण्याचा रेकॉर्ड असतो. समाज माध्यमावर काम करतांना स्क्रीनच्या अगदी खाली ज्या वस्तूच्या छोटया जाहिराती दिसत असतात त्या कधी तरी आपण इंटरनेटवर शोधलेल्या असतात.  नेटफ्लिक्स, ऍमेझॉनसारख्या ओटीटी वर सिरीयल शोधताना आपल्याला पाहिजे त्याच प्रकारच्या सिरीजची नावे स्क्रीनवर समोर येतात. युट्युब चालू केलं असता आवडणार अशीच गाण्याची लिस्ट समोर वाढली जाते. किंवा फेसबुक इंस्टावर आपल्याला आवडणार अशीच पोस्ट समोर दिसते. हे कसं शक्य आहे?  ह्या सर्व गोष्टी आर्टिफिशियल इंटलीजन्समूळे घडत असतात. अर्थात त्यासाठी लागणारा डेटा हा 'डेटा मायनिंग' द्वारे मिळविला जातो.

तेंव्हा कृपया लक्षात ठेवा - जेंव्हा आपण गुगलवर माहिती शोधत असतो तेंव्हा आपली माहिती(डेटा) आपण गुगलला सामायिक करत असतो.  सो बी केअरफुल्ल अँड हैप्पी शॉपिंग नेक्स्ट टाईम!

© प्रेम जैस्वाल (पेडगावकर)
     ह. मु. छ संभाजीनगर 
    मो. ९८२२१०८७७५






No comments:

Post a Comment