चैटजीपीटी द्वारा संग्रहीत डेटा की खोज: एआई कन्वर्सेशनल मॉडल में एक गहन जानकारी
चैटबॉट्स हमारी डिजिटल दुनिया का एक अभिन्न अंग बन गए हैं, और जीपीटी-संचालित चैटबॉट्स, विशेष रूप से चैटजीपीटी, भीड़ के बीच खड़े रहते हैं। OpenAI द्वारा विकसित, ChatGPT उपयोगकर्ताओं की पूछताछ के जवाब तैयार करता है और बातचीत की बारीकियों को आसानी से संभालता है। अनौपचारिक बातचीत को संभालने की मॉडल की असाधारण क्षमता व्यापक प्रशिक्षण डेटा के कारण है। हालाँकि, एक सामान्य प्रश्न उपयोगकर्ताओं के बीच कई चिंताएँ पैदा करता है: “चैटजीपीटी कौन सा डेटा संग्रहीत करता है?”
विवरण में जाने से पहले, यह समझना महत्वपूर्ण है कि चैटजीपीटी डेटा की दो श्रेणियों का उपयोग करता है: पूर्व-प्रशिक्षण डेटा और फाइन-ट्यूनिंग डेटा। दोनों एआई मॉडल के प्रदर्शन में महत्वपूर्ण भूमिका निभाते हैं।
पूर्व-प्रशिक्षण के दौरान, ChatGPT विभिन्न प्रकार के इंटरनेट टेक्स्ट से सीखता है। इस चरण का उद्देश्य मॉडल को भाषा के उपयोग, व्याकरण के नियमों, सामान्य ज्ञान, तर्क क्षमताओं और कुछ विश्वास प्रवृत्तियों की व्यापक समझ हासिल करने में मदद करना है। हालाँकि, इसका मतलब यह नहीं है कि मॉडल को विशेष जानकारी है कि कौन से दस्तावेज़ उसके प्रशिक्षण सेट का हिस्सा थे या किसी गोपनीय, मालिकाना या वर्गीकृत जानकारी तक उसकी पहुँच है। ऐसे विवरणों तक पहुंच पूरी तरह से चैटजीपीटी के दायरे से परे है। इसलिए, मॉडल इस चरण से डेटा को इस तरह से ‘स्टोर’ नहीं करता है कि वह डेटा स्रोतों के बारे में विस्तृत जानकारी पुनर्प्राप्त या प्रकट कर सके।
फाइन-ट्यूनिंग चरण अधिक नियंत्रित होता है, जहां ओपनएआई द्वारा तैयार किए गए डेटासेट का उपयोग करके चैटजीपीटी के व्यवहार को परिष्कृत किया जाता है। इन डेटासेट में विशिष्ट दिशानिर्देशों के आधार पर सावधानीपूर्वक संकलित संवाद शामिल होते हैं। मॉडल में इन संवाद प्रतिकृतियों के दौरान साझा की गई किसी भी व्यक्तिगत जानकारी को याद करने या संग्रहीत करने की क्षमता नहीं है।
अब, उपयोगकर्ता इंटरैक्शन के दौरान ChatGPT कौन सा डेटा संग्रहीत करता है, इस प्रश्न पर वापस आते हुए, OpenAI की एक सख्त गोपनीयता नीति है। इस नीति के अनुसार, AI मॉडल पिछले उपयोगकर्ता इंटरैक्शन में साझा किए गए व्यक्तिगत डेटा को पुनर्प्राप्त या याद नहीं रखता है। उपयोगकर्ता का विश्वास बनाए रखना और उनकी गोपनीयता बनाए रखना OpenAI के मिशन का अभिन्न अंग है।
जब आप ChatGPT के साथ जुड़ते हैं, तो मॉडल प्रत्येक वार्तालाप को अनिवार्य रूप से एक खाली स्लेट के साथ शुरू करता है, जिसमें पिछले उपयोगकर्ता एक्सचेंजों की कोई स्मृति नहीं होती है। यह व्यक्तिगत डेटा तक पहुंचने या संग्रहीत करने में असमर्थ है जब तक कि इसे किसी विशेष वार्तालाप में स्पष्ट रूप से साझा नहीं किया जाता है। हालाँकि, एक ही चर्चा के भीतर भी, मॉडल भविष्य की बातचीत में साझा जानकारी का उपयोग नहीं करता है या इसे दीर्घकालिक उपयोग के लिए संग्रहीत नहीं करता है।
इस दृष्टिकोण का व्यावहारिक रूप से मतलब यह है कि ChatGPT आपके चैट डेटा को भविष्य के संदर्भ के लिए संग्रहीत नहीं करता है या अपने संचालन को बेहतर बनाने के लिए इसका उपयोग नहीं करता है।
यह भी उल्लेखनीय है कि मार्च 2022 तक, OpenAI 30 दिनों की अवधि के लिए इंटरैक्शन डेटा (साझा किए गए व्यक्तिगत डेटा सहित) को बरकरार रखता है। हालाँकि, उन्होंने इस बात पर भी ज़ोर दिया है कि इस डेटा का उपयोग चैटजीपीटी के प्रदर्शन को बेहतर बनाने के लिए नहीं किया जाता है।
गोपनीयता और सुरक्षा के संदर्भ में, OpenAI उद्योग-मानक तकनीकी उपायों का उपयोग करता है और उपयोगकर्ता डेटा की सुरक्षा और गोपनीयता बनाए रखने के लिए उचित कानूनी सुरक्षा उपाय करता है।
संक्षेप में, चैटजीपीटी हैंडल का डेटा काफी हद तक भाषा पैटर्न सीखने के इर्द-गिर्द घूमता है और इसमें उपयोगकर्ता-विशिष्ट डेटा को संग्रहीत करना या याद करना शामिल नहीं है। हालांकि यह बुद्धिमान प्रतिक्रियाएं उत्पन्न करने के लिए इंटरैक्शन के दौरान लगातार नए डेटा का उपयोग करता है, लेकिन ओपनएआई की मजबूत गोपनीयता प्रतिबद्धताओं के सौजन्य से, यह इस डेटा को बरकरार नहीं रखता है या अनुचित तरीके से उपयोग नहीं करता है। यह मान लेना एक पौराणिक कथा है कि चैटजीपीटी के साथ आपकी बातचीत को बाहर निकाला जा सकता है और उसकी समीक्षा की जा सकती है – बॉट के पास एक सत्र से अधिक आपकी बातचीत की स्मृति नहीं होती है, जो इसे एक सुरक्षित, निजी और विश्वसनीय एआई टूल बनाती है!
उपयोगकर्ताओं की गोपनीयता संबंधी चिंताओं को सबसे आगे रखकर, ओपनएआई का चैटजीपीटी न केवल प्राकृतिक भाषा प्रसंस्करण प्रौद्योगिकी में नई जमीन तैयार कर रहा है, बल्कि लगातार विकसित हो रहे एआई परिदृश्य में उपयोगकर्ता डेटा की सुरक्षा के लिए नए, सख्त मानदंड भी स्थापित कर रहा है। निर्णायक रूप से, चैटजीपीटी कोई डेटा संग्रहीत नहीं करता है जो उसके उपयोगकर्ताओं की गोपनीयता या सुरक्षा को खतरे में डाल सकता है, जिससे यह एआई मॉडल पर भरोसा करने और उपयोग करने लायक बन जाता है।