1 जुलाई, 2023 से प्रभावी संशोधित गोपनीयता नीति, अब विशेष रूप से बताती है कि Google अपनी सेवाओं को बेहतर बनाने और उपयोगकर्ताओं और जनता के लाभ के लिए नए उत्पादों और प्रौद्योगिकियों को विकसित करने के लिए जानकारी का उपयोग करता है। यह निर्दिष्ट करता है कि सार्वजनिक रूप से उपलब्ध जानकारी का उपयोग Google के AI मॉडल को प्रशिक्षित करने और Google अनुवाद, बार्ड और क्लाउड AI सुविधाओं जैसे विभिन्न उत्पादों और सुविधाओं को विकसित करने के लिए किया जा सकता है।
हालाँकि, नीति में यह विस्तार से नहीं बताया गया है कि Google कॉपीराइट सामग्री को प्रशिक्षण के लिए उपयोग किए जाने वाले डेटा पूल में शामिल होने से कैसे रोकेगा। कई सार्वजनिक-सामना वाली वेबसाइटों ने ऐसी नीतियां लागू की हैं जो बड़े भाषा मॉडल और अन्य एआई उपकरणों को प्रशिक्षित करने के लिए डेटा संग्रह या वेब स्क्रैपिंग पर रोक लगाती हैं। सामान्य डेटा संरक्षण विनियमन (जीडीपीआर) जैसे वैश्विक नियमों को देखते हुए Google के दृष्टिकोण का प्रभाव महत्वपूर्ण होगा जो व्यक्तियों को स्पष्ट सहमति के बिना उनके डेटा का दुरुपयोग होने से बचाता है।
ओपनएआई के जीपीटी-4 जैसे जेनरेटिव एआई सिस्टम द्वारा उपयोग किए जाने वाले प्रशिक्षण डेटा की उत्पत्ति एक विवादास्पद मुद्दा बन गई है। निर्माता तेजी से अपने प्रशिक्षण डेटा के स्रोतों को छिपा रहे हैं और कॉपीराइट किए गए कार्यों और सोशल मीडिया पोस्ट को शामिल करने के बारे में चिंताएं बढ़ा रहे हैं। इस संदर्भ में उचित उपयोग सिद्धांत की कानूनी स्थिति अस्पष्ट बनी हुई है, जिसके कारण एआई कंपनियों द्वारा प्रशिक्षण डेटा एकत्र करने और उपयोग करने के तरीके पर सख्त नियमों की मांग की जा रही है।
इसके अलावा, इतनी बड़ी मात्रा में प्रशिक्षण डेटा को संसाधित करना चुनौतियों का सामना करता है। इस डेटा की समीक्षा करने के लिए जिम्मेदार लोगों को अक्सर लंबे समय तक और कठोर कामकाजी परिस्थितियों का सामना करना पड़ता है। एआई सिस्टम में संभावित खतरनाक विफलताओं के बारे में चिंताएं हैं जो अंडर-प्रोसेसिंग के परिणामस्वरूप हो सकती हैं और हितधारकों पर इसका प्रभाव पड़ेगा।
डिजिटल विज्ञापन बाजार में Google के प्रभुत्व ने संयुक्त राज्य अमेरिका के सबसे बड़े समाचार पत्र प्रकाशक गैनेट को Google और अल्फाबेट पर मुकदमा करने के लिए प्रेरित किया है, यह दावा करते हुए कि AI प्रौद्योगिकी में प्रगति के पक्ष में एकाधिकार है। Google के AI खोज बीटा की भी आलोचना की गई है, जिसमें “साहित्यिक चोरी इंजन” होने और साइट ट्रैफ़िक को नुकसान पहुंचाने का आरोप लगाया गया है। ट्विटर और रेडिट जैसे सोशल प्लेटफ़ॉर्म, जिनमें व्यापक सार्वजनिक जानकारी शामिल है, ने अन्य कंपनियों द्वारा डेटा स्क्रैपिंग को सीमित करने के लिए कदम उठाए हैं। हालाँकि, इन परिवर्तनों ने मुख्य ट्विटर और Reddit उपयोगकर्ता अनुभवों पर उनके नकारात्मक प्रभाव के कारण उनके संबंधित समुदायों से प्रतिक्रिया व्यक्त की है।
पूछे जाने वाले प्रश्न
Q1: क्रैक्ड वेब डेटा क्या है?
A1: स्क्रैच वेब डेटा वेबसाइट स्वामी की अनुमति के बिना वेबसाइटों से एकत्र किया गया डेटा है। इस डेटा में पाठ, चित्र और अन्य प्रकार की सामग्री शामिल हो सकती है।
Q2: बार्ड को प्रशिक्षित करने के लिए Google स्क्रैप किए गए वेब डेटा का उपयोग क्यों करता है?
A2: Google बार्ड को प्रशिक्षित करने के लिए स्क्रैपिंग वेब डेटा का उपयोग करता है क्योंकि यह जानकारी का एक बड़ा और विविध डेटा सेट प्रदान करता है। इससे बार्ड को विषयों की विस्तृत श्रृंखला सीखने और अधिक रचनात्मक और जानकारीपूर्ण पाठ बनाने की अनुमति मिलती है।
अस्वीकरण: यह सामग्री किसी तीसरे पक्ष द्वारा लिखी गई थी. यहां व्यक्त किए गए विचार संबंधित लेखकों/संस्थाओं के हैं और द इकोनॉमिक टाइम्स (ईटी) के विचारों को प्रतिबिंबित नहीं करते हैं। ईटी किसी भी सामग्री की कोई वारंटी, गारंटी या समर्थन नहीं करता है और इसके लिए किसी भी तरह से जिम्मेदार नहीं है। कृपया यह सुनिश्चित करने के लिए सभी आवश्यक कदम उठाएं कि प्रदान की गई सभी जानकारी और सामग्री सटीक, वर्तमान और सत्यापित है। ईटी इसके द्वारा रिपोर्ट और इसमें शामिल सामग्री के संबंध में व्यक्त या निहित किसी भी वारंटी को अस्वीकार करता है।
#बरड #सकरप #कए #गए #वब #डट #क #सथ #Google #बरड #क #परशकषण #द #रह #ह #यह #आपक #वह #सब #कछ #मलग #ज #आप #जनन #चहत #ह