This Is How AI Voice-Cloning Tools Can Spread Misinformation on Social Media
25 जनवरी की समाचार रिपोर्ट के एक वीडियो में, राष्ट्रपति जो बिडेन टैंकों के बारे में बात करते हैं। लेकिन वीडियो के एक संपादित संस्करण ने इस सप्ताह सोशल मीडिया पर सैकड़ों हजारों व्यूज बटोरे हैं, जिससे ऐसा प्रतीत होता है कि उसने एक भाषण दिया है जो ट्रांसजेंडर लोगों पर हमला करता है।
डिजिटल फोरेंसिक विशेषज्ञों का कहना है कि वीडियो नई पीढ़ी के आर्टिफिशियल इंटेलिजेंस टूल का उपयोग करके बनाया गया था, जो किसी को भी बटन के कुछ क्लिक के साथ किसी व्यक्ति की आवाज का अनुकरण करने वाला ऑडियो जल्दी से उत्पन्न करने की अनुमति देता है। और जबकि बिडेन सोशल मीडिया पर क्लिप इस बार अधिकांश उपयोगकर्ताओं को मूर्ख बनाने में विफल रही हो सकती है, यह क्लिप दिखाती है कि अब लोगों के लिए घृणित और गलत सूचना से भरे “डीपफेक” वीडियो बनाना कितना आसान हो गया है जो वास्तविक दुनिया को नुकसान पहुंचा सकते हैं।
“इस तरह के उपकरण मूल रूप से आग में और अधिक ईंधन जोड़ने जा रहे हैं,” मिशिगन विश्वविद्यालय में इलेक्ट्रिकल और कंप्यूटर इंजीनियरिंग के एक प्रोफेसर हाफिज मलिक ने कहा, जो मल्टीमीडिया फोरेंसिक पर केंद्रित है। “राक्षस पहले से ही ढीला है।”
यह पिछले महीने एलेवेनलैब्स के वॉयस सिंथेसिस प्लेटफॉर्म के बीटा चरण के साथ आया, जिसने उपयोगकर्ताओं को कुछ मिनटों के ऑडियो नमूने अपलोड करके और किसी भी पाठ को कहने के लिए टाइप करके किसी भी व्यक्ति की आवाज का यथार्थवादी ऑडियो उत्पन्न करने की अनुमति दी।
स्टार्टअप का कहना है कि स्पीकर की आवाज और भावनाओं को संरक्षित करने के लिए फिल्मों, ऑडियोबुक और गेमिंग के लिए विभिन्न भाषाओं में ऑडियो डब करने के लिए तकनीक विकसित की गई थी।
सोशल मीडिया यूजर्स ने जल्दी से हिलेरी क्लिंटन के एआई-जेनरेट किए गए ऑडियो सैंपल को बिडेन क्लिप में दिखाए गए ट्रांसफोबिक टेक्स्ट को पढ़ने के साथ नकली ऑडियो क्लिप के साथ साझा करना शुरू कर दिया। बिल गेट्स माना जाता है कि COVID-19 वैक्सीन से एड्स होता है और अभिनेत्री एम्मा वॉटसन कथित तौर पर हिटलर का घोषणापत्र “मीन कैम्फ” पढ़ रही हैं।
कुछ ही समय बाद, इलेवनलैब्स ने ट्वीट किया कि वह “वॉइस क्लोनिंग के दुरुपयोग के मामलों की बढ़ती संख्या” देख रहा था, और घोषणा की कि अब वह दुर्व्यवहार को कम करने के लिए सुरक्षा उपायों की खोज कर रहा है। पहले कदमों में से एक यह सुविधा केवल उन्हीं लोगों के लिए उपलब्ध कराना था जो भुगतान जानकारी प्रदान करते हैं। प्रारंभ में, गुमनाम उपयोगकर्ता वॉयस क्लोनिंग टूल को मुफ्त में एक्सेस करने में सक्षम थे। कंपनी का यह भी दावा है कि अगर कोई समस्या है, तो यह किसी भी जेनरेट किए गए ऑडियो को क्रिएटर तक ट्रेस कर सकती है।
लेकिन यहां तक कि रचनाकारों को ट्रैक करने की क्षमता भी उपकरण के नुकसान को कम नहीं करेगी, कैलिफोर्निया विश्वविद्यालय, बर्कले के एक प्रोफेसर हनी फरीद ने कहा, जो डिजिटल फोरेंसिक और गलत सूचना पर ध्यान केंद्रित करता है।
“नुकसान हो गया है,” उन्होंने कहा।
एक उदाहरण के रूप में, फरीद ने कहा कि बुरे अभिनेता स्टॉक मार्केट को एक शीर्ष सीईओ के नकली ऑडियो के साथ कह सकते हैं कि मुनाफा कम है। और पहले से ही एक क्लिप चालू है यूट्यूब बिडेन ने कहा कि अमेरिका रूस के खिलाफ परमाणु हमला शुरू कर रहा है।
समान क्षमताओं वाले मुफ़्त और ओपन-सोर्स सॉफ़्टवेयर भी ऑनलाइन उभर कर सामने आए हैं, जिसका अर्थ है कि व्यावसायिक उपकरणों पर भुगतान करना कोई बाधा नहीं है। एक मुफ्त ऑनलाइन मॉडल का उपयोग करते हुए, एपी ने कुछ ही मिनटों में अभिनेता डेनियल क्रेग और जेनिफर लॉरेंस की तरह ध्वनि के लिए ऑडियो नमूने तैयार किए।
“सवाल यह है कि उंगली कहाँ उठाई जाए और जिन्न को वापस बोतल में कैसे रखा जाए?” मलिक ने कहा। “हम यह नहीं कर सकते।”
लगभग पांच साल पहले जब डीपफेक ने पहली बार सुर्खियां बटोरीं, तो उन्हें पहचानना काफी आसान था क्योंकि विषय पलक नहीं झपकाता था और ऑडियो रोबोटिक लगता था। अब ऐसा नहीं है क्योंकि उपकरण अधिक परिष्कृत हो गए हैं।
उदाहरण के लिए, ट्रांसजेंडर लोगों के बारे में अपमानजनक टिप्पणी करने वाले बिडेन के परिवर्तित वीडियो ने एआई-जेनरेट किए गए ऑडियो को राष्ट्रपति की एक वास्तविक क्लिप के साथ जोड़ा, जिसे 25 जनवरी के सीएनएन लाइव प्रसारण से लिया गया था, जिसमें यूक्रेन को अमेरिकी टैंक भेजने की घोषणा की गई थी। ऑडियो से मिलान करने के लिए वीडियो में बाइडेन के मुंह से छेड़छाड़ की गई। जबकि अधिकांश ट्विटर उपयोगकर्ताओं ने माना कि सामग्री कुछ ऐसा नहीं था जो बिडेन के कहने की संभावना थी, फिर भी वे इस बात से हैरान थे कि यह कितना यथार्थवादी दिखाई दिया। दूसरों को लगता है कि यह वास्तविक था – या कम से कम यह नहीं पता था कि क्या विश्वास करना है।
फरीद ने कहा कि हॉलीवुड स्टूडियो लंबे समय से वास्तविकता को विकृत करने में सक्षम हैं, लेकिन निहितार्थों पर विचार किए बिना उस तकनीक तक पहुंच का लोकतांत्रीकरण किया गया है।
फरीद ने कहा, “यह बहुत, बहुत शक्तिशाली एआई-आधारित तकनीक, उपयोग में आसानी और फिर तथ्य यह है कि मॉडल ऐसा लगता है: आइए इसे इंटरनेट पर डालते हैं और देखते हैं कि आगे क्या होता है।”
ऑडियो सिर्फ एक ऐसा क्षेत्र है जहां एआई-जनित गलत सूचना खतरा पैदा करती है।
नि: शुल्क ऑनलाइन एआई छवि जनरेटर जैसे मध्य यात्रा और दाल-ई एक साधारण टेक्स्ट प्रांप्ट के साथ लीगेसी मीडिया आउटलेट्स की शैली में युद्ध और प्राकृतिक आपदाओं की फोटोरिअलिस्टिक छवियों को मंथन कर सकता है। पिछले महीने, अमेरिका में कुछ स्कूल डिस्ट्रिक्ट्स ने ब्लॉक करना शुरू किया चैटजीपीटीजो पठनीय पाठ – जैसे छात्र टर्म पेपर – मांग पर तैयार कर सकता है।
इलेवनलैब्स ने टिप्पणी के अनुरोध का जवाब नहीं दिया।