Hindi Auto-Captioning Launched for YouTube: YouTube ने हिंदी वीडियो के लिए स्वचालित कैप्शन को रोल आउट करना शुरू कर दिया है, 2010 में इस सुविधा के लॉन्च होने के बाद से इसके वाक् पहचान-सहायता प्राप्त उपशीर्षक का विस्तार काफी विलंबित है। स्वचालित उपशीर्षक उन दर्शकों के लिए लाखों हिंदी भाषा के वीडियो खोल सकते हैं जो सुनने में अक्षम हैं।
हिंदी वीडियो को स्वचालित रूप से कैप्शन
मंच पर वीडियो पर हिंदी उपशीर्षक उपलब्ध हैं जहां रचनाकारों ने विशेष रूप से उन्हें जोड़ने के लिए चुना है; लेकिन यूट्यूब ने हिंदी वीडियो को स्वचालित रूप से कैप्शन
है। चूंकि YouTube पर रचनाकारों को पेशेवर रूप से बनाए गए और समयबद्ध उपशीर्षक के लिए भुगतान करना पड़ता है, इसलिए कई लोग उन्हें कमीशन नहीं देते हैं।
हिंदी ऑटो-कैप्शनिंग को शामिल करना
यह स्पष्ट नहीं है कि सटीक हिंदी कैप्शनिंग कब उपलब्ध होनी शुरू हुई। सर्च दिग्गज द्वारा Google Translate और अन्य उत्पादों पर हिंदी का ट्रांसक्रिप्शन उपलब्ध है। लेकिन हिंदी वीडियो के लिए व्यापक रूप से उपलब्ध सुविधा के रूप में हिंदी ऑटो-कैप्शनिंग को शामिल करना एक संकेत है कि अब हिंदी भाषण पर पर्याप्त डेटा एकत्र और संसाधित किया गया है कि Google को लगता है कि यह भाषा के अधिकांश वीडियो पर पर्याप्त सटीकता प्रदान कर सकता है। विस्तार से, इसका मतलब है कि भारतीय भाषाओं पर भाषा डेटा उपलब्धता का विस्तार हो रहा है।
भाषाओं से जुड़ी समस्याओं के समाधान पर काम करता है
जनरेटिव आर्टिफिशियल इंटेलिजेंस बूम से काफी पहले, यूट्यूब जैसी कंपनियां एक्सेसिबिलिटी उद्देश्यों के लिए आवाज पहचान का उपयोग कर रही हैं। लेकिन उन भाषाओं के लिए यह कहना आसान है, जिनका ऑनलाइन प्रतिनिधित्व बहुत अधिक नहीं है। रेवेरी के एक वरिष्ठ कार्यकारी मयूरेश निरहाली कहते हैं, “भाषण से पाठ की समस्या में, आपको हिंदी में बहुत सारे भाषण और एक संबंधित सही प्रतिलेख की आवश्यकता होती है, जिसे [एआई] मॉडल को खिलाया जाता है जो इस डेटा को देखकर सीखते हैं।” उन्होंने कहा, इंटरनेट पर भारतीय भाषाओं से जुड़ी समस्याओं के समाधान पर काम करता है।
भारतीय भाषाओं के लिए वाक् पहचान Hindi Auto-Captioning Launched for YouTube
श्री निरहाली ने कहा कि भारतीय भाषाओं के लिए वाक् पहचान जैसी एआई-सक्षम सेवाओं को विकसित करना कई मूलभूत चुनौतियों के कारण विशेष रूप से कठिन है, जिसमें ऑनलाइन पाठ की असंगत एन्कोडिंग के साथ-साथ वर्तनी और उच्चारण में क्षेत्रीय विविधताएं भी शामिल हैं। अब जबकि अधिक डेटा उपलब्ध होता दिख रहा है – कम से कम बड़ी तकनीकी कंपनियों के लिए – स्थिति में सुधार हो रहा है। यूट्यूब के प्रवक्ता ने हिंदी में ऑटो-कैप्शनिंग के लॉन्च पर पूछे गए सवालों का जवाब नहीं दिया।
शब्दों के ब्लॉक के रूप में दिखाई देते हैं
संयुक्त राज्य अमेरिका जैसे देशों में टेलीविजन दर्शकों के लिए बंद कैप्शनिंग की शैली की नकल करते हुए, जहां यह छोटी स्क्रीन के लिए अनिवार्य है, यूट्यूब के कैप्शन थोड़े विराम चिह्नों के साथ, जब भी बोले जाते हैं, शब्दों के ब्लॉक के रूप में दिखाई देते हैं। जबकि समाचार प्रसारण के लिए कैप्शन आम तौर पर पेशेवर टीवी चैनलों के लिए वास्तविक समय में बनाए जाते हैं, एआई-सक्षम भाषण पहचान स्वचालित कैप्शनिंग को अधिक सटीक रूप से समयबद्ध करने की अनुमति देती है, जिससे दर्शकों को भाषण के ठहराव और अन्य संकेत लेने की अनुमति मिलती है।
ऑटो-जेनरेटेड अंग्रेजी कैप्शन Hindi Auto-Captioning Launched for YouTube
लेकिन सटीकता और गुणवत्ता के मुद्दे बने रहते हैं। यहां तक कि ऑटो-जेनरेटेड अंग्रेजी कैप्शन में भी, जिसके लिए यूट्यूब एक दशक से अधिक समय से अपनी तकनीक में सुधार कर रहा है, गलतियां आम हैं, और कई शब्द अक्सर गलत तरीके से लिखे जाते हैं। हिंदी कैप्शन भी अलग नहीं हैं। कई पंक्तियाँ जो वक्ताओं द्वारा व्यक्त नहीं की जाती हैं, यहाँ तक कि स्टैंड-अप कॉमेडी वीडियो जैसे एकल-स्पीकर संदर्भों में भी, बस छोड़ दी जाती हैं, जबकि अन्य शब्दों को समान-ध्वनि वाले शब्दों द्वारा प्रतिलेखित किया जाता है।
आपत्तिजनक शब्दों और अपशब्दों को डिफ़ॉल्ट रूप से सेंसर
YouTube ने कई वर्षों से स्वचालित कैप्शनिंग में आपत्तिजनक शब्दों और अपशब्दों को डिफ़ॉल्ट रूप से सेंसर कर दिया है। उदाहरण के लिए, जब अंग्रेजी में किसी निषिद्ध शब्द या शब्द का उपयोग किया जाता है, तो YouTube उसे वर्गाकार कोष्ठक ([_]) में अंडरस्कोर के रूप में लिख देता है। हिंदी में अभी तक ऐसा नहीं लगता है, और अपशब्द समान ध्वनि वाले शब्दों के रूप में दिखाई देते हैं।
केवल हिंदी वाक्यों में अंग्रेजी शब्दों को ‘अस्वीकृत’
हिंदी भाषण पहचान के लिए एक बड़ी चुनौती रोजमर्रा के भाषण में अंग्रेजी का सामान्य उपयोग रहा है। फिलहाल, यूट्यूब केवल हिंदी वाक्यों में अंग्रेजी शब्दों को ‘अस्वीकृत’ कर रहा है, उन्हें अंग्रेजी लिपि में स्विच किए बिना प्रदर्शित कर रहा है, जबकि केवल अंग्रेजी वाक्यों को पूरी तरह से छोड़ रहा है। श्री निरहाली ने कहा, “एआई मॉडल (भाषण और पाठ के लिए) बनाने वाले किसी भी व्यक्ति से अपेक्षा यह है कि इसमें अधिक बोलचाल और यथार्थवादी जमीनी डेटा शामिल किया जाए, ताकि मॉडल भाषाओं के मिश्रण की बारीकियों को सीख सके।”
अनुवादों से भिन्न अनुवाद या प्रतिलेखन होंगे
उन्होंने कहा, “भाषाएं ऐसी होती हैं, उनका प्रसार इतना व्यापक होता है कि आपके पास हमेशा मॉडलों द्वारा समझे गए अनुवादों से भिन्न अनुवाद या प्रतिलेखन होंगे।” “ऐसी कोई रेखा नहीं है जिसे आप खींचकर कह सकें, ‘बस, मेरा काम हो गया’।”
READ ALSO: Lifestyle news। जानिए PCOS ke लक्षण
READ ALSO: Randeep Hooda-Lin Laishram Marriage: शादी से पहले पहुंचे मणिपुर मंदिर रणदीप हुड्डा और लिन