Sunday, July 8, 2012

श्रुतलेखन राजभाषा सॉफ़्टवेयर समीक्षा --रवि रतलामी द्वारा -- संघर्षके बाद सफलता


FINALLY SUCCESS ON 27-07-2012 
आज सीडैक से सपोर्ट पर्सन द्वारा विंडोज की कुछ अतिरिक्त सेटिंग करवाई गई और अंततः यह श्रुतलेखन राजभाषा चल निकला. मेरे स्वयं के केस में यह बोले जा रहे वाक्यों को 95-98 प्रतिशत तक शुद्धता से टाइप करता है.

अतिरिक्त विवरण व सॉफ़्टवेयर की संक्षिप्त समीक्षा यहाँ दर्ज है -


 श्रुतलेखन राजभाषा सॉफ़्टवेयर : (उनकी ब्लॉग साइट छींटें और बौछारें से)



हिंदी के एकमात्र व्यावसायिक और व्यावहारिक रूप से सफल स्पीच टू टैक्स्ट प्रोग्राम (हिंदी वार्ता से पाठ अनुप्रयोग) श्रुतलेखन - राजभाषा के बारे में सर्वप्रथम एक छोटी सी समीक्षा कथाकार सूरज प्रकाश ने 2008 में यहाँ लिखी थी. तब उक्त प्रोग्राम के आउटपुट की शुद्धता का प्रतिशत कोई 80 प्रतिशत था, जो कई मामलों में व्यावहारिक नहीं था.
एक वर्कशॉप में अभी हाल ही में मेरी मुलाकात अहमदाबाद के श्री जवाहर कर्नावट से हुई. उन्होंने बताया कि श्रुतलेखन - राजभाषा का नया संस्करण कोई 90 प्रतिशत शुद्धता के साथ आउटपुट देता है. और वे तथा उनके बहुत से साथी इस प्रोग्राम का प्रयोग बहुतायत से कर रहे हैं. इस बात से उत्साहित होकर  मैंने इस प्रोग्राम को खरीदने के लिए इंटरनेट में खोजबीन की तो निराशा हाथ लगी. कहीं कोई कड़ी नहीं, कोई लिंक नहीं और न ही उक्त उत्पाद को खरीदने बेचने के बारे में कुछ भी जानकारी या समीक्षा नहीं.
अंततः श्री जवाहर कर्नावट ने  सीडैक के श्री दीपक मोतीरमानी का ईमेल भेजा जो श्रुतलेखन की मार्केटिंग देखते हैं. यदि आपको यह सॉफ़्टवेयर चाहिए तो दीपक मोतीरमानी सेdeepakm@cdac.in पर संपर्क कर सकते हैं. यदि फोन से संपर्क करना चाहें तो उनके डेस्क का डायरेक्ट नंबर है -  020 - 25503396.

दीपक ने मुझे श्रुतलेखन का एक ब्रोशर भी भेजा है.  जो निम्न है:

 श्रुतलेखन-राजभाषा एक हिंदी स्पीकर-इनडिपेंडेंट हिंदी स्पीच रिकग्निशन सिस्टम है जो स्पीच (वाक्) टैक्नॉलाजी के क्षेत्र में मील का पत्थर है। स्पीच रिकग्निशन टैक्नॉलाजी की वज़ह से मशीनों के लिए मानव भाषा समझना साध्य हो गया है और यह हिंदी में आउटपुट देता है। श्रुतलेखन-राजभाषा को मंत्र-राजभाषा (मशीन साधित अनुवाद) सिस्टम के एक अंश के रूप में एकीकृत किया गया है। यह बोली गई भाषा को डिज़िटाईज़ करके इनपुट के रूप में लेता हैं और आउटपुट एक स्ट्रीम ऑफ़ टेक्स्ट के रूप में प्राप्त होता है। लैंग्वेज मॉड्यूल में मौजूद व्याकरण की सहायता से रिकग्नाईज़र स्पीच रिकग्निशन को बेहतर बनाता है। लैंग्वेज मॉड्यूल में शब्दावली और वाक्य संरचना स्टोर किया गया है।
प्रयोगकर्ता माईक्रोफ़ोन के ज़रिए सिस्टम के साथ संपर्क रखता है। स्पीच प्रोसेसिंग के लिए रिकग्नाईज़र एनलॉग सिग्नल को डिज़िटल सिग्नल में रूपांतरित करता है। प्रोसेसिंग के पश्चात एक स्ट्रीम ऑफ़ टेक्स्ट जनरैट किया जाता है।
मुख्य विशेषताएँ
र्‍ यह हिंदी यूनीकोड में आउटपुट देता है जो कि पूरे विश्व में प्रचलित है
र्‍ यूनीकोड टैक्सट को ISFOC में रूपान्तरित करने की सुविधा
र्‍ यूनीकोड हिंदी में प्रचलित की-बोर्ड टंकण की सुविधा
र्‍ अनडू, रीडू, कट, कॉपी, पेस्ट, सेलेक्ट ऑल, फ़ाईंड एण्ड रिप्लेस की सुविधा
र्‍ हिंदी देवनागरी आउटपुट का संख्याओं (अंक, दशमलव), तारीख और मुद्राओं में रूपान्तरण
‍ र्‍ द्विभाषीय हिंदी अंग्रेजी टंकण और एडिटिंग की सुविधा, शब्द संशोधन की सुविधा 
र्‍ एम एस वर्ड, एम एस पेंट, एम एस एक्सेल तथा नोटपैड के लिए सिस्टम प्लग-इन की सुविधा
र्‍ टाइपिंग के लिए इंस्क्रिप्ट, रेमिंग्टन, एवं फोनेटिक कुंजीपटल की सुविधा
सिस्टम की आवश्यकताएँ
र्‍ विंडोज़ २००० / विंडोज़ XP ऑपरेटिंग सिस्टम / विंडोज़ विस्टा
र्‍ ऑपरेटिंग सिस्टम "लैंग्वेज सैटिंग" विकल्पों में "इंडिक" इनेबल्ड हो
र्‍ माइक्रोफ़ोन
 ब्रोशर के मुताबिक सॉफ़्टवेयर में उपलब्ध सुविधाएं बेहद काम की प्रतीत होती हैं और वास्तविक उपयोगकर्ताओं के मुताबिक प्रामिसिंग लगता है. मैंने इसे खरीदने की प्रक्रिया शुरू कर दी है. सॉफ़्टवेयर प्राप्त होते ही इसकी विस्तृत समीक्षा इन्हीं पृष्ठों पर जल्द ही प्रस्तुत करूंगा.

लीना जी,
मैंने अपडेट कर वहाँ समीक्षा लगा दी है.
समीक्षा निम्नानुसार है -

अद्यतन समीक्षा :
मैंने इस सॉफ़्टवेयर को तीन अलग अलग कंप्यूटरों पर इंस्टाल किया - 2 लैपटॉप (1 ड्यूअल कोर, 1 क्वाड कोर प्रोसेसर व उचित रैम युक्त) तथा 1 पीसी - 3.2 गीगाहर्त्ज हाइपर थ्रेडिंग प्रोसेसर युक्त तथा 3 अलग किस्म के अच्छे माइक्रोफ़ोन जिसमें शामिल है सॉफ़्टवेयर के साथ आए माइक्रोफ़ोन भी, और तीन अलग-3 वक्ताओं को लेकर.परंतु मेरा अनुभव बिलकुल ही बेकार रहा.हमेशा तो नहीं, परंतु बहुत बार जब हमने इसे डिक्टेशन दिया पूरब तो इसने छापा पश्चिम. कुछ बोलो तो यह कुछ का कुछ छापता है. यानी आउटपुट एडीटिंग कर काम में लेने लायक भी नहीं रहता.अलबत्ता कई उपगोयगकर्ताओं ने, जिनकी क्रेडिबिलिटी पर प्रश्नचिह्न नहीं लगाया जा सकता, इसके आउटपुट को 90 % तक शुद्ध और काम में लेने लायक बताया है - पर ये सभी कार्यालयीन उपयोग करने वाले हैं तो शायद यह कार्यालयीन पत्राचार को तो ठीक से टाइप करता है और अन्य साहित्यिक वार्ता को समझने में नाकाम रहता है.
जो भी हो, यह सॉफ़्टवेयर मेरे लिए बेकार है. 6 हजार रुपए गए पानी में!
FINALLY SUCCESS ON 27-07-2012 
आज सीडैक से सपोर्ट पर्सन द्वारा विंडोज की कुछ अतिरिक्त सेटिंग करवाई गई और अंततः यह श्रुतलेखन राजभाषा चल निकला. मेरे स्वयं के केस में यह बोले जा रहे वाक्यों को 95-98 प्रतिशत तक शुद्धता से टाइप करता है.

अतिरिक्त विवरण व सॉफ़्टवेयर की संक्षिप्त समीक्षा यहाँ दर्ज है -

2 comments:

Ravishankar Shrivastava said...

लीना जी, लगता है इस पोस्ट का असर हो गया. सीडैक से पल्लवी जी ने सहायता मुहैया करवाई और यह प्रोग्राम अब बढ़िया काम करने लगा है. विवरण यहाँ दर्ज है -

http://raviratlami.blogspot.in/2012/07/blog-post_27.html

हरिराम said...

सुना है, http://ildc.in पर इसका फ्री डिमो वर्सन डाउनलोड हेतु उपलब्ध कराया गया... किन्तु तलाश करने पर वहाँ श्रुतलेखन-राजभाषा का नाम तक कहीं दिखाई नहीं दिया। CDAC के वेबसाइट पर भी इसका कोई विवरण नहीं मिला। शायद IBM freespeech के सहयोग से विकसित होने के कारण कुछ लाईसैंस सम्बन्धी समस्या सामने आ रही होगी।