रविवार, 8 जुलाई 2012

श्रुतलेखन राजभाषा सॉफ़्टवेयर समीक्षा --रवि रतलामी द्वारा -- संघर्षके बाद सफलता


FINALLY SUCCESS ON 27-07-2012 
आज सीडैक से सपोर्ट पर्सन द्वारा विंडोज की कुछ अतिरिक्त सेटिंग करवाई गई और अंततः यह श्रुतलेखन राजभाषा चल निकला. मेरे स्वयं के केस में यह बोले जा रहे वाक्यों को 95-98 प्रतिशत तक शुद्धता से टाइप करता है.

अतिरिक्त विवरण व सॉफ़्टवेयर की संक्षिप्त समीक्षा यहाँ दर्ज है -


 श्रुतलेखन राजभाषा सॉफ़्टवेयर : (उनकी ब्लॉग साइट छींटें और बौछारें से)



हिंदी के एकमात्र व्यावसायिक और व्यावहारिक रूप से सफल स्पीच टू टैक्स्ट प्रोग्राम (हिंदी वार्ता से पाठ अनुप्रयोग) श्रुतलेखन - राजभाषा के बारे में सर्वप्रथम एक छोटी सी समीक्षा कथाकार सूरज प्रकाश ने 2008 में यहाँ लिखी थी. तब उक्त प्रोग्राम के आउटपुट की शुद्धता का प्रतिशत कोई 80 प्रतिशत था, जो कई मामलों में व्यावहारिक नहीं था.
एक वर्कशॉप में अभी हाल ही में मेरी मुलाकात अहमदाबाद के श्री जवाहर कर्नावट से हुई. उन्होंने बताया कि श्रुतलेखन - राजभाषा का नया संस्करण कोई 90 प्रतिशत शुद्धता के साथ आउटपुट देता है. और वे तथा उनके बहुत से साथी इस प्रोग्राम का प्रयोग बहुतायत से कर रहे हैं. इस बात से उत्साहित होकर  मैंने इस प्रोग्राम को खरीदने के लिए इंटरनेट में खोजबीन की तो निराशा हाथ लगी. कहीं कोई कड़ी नहीं, कोई लिंक नहीं और न ही उक्त उत्पाद को खरीदने बेचने के बारे में कुछ भी जानकारी या समीक्षा नहीं.
अंततः श्री जवाहर कर्नावट ने  सीडैक के श्री दीपक मोतीरमानी का ईमेल भेजा जो श्रुतलेखन की मार्केटिंग देखते हैं. यदि आपको यह सॉफ़्टवेयर चाहिए तो दीपक मोतीरमानी सेdeepakm@cdac.in पर संपर्क कर सकते हैं. यदि फोन से संपर्क करना चाहें तो उनके डेस्क का डायरेक्ट नंबर है -  020 - 25503396.

दीपक ने मुझे श्रुतलेखन का एक ब्रोशर भी भेजा है.  जो निम्न है:

 श्रुतलेखन-राजभाषा एक हिंदी स्पीकर-इनडिपेंडेंट हिंदी स्पीच रिकग्निशन सिस्टम है जो स्पीच (वाक्) टैक्नॉलाजी के क्षेत्र में मील का पत्थर है। स्पीच रिकग्निशन टैक्नॉलाजी की वज़ह से मशीनों के लिए मानव भाषा समझना साध्य हो गया है और यह हिंदी में आउटपुट देता है। श्रुतलेखन-राजभाषा को मंत्र-राजभाषा (मशीन साधित अनुवाद) सिस्टम के एक अंश के रूप में एकीकृत किया गया है। यह बोली गई भाषा को डिज़िटाईज़ करके इनपुट के रूप में लेता हैं और आउटपुट एक स्ट्रीम ऑफ़ टेक्स्ट के रूप में प्राप्त होता है। लैंग्वेज मॉड्यूल में मौजूद व्याकरण की सहायता से रिकग्नाईज़र स्पीच रिकग्निशन को बेहतर बनाता है। लैंग्वेज मॉड्यूल में शब्दावली और वाक्य संरचना स्टोर किया गया है।
प्रयोगकर्ता माईक्रोफ़ोन के ज़रिए सिस्टम के साथ संपर्क रखता है। स्पीच प्रोसेसिंग के लिए रिकग्नाईज़र एनलॉग सिग्नल को डिज़िटल सिग्नल में रूपांतरित करता है। प्रोसेसिंग के पश्चात एक स्ट्रीम ऑफ़ टेक्स्ट जनरैट किया जाता है।
मुख्य विशेषताएँ
र्‍ यह हिंदी यूनीकोड में आउटपुट देता है जो कि पूरे विश्व में प्रचलित है
र्‍ यूनीकोड टैक्सट को ISFOC में रूपान्तरित करने की सुविधा
र्‍ यूनीकोड हिंदी में प्रचलित की-बोर्ड टंकण की सुविधा
र्‍ अनडू, रीडू, कट, कॉपी, पेस्ट, सेलेक्ट ऑल, फ़ाईंड एण्ड रिप्लेस की सुविधा
र्‍ हिंदी देवनागरी आउटपुट का संख्याओं (अंक, दशमलव), तारीख और मुद्राओं में रूपान्तरण
‍ र्‍ द्विभाषीय हिंदी अंग्रेजी टंकण और एडिटिंग की सुविधा, शब्द संशोधन की सुविधा 
र्‍ एम एस वर्ड, एम एस पेंट, एम एस एक्सेल तथा नोटपैड के लिए सिस्टम प्लग-इन की सुविधा
र्‍ टाइपिंग के लिए इंस्क्रिप्ट, रेमिंग्टन, एवं फोनेटिक कुंजीपटल की सुविधा
सिस्टम की आवश्यकताएँ
र्‍ विंडोज़ २००० / विंडोज़ XP ऑपरेटिंग सिस्टम / विंडोज़ विस्टा
र्‍ ऑपरेटिंग सिस्टम "लैंग्वेज सैटिंग" विकल्पों में "इंडिक" इनेबल्ड हो
र्‍ माइक्रोफ़ोन
 ब्रोशर के मुताबिक सॉफ़्टवेयर में उपलब्ध सुविधाएं बेहद काम की प्रतीत होती हैं और वास्तविक उपयोगकर्ताओं के मुताबिक प्रामिसिंग लगता है. मैंने इसे खरीदने की प्रक्रिया शुरू कर दी है. सॉफ़्टवेयर प्राप्त होते ही इसकी विस्तृत समीक्षा इन्हीं पृष्ठों पर जल्द ही प्रस्तुत करूंगा.

लीना जी,
मैंने अपडेट कर वहाँ समीक्षा लगा दी है.
समीक्षा निम्नानुसार है -

अद्यतन समीक्षा :
मैंने इस सॉफ़्टवेयर को तीन अलग अलग कंप्यूटरों पर इंस्टाल किया - 2 लैपटॉप (1 ड्यूअल कोर, 1 क्वाड कोर प्रोसेसर व उचित रैम युक्त) तथा 1 पीसी - 3.2 गीगाहर्त्ज हाइपर थ्रेडिंग प्रोसेसर युक्त तथा 3 अलग किस्म के अच्छे माइक्रोफ़ोन जिसमें शामिल है सॉफ़्टवेयर के साथ आए माइक्रोफ़ोन भी, और तीन अलग-3 वक्ताओं को लेकर.परंतु मेरा अनुभव बिलकुल ही बेकार रहा.हमेशा तो नहीं, परंतु बहुत बार जब हमने इसे डिक्टेशन दिया पूरब तो इसने छापा पश्चिम. कुछ बोलो तो यह कुछ का कुछ छापता है. यानी आउटपुट एडीटिंग कर काम में लेने लायक भी नहीं रहता.अलबत्ता कई उपगोयगकर्ताओं ने, जिनकी क्रेडिबिलिटी पर प्रश्नचिह्न नहीं लगाया जा सकता, इसके आउटपुट को 90 % तक शुद्ध और काम में लेने लायक बताया है - पर ये सभी कार्यालयीन उपयोग करने वाले हैं तो शायद यह कार्यालयीन पत्राचार को तो ठीक से टाइप करता है और अन्य साहित्यिक वार्ता को समझने में नाकाम रहता है.
जो भी हो, यह सॉफ़्टवेयर मेरे लिए बेकार है. 6 हजार रुपए गए पानी में!
FINALLY SUCCESS ON 27-07-2012 
आज सीडैक से सपोर्ट पर्सन द्वारा विंडोज की कुछ अतिरिक्त सेटिंग करवाई गई और अंततः यह श्रुतलेखन राजभाषा चल निकला. मेरे स्वयं के केस में यह बोले जा रहे वाक्यों को 95-98 प्रतिशत तक शुद्धता से टाइप करता है.

अतिरिक्त विवरण व सॉफ़्टवेयर की संक्षिप्त समीक्षा यहाँ दर्ज है -

शुक्रवार, 6 जुलाई 2012

separate slot to Assamese in Unicode Consortium,


Guwahati, July 6: The Centre is in a fix on giving a separate slot to the Assamese writing system in Unicode Consortium, after contrasting opinions were sent by two departments of the Assam government on the issue.
RTI documents available with The Telegraph have revealed that following a direction from the Centre (in August 2011) to submit its opinion on allotting a separate slot for Assamese writing system, two departments of the Assam government sent two contrasting opinions within a week. On February 18, a letter from the state's information technology department to the Centre favoured a separate slot. The letter, signed by Rajiv Bora, principal secretary, IT department, said, "The Assamese script is an independent script having its own history of evolution. Historical evidence suggests it might have been derived from the ancient Kamrupi script and a separate range shall enable to arrange the characters of the Assamese script in collation order, which is not possible with the current Bengali code chart."
Again on February 23, the state cultural affairs department sent another letter suggesting renaming of the existing slot as "Assamese and Bengali" instead of a separate slot for Assamese writing system.
"We would also like to point out it would have been more appropriate to rename this script in the alphabetical order as 'Assamese and Bengali' instead of 'Bengali and Assamese'," said the letter signed by Shantanu Thakur, secretary of cultural affairs department.
The Centre's directive to the state government had come following a letter from US-based Unicode Consortium, asking the Indian government for its opinion on the issue of a separate slot for Assamese.
The consortium's letter to the Centre came after pastor Azizul Hoque and Satyakam Phukan from Assam pointed out that nomenclature of the Assamese writing system as a sub-class of Bengali in Unicode was "erroneous". They also said the system should be given a separate slot or rename the script either as Kamrupi or AMBM (Assamese-Maithili-Bengali-Manipuri). On June 13, under the chairmanship of Rajendra Kumar, deputy secretary to the government of India, a meeting was held with representatives of Assam and West Bengal governments on the issue. There were no representatives from Manipur and Bihar governments, who were also asked to send their representatives, given the similarity of script used in the two states.
A member from the team, which represented Assam in the meeting, said the team members themselves had two different opinions on the issue. "Some of us favoured a separate slot for the Assamese writing system while some others favoured renaming the existing slot as Bengali and Assamese," he said.
Given such a scenario, the Assam government will have to send a fresh proposal to the Centre on the issue, which will be forwarded to the Unicode Consortium for appropriate action. Sources said the Assam government now seems to favour renaming of the existing slot as "Bengali and Assamese", with some corrections in the existing chart code and if necessary, with the provision for a separate slot after a few years. According to a source, it was the assumption that the process of allotting a separate slot to the Assamese writing system would take two to three years, which prompted some involved in the process to go for renaming rather than seek a separate slot.