भाषा--हिन्दी--मराठी -- Indian languages.: हिंदी और तकनीककी चुनौतियाँ

हिंदी और तकनीककी चुनौतियाँ

-लीना मेहेंदले

वर्तमान दौरमें जब हम हिंदीके संबंधसे तकनीककी चुनौतियोंकी बात करते हैं तब हम संगणकीय तकनीककी ही बात करते हैं। अन्य तकनीकी चुनौतियाँ इतनी क्षुद्र हैं कि हम उनकी चर्चा ना करें तो कोई बडा दुष्परिणाम नही होनेवाला। लेकिन संगणकीय चुनोतियोंसे अनभिज्ञ रहना ना केवल हिंदी वरन् सभी देशी भाषाओंके लिये गहरा संकट है। दूसरा आयाम देखें तो चुनौतियोंका जो निदान व समाधान एक भाषाके लिये है वही सारी भाषाओंके लिये होगा। अतः समाधान किसी भी दिशासे, किसी भी प्रांतसे आये, वह हिंदीके लिये भी उतना ही लाभकारी होगा। दुर्भाग्यकी बात है कि यह किसी भी भाषासे आता नही दीख रहा।

देशको स्वतंत्र हुए और संविधानको लागू हुए सत्तर वर्ष हो रहे हैं। राजकीय समीकरण एवं तुष्टीकरणके कारण हिंदीको राष्ट्रभाषा घोषित नही किया गया, आगे भी उसे राष्ट्रभाषाके रूपमें प्रतिष्ठित करनेके प्रयास प्रायः नहीं हुए। आज हमारे देशकी आबादी सवा सौ करोड है। और चीन की आबादी १४० करोड। यानी चीन और भारत की मिलाकर आबादी २७० करोड है जबकि विश्व के बारी सारे देशों की मिली- जुली आबादी ८०० करोड है। संयुक्त राष्ट्र संघमें जो छह भाषाएं मान्यता प्राप्त हैं वे चीनी, अरबी, अंगरेजी, फ्रांसीसी, रूसी और स्पानी हैं। हमारे देशके करीब साठ करोड लोग किसी न किसी क्षेत्रीय भाषाका पुट चढाकर हिन्दी बोलते हैं और करीब सौ करोड लोग हिन्दीको समझ लेते हैं। अर्थात विश्वकी आबादीके हर आठमेंसे एक व्यक्ति हिन्दीको समझता है। इतनी सर्वव्यापकता अंग्रेजी, और चीनी भाषाओंको छोड और किसी भी भाषामें नहीं है। फिर भी हम हिंदीको संयुक्त राष्ट्रसंघकी भाषाके रूपमें अन्तर्राष्ट्रीय मान्यता प्राप्त नही करा पाये यह एक दुखद बात है।

एक दुखद बात और है। स्वतंत्रता आन्दोलनके समय हिन्दीकी मान्यता इतनी अधिक बढ गई थी कि देशके दूरस्थ कोनेमें भी हिन्दी प्रचरिणी सभा या तत्सम संस्थाएँ हिन्दीके लिये अपना योगदान दे रही थीं। लेकिन पिछले पचास वर्षोंमें यह पूरा प्रयास तेजीसे शून्यवत हुआ है जिसका अपश्रेय दो तरफ जाता है। पहले तो देशके वे राजनेता हैं जो अभी भी अंग्रेजीके महत्वके सम्मुख अपनी भाषाका महत्व या गौरव नही जानते। दूसरा, इस देशके हर माँ-बापकी इच्छा है कि बच्चे विदेश जायें, पैसा कमायें, वहीं चैन व शानसे रहें क्योंकि यह देश तो रहने लायक ही नही। इस मानसिकतामें परिवर्तन किये बिना केवल तकनीकीके भरोसे हिंदीको प्रतिष्ठा दिलाना संभव नही। फिर भी संगणकीय चुनौतियोंको जानना इसलिये आवश्यक है कि अगले सौ-दोसौ वर्षोंतक यही तकनीक राज करेगी अतः उनका समाधान किये बिना हिंदीकी प्रतिष्ठा भी संभव नही।।

आरंभिक इतिहास

पहले संक्षेपमें अबतकके तकनीकी विकासका इतिहास देखते हैं। यहाँ हिंदी शब्दमें सभी भारतीय भाषाएँ और देवनागरी शब्दमें सारी लिपियाँ अंतर्निहित हैं। मोटे तौरपर तकनीकीका आरंभ १९८१ से हुआ जब इंदिरा गांधीने प्रत्येक जिलेंमें एनआयसीका अस्तित्व निर्माणकर भूमि-अभिलेख तथा कृषि संबंधी जानकारी संगणकोंपर लानेकी योजना बनाई। लेकिन सहायक सुविधाओकी आवश्यकता और आकारके औघडपनके कारण संगणकप्रणाली गिनेचुने स्ट्रेटेजिक कार्यालयोंमें ही रखी जा सकती थी जैसे रेलवे, या डीआरडीओ। तब संगणकपर केवल अंगरेजी लिखी जा सकती थी और उसके हर अक्षरके लिये एक नियत क्रमसे आठ पंच-कार्ड्स बनाने पडते थे। उस सिस्टमकी छोटी प्रतिकृतियाँ बनाकर हमें पुरातन वस्तु संग्रहालयोंमें रखनी चाहिये ताकि अगली पीढीयाोंको उनकी जानकारी हो। खैर ।

१९८५ के बाद संगणकोंका आकार घटकर पीसी अर्थात पर्सनल कम्प्यूटर बनने लगे। इसका श्रेय जाता है उन इलेक्ट्रॉनिक्स-वैज्ञानिकोंको जो संगणकोंकी प्रोसेसर चिपको अधिकाधिक सक्षम बना रहे थे। प्रोसेसर चिपके क्षेत्रमें इण्टेल और आईबीएम जैसी कंपनियाँ सबसे आगे हैं। उसी दौरमें मायक्रोसॉफ्ट कंपनीने पहले डॉस, फिर विण्डोज ऑपरेटिंग सिस्टम (ओएस) बनाई और एक प्रकारसे ओएस-मार्केटपर उनका एकाधिकार हो गया। इन दो तकनीकी प्रयासोंका छोटासा परिणाम यह था कि अब एक अक्षरके लिये एक ही कुञ्जी पर्याप्त थी और आठ पंच कार्डोंवाला काम मानवी हाथोंसे निकलकर ओएसके माध्यमसे होने लगा। जैसे आप टाइप-राइटरपर टाइप करते हैं, वैसे ही कीबोर्डपर लिखते चलो और जो लिखा है उसे मॉनीटरपर देखकर सुधारते चलो। लेकिन इसी छोटी बातके कारण संगणकोंको पर्सनल बनाना संभव हुआ।

इस इतिहासको जाननेसे ही समझा जा सकता है कि संगणककी तकनीकीमें अधिकाधिक क्षमतावाली सेमीकंडक्टर-चिप बनाना, उस क्षमताको उपयोग करनेवाली ओएस बनाना और ओएसका उपयोग करते हुए अन्यान्य एप्लिकेशन बनाना- यथा किसी डॉक फाइलको पीडीएफ करना, या पेजमेकर सॉफ्टवेअर – ये तीन प्रकारके शोध होते रहने चाहिये। इसी जानकारीसे तौला जा सकता है कि इन तीनोंही क्षेत्रोंमें भारतका आयटी सेक्टर कितना योगदान दे पाया या कितना पिछडता चला गया।

सरकारी कार्यालयोंमें पीसी आतेही पहली माँग हुई कि भारतीय भाषाएँ लिखनेकी सुविधा हो। आरंभमें शब्दरत्न और अक्षर जैसे एप्लिकेशन आये जिनके पास एकेक फॉण्टसेट था, फिर सीडॅक व श्रीलिपी आये जिनके पास कई फॉण्टसेट थे। यहाँ हमें भारतके उन सभी कॅलिग्राफर्सकी प्रशंसा करनी पडेगी जो ये फॉण्टसेट बना रहे थे। इनमे प्रमुख नाम र. कृ. जोशी है जो मेरी दृष्टिमें पद्मश्रीके हकदार थे, लेकिन ना किसीने उनके योगदानकी चर्चा की ना कोई सम्मान दिया। भारतमें शोधकार्य क्यों पिछडते हैं इसका एक बडा कारण यह भी है।

इन सारे एप्लिकेशनमें कुञ्जीपटलका डिजाइन वही रखा गया जो उन उन भाषाके टाइपराइटरोंका था। इसे सीखनेमें महीनों लगते थे और एक भाषाका टाइपिस्ट दूसरी भाषामें टाइपिंग नही कर सकता था।

तभी सीडॅकके वैज्ञानिक श्री तांबेने एक क्रांतिकारी परिवर्तन किया। कुञ्जीपटलका नया डिजाइन इनस्क्रिप्ट बनाया जो भारतीय वर्णक्रमके अनुसार था, अतः सभी भाषाओंके लिया एक जैसा और सीखनेमें अति-सरल था। १९९१ में ब्यूरो ऑफ इंडियन स्टॅण्डर्डसे इसका प्रमाणीकरण भी करवा लिया।

यहाँ रुककर समझते हैं कि लेखन-प्रक्रियाके तीन मीलके पत्थर अर्थात् कागज-कलम, टाईप-रायटर और संगणकमें क्या अंतर हैं। जब हम कलमसे कगजपर लिखते हैं, तो जैसेही मनमें एक शब्द उभरता है, उसी समय अपनी सीखी हुई वर्णमालाके अनुरूप, मनके पटलपर उसका एक दृश्य-स्वरूप या वर्णाकृति उभरती है और वही आकृति हाथसे कागजपर लिखी जाती है। अर्थात् कागज-कलमपर लिखनेके लिये एक ही प्रमाणीकरण आवश्यक है कि किसी अक्षरका दृश्यस्वरूप कैसा हो। लेखन-विकासके इतिहासमें हजारों वर्ष पूर्व वर्णक्रम एवं वर्णोंकी आकृतियोंका - दृश्य-स्वरूपका प्रमाणीकरण हो चुका है।

जब टाइपरायटर बने तो दो बातें अलग हो गई। निर्देश-तंत्र क्या होगा अर्थात् किस कुंजीको दबानेसे कौनसा अक्षरके लिखा जायगा और दृश्य-स्वरूप क्या होगा। इस प्रकार निर्देश-तंत्रकी उपयोगिताके लिये कुंजीपटलका प्रमाणीकरण भी अनिवार्य हुआ, यथा रेमिंग्टन या गोदरेज कीबोर्ड।

दृश्य-स्वरूपोंके लिये वे फॉण्टसेट उपयोगी हुए जो पहलेसे ही प्रिंटिंग तकनीकके विकासके दौरमें बने थे और प्रमाणीकृत थे, यथा अंग्रेजीमें एरियल, टाइम्स न्यू रोमन, कूरियर इत्यादी फॉण्ट। इनसे प्रिंटिंगकी सुंदरता एवं विविधता बढती है और फॉण्टफटीग नही पैदा होता। इसीलिये मैं भारतीय फॉण्टसेटोंके निर्माताओंका महत्व मानती हूँ। लेकिन हाँ, एक टाइपरायटरपर एक ही फॉण्टसेट चलाया जा सकता है।

कई वर्षों बाद जब संगणक आया तो उसमें निर्देश-तंत्र और दृश्य-स्वरूप के साथ साथ प्रोसेसर-चिपके अंदर जो स्टोरेज कोड यानी संग्रह-व्यवस्था होगी उसके भी प्रमाणीकरणकी आवश्यकता हुई। यही प्रमाणीकरण श्री तांबेने ब्यूरो ऑफ इंडियन स्टॅण्डर्डसे १९९१ में करवाया। इसकी विशेषता थी कि सारी भारतीय लिपियोंके एक अक्षरका एक ही स्टोरेज कोड था, अर्थात लिप्यंतरणकी सुविधा अंतर्निहित थी।

थोडा पीछे चलें तो संगणकके आरंभकालमें रोमन अक्षरोंके लिये भी विभिन्न देशोंकी कंपनियोंने विभिन्न स्टोरेज कोड बनाये। लेकिन जब यह समझमें आया कि इस कारण लेखन-तंत्रकी एकवाक्यता एवं आदान-प्रदान को खतरा है तो अपने अपने आईपीआरको भुलाकर सबने रोमन अक्षरोंके लिये एक स्टोरेज कोड अपनाया जिसका नाम ASCII था।

जब भारतीय लिपियोंके लिये संगणकपर सॉफ्टवेअर बनने लगे तो एक ओर प्राइवेट कंपनियोंके अलग-अलग प्रकारके सुंदर फॉण्ट, निर्देश-तंत्र और संग्रह-तंत्र थे तो दूसरी ओर सी-डॅकके पास इनस्क्रिप्ट आधारित सॉफ्टवेअर लीप-ऑफिस और लगभग बीस फॉण्टसेट थे। इन सबके स्टोरेज कोड गुप्त थे, अतः एकका लेखन वही दूसरा संगणक देख-पढ सकता था जिसके पास वही सॉफ्टवेअर हो। सीडॅकने भी स्टोरेज-कोडके लिये श्री तांबेके प्रमाणित कोडमें थोडे बदलाव करते हुए उसे गुप्त बना दिया था।

देशका दुर्भाग्य कि अन्य प्राइवेट कंपनियोंकी तरह सीडॅक भी मार्केटकी लालचमें आ गया। सभी सॉफ्टवेअरोंपर बीआईएसका प्रमाणक लागू कराने या अपना सॉफ्टवेअर फ्री-टू-ऑल रखनेकी जगह सीडॅकने भी इसकी कीमत पंद्रह हजार रखी, जबकी अंग्रेजीमें लेखन, व सारणी जैसी बेसिक सुविधाएँ फ्री थीं। परिणाम यह हुआ कि जिन जिन कार्यालयोंमें संगणक आये वहाँ अंगरेजी स्वयमेव आ गई लेकिन भारतीय भाषाऐँ वहीं आ पाईं जहाँ प्रति संगणक पंद्रह हजार रुपये खर्च करनेकी क्षमता या मानसिकता थी। प्राइवेट सेक्टरोंने तो इन्हें दूर ही रखा।

सारांश कि १९९१ के बाद भाषाई होडमें सारी भारतीय भाषाओंको आगे लानेकी संभावनाके होते हुए भी एक झटकेमें अंग्रेजी आगे निकलती चली गई और भारतीय भाषाऐँ पीछे रहीं। कालान्तरमें इनस्क्रिप्टको फ्री रखनेका आग्रह रखनेवाले श्री तांबेको सीडॅकसे बाहर होना पडा।

इनस्क्रिप्टकी बडी सुविधा थी कि मात्र एक इशारेसे भारतकी एक लिपीसे दूसरीमें लिप्यंतरण किया जा सकता था। यह युक्ति अलीबाबाके खुल जा सिमसिमकी तरह थी क्योंकि इसी एकात्मताके कारण आनेवाले कालमें इस बातकी संभावना बन सकती थी कि एक भाषामें महाजालपर डाली गई सामग्रीकी जानकारी दूसरी भाषामें सर्च करनेपर भी मिल जाय। यहाँ यह याद दिला दूँ कि यद्यपि सामान्यजनके काम लायक महाजाल-सुविधा १९९५ में आई फिर भी सीमित रूपमें यह पहले भी उपलब्ध थी और इनस्क्रिप्टके आधारसे रेलवे गाडियोंमें रिझर्वेशन चार्ट भी अलग अलग प्रान्तोंमें अलग अलग लिपियोंमें उपलब्ध होने लगे थे।

यह भी समझना होगा कि जब कोई सॉफ्टवेअर स्टॅण्डर्डके हिसाबसे बनता है तब वह अगले आविष्कार व सॉफ्टवेअरोंके लिये उपयोगी सिद्ध होता है – फिर अलग-अलग प्रतिभावाले लोग उससे अगले काम करते हैं और भाषा-विकास होता चलता है। इसके बजाय सरकारी कंपनी सी-डॅकने अपनी उपलब्धिसे आर्थिक कमाईकी नीति अपनाई। स्टॅण्डर्डकी अवधारणाको धता बताकर अपना संग्रह-तंत्र गोपनीय बनाया और दूसरी सॉफ्टवेअर कंपनियोंके साथ स्पर्धा बनाने में जुट गई। इस प्रकार बाजारके गणितने भाषा-विकासको पीछे धकेल दिया। राजभाषाकी हमारी सारी दुहाइयाँ नाकाम रहीं क्योंकि दुहाई देनेवालोंने कभी तंत्रको समझनेमें कोई रुचि नही दिखाई।

यह मानना पडेगा कि भाषाई सॉफ्टवेअरोंका विकास कोई सरल काम नही था और भाषाई सॉफ्टवेअर बनानेवालोंके कारण ही देशमें संगणक-साक्षरता ऐसी बढी कि यूरोप-अमरीकाका काम आउटसोर्स होकर देशमें आने लगा औऱ IT industry ने अपना सुदृढ स्थान बना लिया। यह ऐसा मामला था कि जैसे कोई हमेशा झीरो अंक पानेवाला बच्चा पंद्रह अंक ले आये। खुशियाँ मनने लगीं और हम भूल गये कि कामकी जो अच्छी शुरुआत हुई थी उससे तो हमारी सौ अंक लानेकी क्षमता बनती थी।

आज भी सरकारी व प्राईवेट कार्यालयोंमें नई पीढ़ी पूर्णतया संगणक प्रशिक्षित है और संगणक सुविधाओंका लाभ ले रही है, लेकिन केवल अंग्रेजीके माध्यमसे। हिंदी या देशी भाषाओंसे अत्यल्प जुड़ाव है। कारण यह कि हिंदीकी संगणक सुविधाएँ अब भी अविकसित या केवल छोटे बडे प्रोग्राम बनानेतक सीमित रही हैं।

हिंदी संगणक विकास करने वालोंमें सर्वप्रमुख दायित्व सीडैकका है जो सरकारी संस्था होनेके कारण उसे संसाधनोंकी कोई कमी नहीं हैं। सीडैकने संगणक सॉफ्टवेयर्स बनानेके कई प्रोजेक्ट आरंभ किये लेकिन वे कस्टमरकी आकांक्षापर साठ सत्तर प्रतिशतसे अधिक खरे नहीं उतरे। ये सभी सॉफ्टवेयर इतने महंगे थे कि उनके प्राइवेट खरीदार तो थे ही नही। सीडॅकके दावेको कबूलते हुए सरकारने भारी खर्च पर उनके हिंदी सॉफ्टवेयर खरीद लिये। लेकिन उनकी उपयोगिता परखनेका या बढ़ानेका कोई कार्यक्रम सरकारके पास नहीं था। इनस्क्रिप्टके साथ यही हुआ। यदि कभी एकाध प्रश्न उठाया गया तो राजभाषा या सीडॅकसे कोई उत्तर या समाधान नहीं दिया गया। आधे अधूरे उपयोग वाले सॉफ्टवेयरको कार्यालयमें लगानेका आग्रह करनेसे समयका अपव्यय होता है क्योंकि सरकारी काम व टिप्पणियाँ दीर्घकालीन और विभिन्न उपयोगोंके लिये होती हैं। ऐसेमें हिंदी सॉफ्टवेयरके साथ किये गए कामको बार बार करना पड़ता है।

भारत विरुद्ध इंडिया

सीडॅक-तंत्रका एक उदाहरण देखते है। १९९२-१९९८ के दौरान सीडॅकने सरकारी आदेश निकलवाकर सभी कार्यालयोंमें लीप-ऑफिस खरीदवाया। इसमें वर्णानुक्रमसे लिखनेकी सुविधा थी जो नये सीखनेवाले व वरिष्ठ अधिकारियोंके लिये अतीव उपयुक्त थी। लेकिन साथमें पुराने टाइपिस्टोंकी सुविधाके लिये रेमिंग्टन कीबोर्डका ऑप्शन था और रोमन स्पेलिंगका भी। तो पूरा सरकारी तंत्र भारत बनाम इंडियामें बँट गया -- वरिष्ठ अधिकारी रोमनसे लिखने लगे औऱ पुराने टाइपिस्ट रेमिंग्टन पद्धतिसे। इनस्क्रिप्टका उपयोग समझानेका कोई कार्यक्रम ही नही था। केवल मुझ जैसे एकाध अधिकारीने अपने कर्मचारियोंको स्वयंकी निगरानीमें यह सिखाया। यह काम आज भी अधूरा है। सरकारमें उपसचिव श्रेणीसे वरिष्ठ शायदही कोई अधिकारी इनस्क्रिप्ट कीबोर्ड जानता है।

इस बीच १९९५ में इंटरनेट सुविधाका आविष्कार हुआ और देशने जाना कि किसी भी देशी भाषामें लिखा गया आलेख इंटरनेटपर जंक हो जाता है। कारण था कि इनके स्टोरेज-कोड प्रमाणीभूत नही थे। इसी समय संगणक प्रणालीमें १६-बिटवाले चिप आये जिससे चीनी और अरेबिक वर्णमालाएँ भी संगणकपर प्रमाणीकरणके साथ प्रस्थापित हो गईं। अर्थात विश्वकी ४ वर्णमालाओंमेंसे भारतीय छोड अन्य तीनोंमें प्रमाणीकरण हो गया और वे बिना जंक हुए विश्वके हर कोनेमें पढी जाने लगीं। इस दौरमें वैश्विक प्रमाणीकरण करनेवाली संस्था युनीकोड कन्सोर्शियमने श्री तांबे द्वारा बीआयएस सम्मत कराये गये प्रमाणोंको भारतीय भाषाओंके लिये स्वीकार कर लिया था। इस प्रकार इनस्क्रिप्ट कीबोर्ड तो वैश्विक प्रमाण बन गया, लेकिन सीडॅकका सॉफ्टवेअर अभी भी गुप्त ही रहा और देशी भाषाएँ इंटरनेटपर जंक होती रहीं।

यह दुष्टचक्र १९९८ में थोडासा ऐसे टूटा कि ओएस मार्केटमें अचानक मायक्रोसॉफ्टकी टक्करमें ओपनसोर्स होनेका ढिंढोरा पीटते हुए लीनक्स ओएसने प्रवेश किया। इसके मालिकोंने कहा - हम हर एप्लिकेशनकी प्राथमिक सुविधाएँ प्रमाणीकृत व फ्री डाउनलोडहेतु रखेंगे। विश्वकी सभी लिपियोंकी भी। बस, कोई हमें उनके लिये एक-एक फॉण्टसेट बना दे। तो उनकी फ्री-डिस्ट्रिब्यूशनकी फिलॉसफीको माननेवाले कइयोंने अनेक लिपियोंके नये फॉण्टसेट बनाकर दिये जिनका एकत्रित नाम रखा गया उबन्तु। इस शब्दका अर्थ है -- आओ, मिलकर आगे बढें, जैसा हम भी कहते आये हैं -- सं गच्छध्वं। कीबोर्डके लिये इनस्क्रिप्ट प्रमाण हो गया और उबन्तुकी सहायतासे लिखा भी जाने लगा। १९९८ से २००० तक लीनक्स व उबन्तुकी लोकप्रियता बढती देख मायक्रोसॉफ्टने अपना भारतीय मार्केट बचाने हेतु उन्हीं जोशीजीसे हर भाषाका एक एक फॉण्टसेट बनवाकर और उनके स्टोरेज-कोडमें युनीकोड सम्मत कोड लगाकर २००२ में पेश किया। इस प्रकार इनस्क्रिप्ट कीबोर्डका उपयोग देशी भाषाओंको जंक होनेसे बचाने तो लगा लेकिन सरकारी तंत्रमें आज भी इसका ज्ञान व प्रचार बीस प्रतिशतसे अधिक नही है। कारण २००४ में सीडॅकने लाया एक दूसरा दुष्टचक्र। सीडॅकने रोमन स्पेलिंगसे लिखी भाषाओंका गुप्त स्टोरेजकोड बदलकर उसे युनीकोड-सम्मत कर दिया और देशसे कहा -- लो भाइयों, तुम्हें यह रोमनागरी सौंपते हैं। ज्ञातव्य है कि सोनियाजीकी अध्यक्षतामें एक विशाल आयोजनमें सीडॅकने रोमनागरी समर्पित एक करोड सीडीज मुफ्त बाँटनेका ऐलान किया था।

इस घटनाने भारत बनाम इंडियाके विघटनको और सशक्त कर दिया जिससे देश अभी नही उभरा है।

रोमनागरीका जादुई ट्रॅप

यहाँ इनस्क्रिप्टकी सरलताके विषयमें थोडा बताना उचित होगा। इसके कीबोर्डका चित्र यों है --

इसे ध्यानसे देखकर समझमें आता है कि अआइईउऊएऐओऔ ये दस स्वर बांई ओर एक-दूसरेके आसपास हैं और वर्णमाला अनुक्रमके अनुसार सागरकी लहरोंकी तरह उतार-चढावपूर्वक इनकी जगह निश्चित की गई है। यही बात कखगघ, चछजझ, टठडढ, तथदध, पफबभ इन पांचों वर्गानुसारी व्यंजनोंके लिये भी लागू है। ये अनुक्रम हमने स्कूलमें पढे होते हैं अतः एकबार की-बोर्डपर उनका ले-आउट समझ लेनेसे अगली प्रॅक्टिस सरल हो जाती है। इसी कारण एक से डेढ घंटेके एक सेशनमें इसे सीखा-सिखाया जा सकता है।

संगणकपर हिन्दी लिखनेका रोमनागरी तरीका किसी जादूगरके ट्रॅप जैसा है – लुभावना, आकर्षक, कम कठिन, परन्तु भारतीय भाषाई-संस्कृतिकी जड काटनेवाला। अब तो गूगल-प्रणीत गुगल-इनपुट-टूलने भी रोमनागरीको सर्वत्र पहुँचा दिया है। आप किसी शब्दको अंग्रेजी स्पेलिंगके साथ लिखें और संगणकके पडदेपर या प्रिंट लेनेपर वह देवनागरीमें उभरेगा। यह तरीका इसलिये भी सरल लगता है क्योंकि इसका अंग्रेजी कुंजीपटल हमेशा हमारे सामने होता है और एक बार अंग्रेजी सीख लेनेके बाद हम धीरे धीरे यह कबूल कर लेते हैं कि चलो, हिन्दीकी सुविधा अंग्रेजीके माध्यमसे लेनेमें कोई आपत्ति नही है।

लेकिन जरा झाँककर देखनेसे ही इसका खतरा देखा जा सकता है। आज हम ‘भाषा‘ शब्द लिखनेके लिये यह नही सोचते कि इसे लिखनेके लिये भ में आ लगाकर फिर ष में आ लिखा जाना है। हम सोचते हैं कि हमें पहले bha लिखकर फिर sha लिखना है। अर्थात् हमारी सोच अंग्रेजियतकी ओर झुकती चली जाती है। दस वर्षके बाद यह कहा जा सकता है कि तुम्हें ‘भाषा‘ शब्द पढनेके लिये देवनागरी में दीखना क्या जरूरी है, तुम तो bhasha लिखा होनेपर भी इसे पढ ही लोगी।

एक सामाजिक संकट

लेकिन मैं दस वर्ष बादके नही बल्कि आजके ही एक बडे संकटकी चर्चा यहाँ उठा रही हूँ। भारतके आँकडे बताते हैं कि हमारे अस्सी प्रतिशतसे अधिक बच्चे दसवींसे ऊपर पढाई नही करते और उनके लिये अंग्रेजी पढना-लिखना कठिन होता है। या तो हम उनसे कहें कि रोमन फोनेटिक विधिसे हिंदी टाइपिंग करो या कहें कि अंग्रेजी न जाननेके कारण तुम्हें संगणककी दुनियामें प्रवेश नही है – दोनों बातें एक ही हैं।

परन्तु यदि हम उन्हें अंग्रेजीका आग्रह किये बिना इनस्क्रिप्टके तरीकेसे पढायें तो वे पंद्रह दिनोंमें अच्छी स्पीडसे टाइपिंग करने लगते हैं, इस प्रकार स्कूल ड्रॉप आउटकी बेरोजगारी मिटानेका एक सशक्त माध्यम भी हमारे हाथोंमें है जो रोमनागरीसे संभव नही है। मैं अपने व्यक्तिगत अनुभवके आधार पर कह सकती हूँ कि मेरे घरमें कामके सिलसिलेमें आनेवाले अल्पशिक्षित लोग जैसे काम करनेवाली महरी, उसके बच्चे, अखबार डालनेवाले, धोबी, ड्राइवर, इत्यादि को मैं मेरे ही कम्प्यूटरपर इनस्क्रिप्ट टाइपिंग सिखाती हूँ, फिर उनसे टाइपिंगका काम करवाकर अलगसे उसका मेहनताना देती हूँ। एक बार एक घरमें कुछ फर्निचरका काम निकला। पाँच-छः लोग बीस-पच्चीस दिन काम करते रहे। उनमें एक बेगारी भी था जिसे बहुत काम नही था। उसे मैंने यह तरीका सिखाया और उसने मेरे करीब तीस पन्ने टाइप कर दिये। मैंने मेहनताना दिया तो बोला मुझे सारे पन्नोंका एक एक प्रिंट आउट भी चाहिये – मैं उन्हे अपने घरमें दीवारोंपर सजा कर रखूँगा कि यह मैंने किया है। मुझे लगा कि दुनियाके किसी मेहनतानेसे अधिक उसके लिये गर्व और अभिमानकी बात थी कि अब उसे कम्प्यूटरकी दुनियामें प्रवेश मिल गया है।

मैंने ऐसे कितने ही बच्चे देखे हैं कि संगणक देखकर उनकी आँखोंमें एक चमक आ जाती है कि उन्हें भी यह सीखना है। फिर उनसे कहा जाता है कि तुम अंग्रेजी जाननेवाले नही हो इसलिये संगणककी दुनियामें तुम्हारे लिये जगह नही है। जब मैं उनसे कह पाती हूँ कि केवल हिन्दीके ज्ञानपर ही तुम संगणक सीख सकते हो, तो उन आँखोंकी चमक फिरसे वापस आती है। लेकिन मैं अकेली कितने बच्चोंतक पहुँच सकती हूँ। यदि इनस्क्रिप्टके तरीकेकी पढाई हमारी पाँचवी-छठी कक्षामें शामिलकी जाय तो रोमनागरीके कारण पैदा होनेवाली इस ज्ञानकी खाईको हम पाट सकते हैं।

यह समस्या केवल हिन्दीकी नही बल्कि हर भारतीय भाषाकी है और हरेकका उत्तर यही है क्योंकि जो कुंजीपटलका चित्र मैंने दिखाया है वही मल्याळी, गुजरातीसे लेकर बंगाली, ओरिया, मणिपुरी अर्थात् हर भारतीय भाषाके लिये प्रयुक्त होता है। यही समस्या और यही उत्तर नेपाल, श्रीलंका, तिब्बत, थाइलैंड, आदि उन सभी देशोंके लिये भी है जहाँकी व्रर्णमाला संस्कृतसे उत्पन्न है और जहां बच्चे अभी भी पहली कक्षामें अआइईउऊ... व कखगघचछजझ पढते हैं। अपने और उन देशोंके स्कूल-ड्राप-आउट्सको न्याय दिलाना है तो बिना अंग्रेजी जाने इनस्क्रिप्ट कुंजीपटलके माध्यमसे संगणकका रास्ता उनके लिये प्रशस्त करना होगा।

आईटी उद्योग आज संकटमें क्यों

इसका एक उत्तर है कि आउटसोर्सिंगमें मिलनेवाला काम चीन तेजीसे हथिया रहा है। इस सिलसिलेमें चीन और भारतके वर्ष २००१ के ये आकड़े क्या कहते हैं -

चीन भारत

literacy ७५ % ६५ %

अंग्रेजी जानने वाले ०५ % २२ %

संगणक जानने वाले ४० % १२ %

इन आकड़ोंमें शायद थोड़ा परिवर्तन हो लेकिन ये trend दर्शाते हैं और बताते हैं कि भारतमें संगणकको अग्रेंजी आधारित रखनेके कारण कितनी बडी जनसंख्या संगणक ज्ञानसे वंचित है। लेकिन चीनमें संगणकज्ञान चीनी भाषापर आधरित हैं जिस कारणसे अंग्रेजी न जाननेपर भी उनकी भावी पीढ़ी आधुनिक ज्ञानको अपनी मातृभाषाके माध्यमसे पा रही है। यही कारण है कि चीनकी उत्पादकता भारतकी अपेक्षा कहीं अधिक है। आउटसोर्सिंगका काम पाने हेतु वे १५-२० चीनी संगणक-ज्ञाताओंके बीच १-२ अंग्रेजी-ज्ञाता लगा देते हैं। इस प्रकार आईटी आविष्कारक बनना तो दूरकी बात, हम कुली भी अब नही रहेंगे।

प्रकाशकोंका संकट और उपाय

प्रकाशन क्षेत्रमें फॉण्टसेटोंका महत्व अत्यधिक है। संगणक तकनीकके बाद अब पुराने कीलवाले तरीकेसे कोई प्रिंटिंग नही करता। इसी कारण श्रीलिपी या कृतीदेव जैसी कंपनियोंने कई फॉण्टसेट रखे हैं जिनके लिये प्रकाशनका मार्केट उपलब्ध है। लेकिन प्रकाशकोंकी दो समस्याएँ हैं। पेज ले-आऊट बनाने हेतु मार्केटमें आनेवाला पहला सॉफ्टवेअर था पेजमेकर जिसे वर्ष १९९४ में ऐडोब केपनीने खरीदा। इसने श्रीलिपी, लीप ऑफिस व कृतीदेव कंपनियोंके फॉण्टसेटोंसे अपनी कम्पॅटिबिलिटी रखी थी ताकि भारतीय मार्केटमें उतर सके। भारतके स्टॅण्डर्ड बने स्टोरेज-कोड या की-बोर्डसे कोई कम्पॅटिबिलिटी नही बनाई क्योंकि उसका प्रयोग अत्यल्प था। यह सिलसिला २०१६ तक चला। इससे प्रकाशन क्षेत्रकी गति औऱ प्रगति अत्यधिक बाधित हुई। क्योंकि वे फॉण्टसेट इंटरनेटपर जंक होते थे अतः उनके प्रूफरीडींगमें बहुत समय लगता था। २०१६ में अडोबने मायक्रोसॉफ्टके फॉण्ट तो स्वीकार कर लिये लेकिन वहाँ एक भाषाका एक ही सेट है जो प्रकाशनके लिये अपर्याप्त है। यहाँ सरकारकी भूमिका आती है। विचारणीय है कि विण्डोज २००७ वर्जन आनेके बाद सीडॅकने लीप ऑफिसको डम्प कर दिया है, लेकिन उसके लिये बनाये गये बीसियों फॉण्टसेटोंपर अब भी सीडॅकका आयपीआर बना हुआ है। सरकार एक झटकेमें यह आयपीआर हटाकर उन फॉण्टसेटोंको फ्री-टू-ऑल कर दे तो प्रकाशकोंकी कठिनाई तत्काल हल हो सकती है।

लिप्यंतरणमें संकट और उपाय

जब लीप ऑफिस सॉफ्टवेयर बना तो विचारपूर्वक यह सुविधा रखी गई कि एक भारतीय भाषासे दूसरीमें तत्काल लिप्यंतरण हो सके। लेकिन जब युनीकोड कन्सोर्शियमकी बैठकोंमें इस सुविधाको कायम रखनेपर विचार हुआ तो हर राज्यने अपनी अपनी डफली अलग माँगी और केंद्र सरकार तथा सीडॅक जैसे सलाहकारोंने भी यही माँग की। फलस्वरूप युनीकोड प्रमाणित होते हुए और एक ही इनस्क्रिप्ट तरीकेसे लिखी जानेवाली हमारी लिपियाँ अलग अलग खानोंमें कैद हो गईं, उनके बीच लिप्यंतरण व आदान-प्रदानकी सुविधा नही रही। ज्ञातव्य है कि चीन-जपान-कोरिया जैसे तीन आपसी संघर्षरत देशोंने भी इस मुद्देकी गहनताको समझते हुए केवल इस आधारपर अपनी एकात्मता और लिप्यंतरण-सुविधा बनाये रखी कि तीनोंकी वर्णमाला एक है। जब उनकी किसी भी लिपीका साहित्य इंटरनेटपर जाता है तो एकत्रित रूपसे गिनती होती है। इस संख्याबलका लाभ तीनों वर्णमालाओंवाले देश उठा रहे हैं- चीनी, अरेबिक और रोमन। केवल भारतीय वर्णमालाकी लिपियाँ इस लाभसे तबतक वंचित रहेंगी जबतक राजकीय अनुकूलता बनाकर युनीकोड कन्सोर्शियमसे यह बात नही मनवाई जाती।

ओसीआरमें हम कहाँ

संगणकको जब भाषाओंके प्रति अधिक इंटेलिजेंण्ट बनाया गया तो उसे स्पेलचेक करना, डिक्शनरी से तालमेल बनाना, शब्दका पूर्वानुमान लगाना, प्रतिशब्दका सुझाव देना आदि काम आने लगे। इसी क्रममें OCR अर्थात ऑप्टिकल फायबर रीडींगकी सुविधा आई। इसमें पीडीएफ फाइल या छापे लिखे गये अक्षरोंको संगणक पढ पाता है और उन्हें डॉक्यूमेंटमें बदल देता है ताकि उन्हें इंटरनेटपर सर्चेबल फाईलके रूपमें रखा जा सके। स्पष्ट है कि ओसीआरसे पहले संगणकको उस लिपीका व भाषाका अच्छा ज्ञान होना आवश्यक है। ओसीआर सुविधाके कारण तमाम पुराने ग्रंथ या पुस्तकोंको नये सिरेसे एक नया सर्चेबल रूप दिया जा सकता है जो उस उस भाषामें ज्ञान-प्रसारका बहुत प्रभावी साधन है। लेकिन भारतीय लिपियोंके लिये अबतक कोई प्रभावी ओसीआर नही बन पाया है। भारतसे बाहर संस्कृतकी पढाईके प्रति अनुरक्त जर्मनी जैसे देशोंमें देवनागरीके लिये ओसीआर विकसित किये जा रहे हैं लेकिन भारतीय संगणक अनुसंधानकर्ता इस दिशामें भी जीरो ही हैं।

भाषाई अनुवाद का क्या

कुछ वर्ष पूर्व सीडॅकने मंत्र नामसे एक सॉफ्टवेयर बनाया जिसमें यह डंका पीटा गटा कि इससे एक भारतीय भाषासे दूसरीमें अनुवाद करना सरल होगा। सीडैक थोडासा बधाईपात्र इसलिये हो जाता है कि जब संगणकपर भारतीय भाषाओंके आपसी अनुवाद जैसा कुछ भी नहीं था, तब उन्होंने यह पॅकेज विकसित किया।

जब इसे मार्केटमें उतारा तो खरीदनेवालोंने इसके तीन आयाम जाँचे और पाया कि

१. भारतीय भाषासे भारतीय भाषामें अनुवाद हेतु उपयोगिता -- मात्र ५%

२. भारतीय भाषासे अंग्रेजी अनुवाद हेतु उपयोगिता -- १०%

३. अंग्रेजीसे भारतीय भाषामें अनुवाद हेतु उपयोगिता -- ५०%

मेरे विचारमें इसे करनेका सीडॅकका तरीका गलत था। क्योंकि अंगरेजीको बीचमें लाये बगैर सीधे शब्दशः अनुवाद करते हुए एक भाषासे दूसरीतक सरलतासे पहुँचा जा सकता है। अंगरेजीको माध्यम भाषा बनानेके कारण एक भाषासे दूसरी भारतीय भाषामें अनुवाद हेतु उपयोगिता मात्र ५% रह गई। सीडैक की ओर से कहा गया कि "मन्त्र" के द्वारा शब्दसे शब्दका नहीं बल्कि lexical tree से lexical tree अर्थात्‌ वाक्यांशसे वाक्यांशका अनुवाद किया जाता है। जो भी हो, पांच-सात वर्ष इस विषयमें कामके बाद सीडॅकने इसे भी डम्प कर दिया।

इसका सीमित उपयोग आज भी संभव दिखता है। आजका संगणक अंग्रेजी ओसीआर मार्फत हाथसे लिखा गया अंग्रेजी आलेख पढ़ और समझ कर उसे अंग्रेजी डॉक-फाईलमें बदल सकता है। तो ऐसे आलेखके भारतीय भाषामें अनुवादकी संभावनाके कारण बँक-व्यवहारोंको और सरकारी दफ्तरोंकी अंग्रेजी टिप्पणियोंको हिंदीमें उतारनेकी सुविधा उत्पन्न हो गई है। आज यदि उपयोगिता पचास प्रतिशत तक है तो उसे बढाया जा सकता है। इसका तरीका यह है कि lexical tree to lexical tree के अनुवाद हेतु जो भी कोडिंग सीडैकने की है असे यदि public domain में डाला जाये तो जो भी व्यक्ति अलग तरहसे अनुवाद करना चाहता हो वह इस coding की मददसे ऐसा कर सकेगा और अनुवादकी क्वालिटीमें सुधार हो सकेगा। इस coding से भारतीय भाषाएँ accessible होंगी अतः कोई अन्य बुद्धिमान और संगणक-प्रवीण व्यक्ति भारतीय भाषासे भारतीय भाषातक या भारतीय भाषासे सीधे जापानी, चीनी, फ्रांसिसी, जर्मन इत्यादि भाषाओंतक पहुँच सकेगा। इस प्रकार दुनियाँके अन्य देशोंतक पहुँचनेपर विश्व बाजारमें और विश्व राजनीतिमें भी भारतकी साख बढनेकी संभानवा थी। हालांकि अब गूगल ट्रांसलेशन जैसे टूल भी उपलब्ध हैं जो अपने अनुवादपर आपका सुझाव माँगकर लगातार अपने टूलको बेहतर बना रहे हैं। सीडॅक या डीओटी ऐसा क्यों नही करता यह पूछा जा सकता है।

मुददे और कई हैं। कुल मिलाकर जबतक देशमें संस्कृतिको गँवार और अवैज्ञानिक माना जायगा, तकनीक व संस्कृतिको आपसमें बेमेल माना जायगा, हम अपनी संस्कृतिके प्रति आत्मगौरवसे दूर रहेंगे और संस्कृति रक्षा हमारी प्राथमिकता नही होगी तबतक हम तकनीकी क्षेत्रमें भी पिछडे ही रहेंगे। देशमें संगणकीकरणका इतिहास यही कहता है।

***********************************************************************

भाषा--हिन्दी--मराठी -- Indian languages.

रविवार, 13 अक्टूबर 2019

हिंदी और तकनीककी चुनौतियाँ

कोई टिप्पणी नहीं:

ब्लॉग आर्काइव

मेरे बारे में