बुधवार, 6 अगस्त 2014

छपी हुई सामग्रीको शोधनीय (टेक्स्ट ) रूपमें लाना

लाना छपी हुई सामग्रीको शोधनीय (टेक्स्ट ) रूपमें --
(ताकि सारे सर्च इंजिन्स उस सामग्रीमें आवश्यकतानुसार खोज कर सकें -- यह हमारे भाषाई साहित्यके भविष्यकालीन रखरखावके लिये संजीवनी की तरह है।)

सामग्री का स्क्रीन शॉट ले लें।
फिर किसी इमेज व्यूअर (इरफ़ानव्यू) में जाकर
इमेज को क्लिपबोर्ड से पेस्ट करें।
आवश्यक क्षेत्र को माउस से सिलेक्ट कर, यांक कर लें, जिससे बाहर का अनावश्यक क्षेत्र हट जाए
फिर उस इमेज को डिस्क पर सेव कर लें
फिर टेसेरेक्ट ओसीआर चलाएँ, (अन्य भी अच्छे ओसीआर मिल सकते हैं)
उसमें दाहिनी तरफ़ ऊपर के खाने में hin लिखें जिससे हिन्दी की टेबल पर काम चले।
(यह मूल टेसेरेक्ट में नहीं आता है, उनके ज्ञानस्थलसे हिन्दी टेबल डाउनलोड करके इन्स्टॉल करना पडता है।)
डिस्क पर सेव की गई इमेज को ओसीआर में ड्रॅग ड्रॉप कर दें या ओपन कर लें।
क्योंकि यह कॉलम फ़ॉर्मेट में होता है, इसलिए एक साथ पूरी इमेज को करने पर विभिन्न कॉलमों की सामग्री एक ही लाइन में आ कर गड्ड मड्ड हो जाएगी।

इसलिए माउस से एक एक करके एक कॉलम को सिलेक्ट कर लें, जिससे चयनित क्षेत्र के चारों ओर एक चौखटा बन जाएगा।

टूल बार में ओसीआर पर क्लिक करें।
कुछ देर में सामग्री टेक्स्ट फ़ॉर्म में दाहिनी ओर आ जाएगी।
उस सामग्री को सिलेक्ट करके, कॉपी करके किसी वर्ड फ़ाइल में सेव कर लें.
फिर अगले, अगले, अगले कॉलम को इसी तरह से ओसीआर करके उस वर्ड फ़ाइल में ले आयें।
फिर यह विधी समझानेके लिये V S Rawat का धन्यवाद भी करें।