USA and Britain are called two nations divided by the same language. I think Hindi and Urdu remain the same language divided by a script.
अभय अग्रवाल के चिट्ठे से लिया यह उद्धरण मुझे बहुत सटीक लगा। उर्दू इतनी हसीन ज़बान है और इतनी अपनी लगती है, पर इस की लिपि ने इसे पराई कर दिया है। यह बात नहीं है कि उर्दू में प्रयुक्त नस्तालीक़ लिपि सीखी नहीं जा सकती, पर उसी ज़बान को लिखने के लिए जब हम देवनागरी जैसी लिपि का प्रयोग जानते हैं, तो उसी के लिए एक और लिपि सीखना मेहनत का काम तो है ही। हिन्दी वालों ने संस्कृत के शब्दों से और उर्दू वालों ने अरबी-फ़ारसी शब्दों से इस एक ही भाषा में जो दरार डाली है, उसे आम तौर पर हिन्दुस्तानी बोलने वालों ने सीधी-सादी भाषा बोल कर पाट दिया है। पर लिपियों की भिन्नता ने जो दरार डाली है, उसे पाटने के लिए बहुत मेहनत चाहिए।
जितना हिन्दी चिट्ठाजगत का कारवाँ बढ़ रहा है, उतनी तेज़ी से नस्तालीक़ में लिखे उर्दू चिट्ठे तो सामने नहीं आ रहे हैं, पर उर्दू में जितना भी लिखा जा रहा है, उसे पढ़ने की ललक हिन्दी चिट्ठाकारों और पाठकों में बढ़ती जा रही है। पिछले वर्ष मैं ने उर्दू में लिखे चिट्ठों पर एक नज़र डाली थी, और उम्मीद की थी कि इसे नियमित रूप से लिख पाऊँगा। पर जैसा इस चिट्ठे पर होता आया है, वही हुआ। महीने में कुल जमा दो-तीन पोस्ट लिखे जाते हैं, और वह भी बिना किसी प्लानिंग के। इस के इलावा भारत से उर्दू के कोई खास चिट्ठे भी सामने नहीं आए। शुऐब का उर्दू चिट्ठा نئی باتیں / نئی سوچ (नई बातें नई सोच) नियमित पढ़ता हूँ। इंडस्क्राइब का बेस्ट ग़ज़ल्स भी बढ़िया है पर वे यूनिकोड उर्दू न लिख कर ग़ज़लों को स्कैन कर के छापते हैं। हिन्दी चिट्ठाजगत में उर्दूदानों की संख्या बढ़ गई है, पर उर्दू चिट्ठाकारों की संख्या ज्यों की त्यों है।
इस बीच एक अच्छे इरादे से कोशिश हो रही है उर्दू-हिन्दी लिप्यन्तरण (ट्रान्सलिट्रेशन) सॉफ्टवेयर बनाने की। भोमियो के पीयूष, जो कि भारतीय लिपियों को आपस में परिवर्तित करने में बहुत सफल रहे हैं, अब प्रयत्न कर रहे हैं उर्दू से हिन्दी ट्रान्सलिट्रेशन की। जो अभी तक हासिल हुआ है, उस के बारे में यही कहा जा सकता है कि कुछ न होने से तो बेहतर है। कई लोग इस से उत्साहित हैं, पर इस मामले में मैने शुरू से जो टिप्पणियाँ दी हैं, वे बहुत अधिक उत्साहवर्धक नहीं रही हैं इस काम में लगे लोगों के लिए, या इस सॉफ्टवेयर का इन्तज़ार कर रहे लोगों के लिए। इसका कारण यह है कि मैं दोनों लिपियों को समझता हूँ और यह मानता हूँ कि उर्दू से हिन्दी (या उर्दू से रोमन) का सही लिप्यन्तरण लगभग असंभव है। जो लोग उत्साहित हैं वे उर्दू नहीं जानते। जो जानते हैं, उन्हें मालूम है कि मंजिल दूर है। अपनी इस राय के कारण को विस्तार से समझाने की कोशिश करूँगा इस पोस्ट में।
भारतीय लिपियों के बीच ट्रान्सलिट्रेशन बहुत सरल है। देवनागरी, गुरमुखी, गुजराती, बंगाली, तमिल आदि लिपियों की संरचना समान है, बस अक्षरों के आकार भिन्न हैं। इन सब लिपियों से रोमन में ट्रान्सलिट्रेशन भी सरल है, क्योंकि जो रोमन आप को हासिल होती है, वह अग्रेज़ी हिज्जों या नियमों की मोहताज नहीं है। इस सरलता ने हमारी उम्मीदें बढ़ा दी हैं, और अब हम बिना उर्दू सीखे ही उसे भी पढ़ना चाहते हैं। पर कल्पना कीजिए कि आप को अंग्रेज़ी से देवनागरी का ट्रान्सलिट्रेशन बनाने को कहा जाए। एक सीधे से वाक्य “George Bush is the President of United States of America” का लिप्यान्तरण बनेगा “गेओर्गे बुश इस थे प्रेसिदेन्त ओफ उनितेद स्ततेस ओफ अमेरिका”। यदि आप को इस तरह का लिप्यन्तरण चलता है तो फिर ठीक है। पर सही लिप्यन्तरण के लिए इस में ऐसे टूल डालने पड़ेंगे जो हर शब्द का ध्वन्यात्मक रूप खोजे और उसे फिर देवनागरी में लिपिबद्ध करे – यानी एक अंग्रेज़ी का टेक्स्ट-टू-वॉइस कन्वर्टर और हिन्दी का वॉइस-टू-टेक्सट कन्वर्टर। यूँ समझिए कि उर्दू की हालत इस से कई गुणा जटिल है। उर्दू में हर शब्द का क्या उच्चारण है यह इस बात पर निर्भर करता है कि सन्दर्भ क्या है। उदाहरण के लिए “क्या” और “किया” एक ही तरह से लिखा जाता है। “अस”, “इस” और “उस” एक ही तरीके से लिखा जाता है। पढ़ने वाला मज़मून के मुताबिक उसे सही पढ़ता है। यह उम्मीद कंप्यूटर से तो नहीं की जा सकती न?
आइए उर्दू लिपि की संरचना पर एक नज़र डालें (हिन्दुस्तानी भाषा की दृष्टि से – फारसी या अरबी की दृष्टि से नहीं), जो इस को आम कंप्यूटर की समझ से बाहर कर देते हैं।
1. उर्दू अक्षरमाला
उर्दू लिपि में 37 अक्षर हैं और कुछ चिह्न हैं, पर हिन्दुस्तानी की दृष्टि से कई ध्वनियाँ डुप्लिकेट हैं, और कई अक्षर हैं ही नहीं। दो “अ” हैं (अलिफ़ और ऐन), चार-पाँच “ज़” हैं (ज़े, ज़ाल, ज़ुआद, ज़ोए, और तीन बिन्दियों वाला रे), दो “त” हैं (ते और तोए), दो “स” हैं (से और सुआद)। इन सब में आपस में उच्चारण का कोई अन्तर नहीं है; शायद अरबी फ़ारसी में होता हो, उर्दू में नहीं है। पर नियमानुसार यह भी आवश्यक है कि अरबी फ़ारसी से आए शब्दों के लिए सही अक्षर का ही प्रयोग हो। मसलन यदि “मसलन” के लिए “से” का प्रयोग होता है तो “सुआद” या “सीन” का प्रयोग नहीं हो सकता (या इस का उल्टा)। “मसलन” के आखिर में जो न की ध्वनि है उस के लिए “नून” नहीं लिखा जाता पर “अलिफ़” के ऊपर दो लकीरें डाली जाती हैं, पता नहीं क्यों। ख, घ, छ, झ, आदि के लिए उर्दू में अक्षर नहीं है पर इन्हें क, ग, च, ज, आदि के साथ ह (दोचश्मी-हे) जोड़ कर लिखा जाता है। कीफ़-क़ाफ़, गाफ़-ग़ैन, आदि में कुछ उच्चारण का अन्तर है, जो हिन्दुस्तानी बोलने वाले आम तौर पर जानते हैं, पर हमेशा नहीं। देवनागरी में नुक़्ते वाले अक्षर क़, ग़ आदि इसी के लिए प्रयोग होते हैं।
2. स्वर/मात्राएँ
उर्दू लिपि में कुछ स्वरों के लिए अक्षरों का प्रयोग होता है (अलिफ़, ऐन, ये, वाव) और कुछ स्वरों के लिए ऊपर या नीचे लगाए जाने वाले चिह्न (ज़ेर, ज़बर, पेश)। पर जो चिह्न हैं, उन का प्रयोग बिल्कुल ऐच्छिक (optional) है, यानी लगाया तो लगाया, नहीं लगाया तो नहीं लगाया। आम तौर पर इन चिह्नों को नहीं ही लगाया जाता है। यही कारण है कि क+स लिखने पर यह पढ़ने वाले को स्वयं अन्दाज़ा लगाना है कि यह किस है, कस है या कुस। शब्द में जितने अधिक अक्षर होंगे उतनी संभावनाएँ बढ़ जाएँगी। क+स+न = कसन / किसन / कसिन / कुसन / कसुन / किसिन / कुसुन / कस्न / कुस्न / किस्न / क्सन। अब हमें तो मालूम है “किसन” होगा, पर कंप्यूटर बेचारे को क्या पता कहाँ पर कौन सी मात्रा लगानी है, या किस अक्षर को आधा कर के पढ़ना है।
व के लिए जो अक्षर प्रयोग होता है (वाव) वही ऊ, ओ और औ के लिए भी प्रयोग होता है। यानी कौल लिखेंगे तो उसे कौल, कोल, कवल, कूल कुछ भी पढ़ा जा सकता है।
य के लिए जो अक्षर प्रयोग होता है (नीचे दो बिन्दियाँ) वही ई, ए, ऐ के लिए भी प्रयोग होता है। यानी सेठ को सैठ, सेठ, सयठ, सीठ, कुछ भी पढ़ा जा सकता है।
3. ह का प्रयोग
जैसा मैं ने बताया ख, घ, छ, झ, आदि के लिए अक्षर नहीं है पर इन्हें क, ग, च, ज, आदि के साथ ह (दोचश्मी-हे) जोड़ कर लिखा जाता है। दो चश्मी हे को कई बार ह के लिए भी प्रयोग किया जाता है (शब्द के आरंभ में)। हे को अन्त में कई बार आ की ध्वनि के लिए प्रयोग किया जाता है – जैसे वग़ैरा/वग़ैरह, मुज़ाहिरा/मुज़ाहिरह, हमला/हमलह, इन सब के अन्त में अलिफ़ (आ) के स्थान पर हे (ह) आता है।
4. शब्दों के बीच स्थान
शब्दों के बीच अलग से स्थान छोड़ने का नियम नहीं है। पर अक्षरों को जोड़ने के जो नियम हैं, उन से एक शब्द के बीच ऐसे स्थान आ जाता है, कि वे दो शब्द लगते हैं। जैसे, क्या आप बता सकते हैं कि इस शेर की एक लाइन में कितने अल्फ़ाज़ (शब्द) हैं?
कंप्यूटर के लिए भी यह समझना कठिन होगा कि कौन सा शब्द कहाँ आरंभ होता है और कहाँ समाप्त होता है। दोनों पंक्तियों के बीच जो बिन्दियाँ हैं, वे ऊपर के अक्षरों के साथ हैं, या नीचे के अक्षरों के साथ, यह समझना भी एक मशीन के लिए मुश्किल है। यानी, ओ.सी.आर. भी दिक्कत का काम है।
इस सब को देखते हुए मेरा यह मानना है कि उर्दू पढ़नी हो तो सब से सही तरीका है, उर्दू सीखो। अच्छी खबर यह है कि उर्दू सीखना मुश्किल नहीं है। फ़ुर्सत रही तो उर्दू को आसानी से सिखाने के लिए कुछ लेख भी लिखूँगा। दिल यह कहता है कि उर्दू को भी देवनागरी में लिखा जाए तो कितना ही अच्छा हो। पर उर्दू के ठेकेदारों को यह बात नागवार गुज़रनी है।
पीयूष ने अपने लिप्यन्तरण सॉफ्टवेयर पर उर्दूदानों की राय जानने के लिए उर्दू के यूज़नेट वाले ग्रुप में मदद मांगी थी, पर वहाँ बहस ऐसी छिड़ी और ऐसी मुड़ी कि नतीजा कुछ नहीं निकला।