📅
Twitter/X Instagram Facebook
نواڻ
مکيه صفحو مضمون 🎙️ سنڌي ٻوليءَ ۾ ڪمپيوٽنگ ۽ AI: حوالن کا...

🎙️ سنڌي ٻوليءَ ۾ ڪمپيوٽنگ ۽ AI: حوالن کان حقيقتن تائين، دعوائون ۽ چئلينجز

✍️ ڊاڪٽر اشوٿاما ·📅 02 جون 2026 ·🏷️ مضمون ·⏱️ 12 منٽ ·👁 4
فونٽ:
📤 شيئر 💬 واٽسايپ
🎙️ سنڌي ٻوليءَ ۾ ڪمپيوٽنگ ۽ AI: حوالن کان حقيقتن تائين، دعوائون ۽ چئلينجز

🎙️ سنڌي ٻوليءَ ۾ ڪمپيوٽنگ ۽ AI: حوالن کان حقيقتن تائين، دعوائون ۽ چئلينجز
ڊاڪٽر اشوٿاما
سنڌي ٻوليءَ کي جديد ٽيڪنالاجيءَ جي ڊوڙ ۾ شامل ڪرڻ، گلوبل ايڊوانسمينٽ سان لاڳاپڻ ۽ قوم لاءِ لاڀائتو بڻائڻ جي بينر هيٺ ويجهڙائيءَ ۾ سرڪاري ۽ نيم سرڪاري ادارن پاران مختلف پهلڪارين جون پڌرايون ۽ وڏين مثبت تبديلين جون دعوائون ۽ بيان سامهون آيا آهن. خاص طور تي سنڌي لينگويج اٿارٽي، ثقافتي ۽ تعليمي ادارن جي مختلف فنڊيڊ پروجيڪٽس تحت سيمينارن، ڪانفرنسن، معاهدن (MoUs)، ۽ مختلف پروگرامن جي هڪ ميڊيائي سيريز گهڻي عرصي کان روان دوان آهي.
پر سوال انهن سرگرمين جي صحت بابت آهي ته ڇا انهن عوامي سطح جي انڊراسٽينڊنگ ۽ سنڌي ٻوليءَ کي روزمره جي سهولتڪارين لاءِ ڪيترو ڪارآمد بڻايو آهي؟ ڇا انھن دعوائن جا حقيقت جي زمين تي پير آهن؟ يا اهي فقط سوشل ميڊيا تي تصويري خبرنامي ۽ سنگت ساٿ جي مبارڪن جي وصولين تائين محدود آهن؟
هي مشاهداتي شيئرنگ سنڌي ٻوليءَ جي ڪمپيوٽنگ ۽ مصنوعي ذهانت (AI) جي ميدان ۾ موجود تضادن، کوٽن ۽ امڪانن تي تنقيدي ۽ سائنسي نظر وجھڻ آهي، ته جيئن ٻوليءَ جي تاريخي شعور ۽ عملي اڳڀرائيءَ جي سچائي ۽ فڪشن کي جانچي سگھجي.
🧠 اردو ۽ سنڌي ٻوليءَ جي ڪمپيوٽنگ: هڪ تقابلي جائزو
اردو، پاڪستان جي قومي ٻولي جي حيثيت ۾، ڪمپيوٽر سائنس ۽ مصنوعي ذهانت جي ميدان ۾ وڏي پيماني تي ترقي ڪري چڪي آهي. سرڪاري ۽ تحقيقي ادارن جي سهڪار سان اردوءَ لاءِ هيٺيان وسيلا موجود آهن:
لغوي ذخيرا (Corpora): لکين جملن، ڪتابن، ۽ خبرن تي ٻڌل تشريح ٿيل (annotated) ڊيٽا
مشين ترجمو: Google Translate ۽ ٻيا پليٽفارم
آوازي سڃاڻپ (Speech Recognition): صوتي نظام جيڪي آواز کي ٽيڪسٽ ۾ بدلائين ٿا
ٽيڪسٽ کان آواز (Text-to-Speech): لکيل متن کي آواز ۾ تبديل ڪرڻ وارا اوزار
قدرتي ٻوليءَ جي پروسيسنگ (NLP): گرامر ۽ جملن جي سڃاڻپ لاءِ اوزار، جهڙوڪ Urdu BERT
ان جي ابتڙ، سنڌي ٻولي، جيڪا سنڌ جي آئيني طور سرڪاري ٻوليءَ جي حيثيت رکي ٿي، اڃا تائين جديد ٽيڪنالاجيءَ جي ميدان ۾ "Zero Resource Language" طور سڃاتي وڃي ٿي. ان جو مطلب آهي ته سنڌيءَ لاءِ نه معياري ڊيٽا موجود آهي، نه ٽيڪنالاجيڪل اوزار، ۽ نه ئي عالمي معيارن مطابق انفراسٽرڪچر.
🔎 سنڌي ٻوليءَ ۾ جديد ٽيڪنالاجيءَ جون بنيادي کوٽون.
سنڌي ٻوليءَ کي ڪمپيوٽنگ ۽ AI جي ميدان ۾ شامل ڪرڻ لاءِ هيٺيان چئلينجز سامهون آهن:
1. معياري لغوي ذخيري (Corpora) جي کوٽ
اردوءَ لاءِ لکين جملن تي مشتمل متوازن ۽ تشريح ٿيل ڊيٽا موجود آهي، جيڪو مشين لرننگ ۽ AI جي ترقيءَ لاءِ بنيادي ضرورت آهي. پر سنڌيءَ لاءِ اڃا تائين ڪو به مستند ۽ متوازن لغوي ذخيرو موجود ناهي، ۽ نه ئي ڪنهن اداري پاران ان تي منظم ڪم ٿي رهيو آهي.
2. مشين ترجمي ۽ آوازي اوزارن جي کوٽ
سنڌيءَ کي 2022 ۾ Google Translate ۾ شامل ڪيو ويو، پر ان جو ترجمو اڪثر غلط، غير فطري ۽ ناقص آهي. ان کان علاوه: آوازي سڃاڻپ (ASR): سنڌيءَ لاءِ ڪو به خودڪار آوازي سڃاڻپ وارو نظام موجود ناهي
ٽيڪسٽ کان آواز (TTS): لکيل متن کي آواز ۾ بدلائڻ وارو ڪو به معتبر اوزار اڃا تائين ترقي ناهي ڪيو ويو
3. غير معياري سافٽويئر ۽ اوزار
ڪجهه ماڻهو ذاتي طور تي سنڌي ٻوليءَ لاءِ ٽائپنگ ايپس، ڊڪشنريون، يا فونٽس تيار ڪري رهيا آهن، پر اهي اڪثر:
غير معياري ۽ غير مستند آهن.
عالمي معيارن (جهڙوڪ usability testing يا interoperability protocols) تي پورا نٿا لهن.
عالمي developer برادريءَ سان تعاون کان سواءِ ٺهيل آهن، جنهن ڪري انهن جي رسائي ۽ اثر محدود آهي
⚠️ اعلانيل ۽ سچائين جي وچ ۾ فاصلا ۽ وڇوٽيون
سنڌي ڪمپيوٽنگ بابت اڪثر بيان جذباتي، ادبي يا ثقافتي انداز ۾ ٿين ٿا، پر انهن ۾ سائنسي ۽ فني بنيادن جي کوٽ آهي. مثال طور: ڪجهه ماڻهن کي ”سنڌي ڪمپيوٽنگ جا ماهر“ طور پيش ڪيو وڃي ٿو، پر انهن جي ڪم جو نه ڪو peer-reviewed تحقيقي حوالو آهي، نه ئي open-source code موجود آهي
اهڙا پروگرام ۽ معاهدا اڪثر hero-centric model تي ٻڌل آهن، جيڪي سائنسي ترقيءَ بدران ذاتي پروجيڪشن ۽ نمود نمائش کي فروغ ڏين ٿا
سرڪاري ۽ نيم سرڪاري ادارن پاران ٿيل معاهدا غير معروف يا غير تسليم ٿيل ادارن سان ٿين ٿا، جن جو عالمي ٽيڪنالاجيءَ جي معيارن سان ڪو به تعلق ناهي
🌍 عالمي معيارن کان لاتعلقي
دنيا جون ٻيون ٻوليون جديد ٽيڪنالاجيءَ سان تيزيءَ سان ڳنڍجي رهيون آهن. مثال طور:
وڏا ٻولي ماڊل (LLMs): GPT، BERT، ۽ T5 جهڙا ماڊل مختلف ٻولين لاءِ تربيت ڏنل آهن
ٽوڪنائيزر ۽ لئنگويج ماڊل: عالمي سطح تي ٻولين لاءِ معياري اوزار ۽ بنچ مارڪس موجود آهن
پر سنڌي ٻوليءَ لاءِ:
نه ڪو Sindhi BERT يا ٻيو ٻولي ماڊل موجود آهي
نه ڪو معياري tokenizer يا language-adaptation framework تيار ٿيو آهي
نه ڪو عالمي benchmark score يا technical evaluation report موجود آهي، جيڪو سنڌيءَ جي ترقيءَ جي ماپ ڪري سگهي
🎯 تجويزون ۽ گذارشون: سنڌي ٻوليءَ کي AI جي دور ۾ آڻڻ لاءِ رستو
سنڌي ٻوليءَ کي جديد ٽيڪنالاجيءَ جو حصو بڻائڻ لاءِ عملي ۽ سائنسي اپاءَ کڻڻ ضروري آهن:
1. ڊجيٽل لئنگوئسٽڪس ڪنسورشيم جو قيام
اِهو ياري باشي واري ڪچن ڪيبنٽ ٽائپ ڪاميٽين کان الڳ معاملو آهي. سنڌي ٻوليءَ لاءِ هڪ گڏيل پليٽفارم جوڙيو وڃي، جنهن ۾ لسانيات جا ماهر، ڪمپيوٽر سائنسدان، ۽ تحقيقي ادارا شامل هجن.
2. معياري ڊيٽا جو قيام
Annotated Corpora: متوازن ۽ تشريح ٿيل لغوي ذخيرا تيار ڪيا وڃن
Parallel Translation Datasets: سنڌي ۽ ٻين ٻولين (جهڙوڪ انگريزي، اردو) جي وچ ۾ ترجمي جا ڊيٽاسيٽ تيار ڪيا وڃن
Voice Data: آوازي سڃاڻپ ۽ ٽيڪسٽ کان آواز لاءِ معياري آوازي ڊيٽا گڏ ڪيو وڃي
3. اوپن سورس ڪلچر کي فروغ
عالمي developer برادريءَ سان تعاون وڌائڻ لاءِ سنڌي ٻوليءَ جا اوزار اوپن سورس پليٽفارمن (جهڙوڪ GitHub) تي شيئر ڪيا وڃن
4. معيار تي زور
”نالي جي ڪمائي“ بدران ”ڪم جي معيار“ کي ترجيح ڏني وڃي. سافٽويئر ۽ اوزارن جي ترقيءَ ۾ عالمي معيارن (جهڙوڪ usability testing ۽ interoperability) کي يقيني بڻايو وڃي
5. عالمي ادارن سان تعاون
عالمي ٽيڪنالاجي ادارن (جهڙوڪ Google، Meta AI، يا Microsoft) سان معاهدا ۽ تحقيقي تعاون کي فروغ ڏنو وڃي، ته جيئن سنڌي ٻوليءَ کي عالمي ٽيڪنالاجيءَ جو حصو بڻايو وڃي
جذبات کان عملي ترقيءَ ڏانهن ;
بحث کي سهيڙيندي ان چوڻ ۾ ڪا هٻڪ نه هجڻ گهرجي ته سنڌي ٻوليءَ جي ڪمپيوٽنگ ۽ AI ۾ شموليت بابت اڪثر هيل تائين ڪيل جون خبرون جذباتي ۽ شاعراڻي انداز ۾ آهن، پر سائنسي ۽ فني بنيادن کان خالي آهن. جيستائين منظم، تحقيقي ۽ عالمي معيارن تي ٻڌل ڪم نه ڪيو ويندو، تيستائين سنڌي ٻوليءَ جي ترقيءَ جا خواب سيمينارن، سيلفين، گروپ فوٽن، ۽ سوشل ميڊيا پوسٽن تائين محدود رهندا.
وقت اچي ويو آهي ته جذباتي جشنن بدران سائنسي ۽ عملي حڪمت عملي اختيار ڪئي وڃي. سنڌي ٻوليءَ کي AI ۽ جديد ٽيڪنالاجيءَ جو حصو بڻائڻ لاءِ گڏيل ڪوششن، معياري وسيلن، ۽ عالمي تعاون جي ضرورت آهي. صرف انهيءَ رستي سان سنڌي ٻولي عالمي ٽيڪنالاجيءَ جي مستقبل ۾ پنهنجو جائز حصو پتي ۽ جوڳي جاءِ حاصل ڪري سگهي ٿي.
)هي ليک ڊاڪٽر اشوڪ ٿاما جو فيس بڪ تان ڪاپي ڪيل آهي

تاثرات (0)

اڃا ڪو تاثر ناهي.

لاڳاپيل تحريرون
مضمون
بيٺل پاڻي: عباس ڪوريجو
مضمون
ناول بيٺل پاڻي
مضمون
ڪتاب: بيٺل پاڻي (ناول: ادبي تنقيد)
مضمون
ناول بيٺل پاڻي