केयूद्वारा नेपाली–तामाङ–अंग्रेजी त्रिभाषिक एआई अनुवाद प्रणाली विकास

काठमाडौं । काठमाडौं विश्वविद्यालय (केयू) को सूचना तथा भाषा प्रशोधन अनुसन्धान प्रयोगशाला (आईएलपीआरएल) ले गुगलको सहयोगमा सञ्चालन गरेको त्रिभाषिक मेसिन अनुवाद (टीएमटी) परियोजना सफलतापूर्वक सम्पन्न गरेको छ। परियोजनाको औपचारिक समापन ललितपुरको कुपन्डोलस्थित हिमालय होटलमा आयोजित कार्यक्रममा गरिएको हो।

गुगल एकेडेमिक रिसर्च अवार्ड २०२४ अन्तर्गत ‘सोसाइटी–सेन्टर्ड एआई’ पहलबाट वित्तपोषित यस परियोजनाले नेपाली, तामाङ र अंग्रेजी भाषाबीच स्वचालित अनुवाद गर्न सक्ने कृत्रिम बुद्धिमत्ता (एआई) प्रणाली विकास गरेको छ। परियोजनाको मुख्य उद्देश्य भाषिक रूपमा पछाडि परेका समुदायलाई सूचना तथा सार्वजनिक सेवामा सहज पहुँच उपलब्ध गराउनु रहेको विश्वविद्यालयले जनाएको छ।

काठमाडौं विश्वविद्यालयले त्रिभुवन विश्वविद्यालयको भाषाविज्ञान केन्द्रीय विभाग र तामाङ राष्ट्रिय पुस्तकालयसँगको सहकार्यमा दुई वर्षको अवधिमा एक लाखभन्दा बढी समानान्तर वाक्य समेटिएको ‘गोल्ड स्ट्यान्डर्ड’ भाषा डाटासेट तयार गरेको हो। कृषि, शिक्षा, स्वास्थ्य, संस्कृति, पर्यटन तथा सामान्य सञ्चार क्षेत्रलाई समेटेर तयार गरिएको उक्त डाटासेटलाई प्रणाली विकासको आधार बनाइएको छ।

परियोजनाका प्रमुख अनुसन्धानकर्ता प्रा. डा. बालकृष्ण बलले समुदायको प्रत्यक्ष सहभागितामा विकसित गरिएको यो प्रणालीले स्थानीय तहका सेवा, विद्यालयका बहुभाषिक सामग्री निर्माण तथा तामाङ भाषाको संरक्षण र प्रवर्द्धनमा महत्वपूर्ण योगदान पुर्‍याउने बताए।

परियोजनाअन्तर्गत मेटा एआईको खुला स्रोत मोडल ‘एनएलएलबी–२०० (नो ल्याङ्ग्वेज लेफ्ट बिहाइन्ड)’ लाई स्थानीय भाषिक डाटासेट प्रयोग गरी परिमार्जन गरिएको छ।

सार्वजनिक गरिएको प्रणालीमा तत्काल पाठ अनुवाद, वेबपेज अनुवाद, फाइल अनुवाद तथा प्रयोगकर्ताको प्रतिक्रिया संकलन गर्ने सुविधा समावेश गरिएको छ। प्रयोगकर्ताले सरकारी वेबसाइटको यूआरएल राखेर सम्पूर्ण वेबपृष्ठ अनुवाद गर्न सक्नेछन् भने .docx र .pdf फाइल अपलोड गरी अनुवादित संस्करण प्राप्त गर्न सक्ने व्यवस्था गरिएको छ।

परियोजना टोलीका अनुसार प्रणालीलाई प्रयोगकर्ताको प्रतिक्रिया र मूल्यांकनका आधारमा निरन्तर सुधार गरिनेछ। यसअघि परियोजनाको बीटा परीक्षण, ह्याकाथन तथा विभिन्न सरकारी निकायसँग परामर्श कार्यक्रम सञ्चालन गरिएको थियो। भाषा आयोग, सूचना प्रविधि विभाग र बागमती प्रदेश सरकारसँग पनि यसको प्रयोग र विस्तारबारे छलफल भएको जनाइएको छ।

परियोजनासँग सम्बन्धित अनुसन्धानपत्रहरू अन्तर्राष्ट्रिय सम्मेलन एलआरईसी २०२६, स्पेल २०२५ र ईएएमटी २०२६ मा प्रकाशित तथा स्वीकृत भइसकेका छन्।

समापन समारोहमा भाषा विज्ञ, अनुवादक तथा स्थानीय समुदायका योगदानकर्तालाई सम्मान गरिएको थियो। वरिष्ठ भाषाविद् तथा तामाङ भाषा अभियन्ता अमृत योञ्जन तामाङले भाषा डाटासेट निर्माणका अनुभव साझा गरेका थिए भने प्रमुख अनुवादक इन्द्र तामाङसहितको टोलीको योगदानको प्रशंसा गरिएको थियो।

कार्यक्रमका प्रमुख अतिथि प्रा. डा. माधव पोखरेलले अत्याधुनिक प्रविधिमार्फत भाषा संरक्षणका लागि गरिएको यो पहल नेपालका स्थानीय भाषाको भविष्यका लागि महत्वपूर्ण भएको बताए।

परियोजना टोलीले आगामी दिनमा थप आदिवासी तथा स्थानीय भाषालाई प्रणालीमा समेट्दै स्वचालित वाक् पहिचान (एएसआर) र टेक्स्ट–टु–स्पिच (टीटीएस) प्रविधि समेत विकास गर्ने योजना रहेको जानकारी दिएको छ।

Facebook SDK (Plugin)

केयूद्वारा नेपाली–तामाङ–अंग्रेजी त्रिभाषिक एआई अनुवाद प्रणाली विकास

Post a Comment

Ad

Follow us on Facebook

video

About Us

Footer Copyright

#buttons=(Accept !) #days=(20)

Contact form

Facebook SDK (Plugin)

केयूद्वारा नेपाली–तामाङ–अंग्रेजी त्रिभाषिक एआई अनुवाद प्रणाली विकास

You may like these posts

Post a Comment

Footer Copyright

#buttons=(Accept !) #days=(20)

Contact form