केयूद्वारा नेपाली–तामाङ–अंग्रेजी त्रिभाषिक एआई अनुवाद प्रणाली विकास

0

काठमाडौं । काठमाडौं विश्वविद्यालय (केयू) को सूचना तथा भाषा प्रशोधन अनुसन्धान प्रयोगशाला (आईएलपीआरएल) ले गुगलको सहयोगमा सञ्चालन गरेको त्रिभाषिक मेसिन अनुवाद (टीएमटी) परियोजना सफलतापूर्वक सम्पन्न गरेको छ। परियोजनाको औपचारिक समापन ललितपुरको कुपन्डोलस्थित हिमालय होटलमा आयोजित कार्यक्रममा गरिएको हो।

गुगल एकेडेमिक रिसर्च अवार्ड २०२४ अन्तर्गत ‘सोसाइटी–सेन्टर्ड एआई’ पहलबाट वित्तपोषित यस परियोजनाले नेपाली, तामाङ र अंग्रेजी भाषाबीच स्वचालित अनुवाद गर्न सक्ने कृत्रिम बुद्धिमत्ता (एआई) प्रणाली विकास गरेको छ। परियोजनाको मुख्य उद्देश्य भाषिक रूपमा पछाडि परेका समुदायलाई सूचना तथा सार्वजनिक सेवामा सहज पहुँच उपलब्ध गराउनु रहेको विश्वविद्यालयले जनाएको छ।

काठमाडौं विश्वविद्यालयले त्रिभुवन विश्वविद्यालयको भाषाविज्ञान केन्द्रीय विभाग र तामाङ राष्ट्रिय पुस्तकालयसँगको सहकार्यमा दुई वर्षको अवधिमा एक लाखभन्दा बढी समानान्तर वाक्य समेटिएको ‘गोल्ड स्ट्यान्डर्ड’ भाषा डाटासेट तयार गरेको हो। कृषि, शिक्षा, स्वास्थ्य, संस्कृति, पर्यटन तथा सामान्य सञ्चार क्षेत्रलाई समेटेर तयार गरिएको उक्त डाटासेटलाई प्रणाली विकासको आधार बनाइएको छ।

परियोजनाका प्रमुख अनुसन्धानकर्ता प्रा. डा. बालकृष्ण बलले समुदायको प्रत्यक्ष सहभागितामा विकसित गरिएको यो प्रणालीले स्थानीय तहका सेवा, विद्यालयका बहुभाषिक सामग्री निर्माण तथा तामाङ भाषाको संरक्षण र प्रवर्द्धनमा महत्वपूर्ण योगदान पुर्‍याउने बताए।

परियोजनाअन्तर्गत मेटा एआईको खुला स्रोत मोडल ‘एनएलएलबी–२०० (नो ल्याङ्ग्वेज लेफ्ट बिहाइन्ड)’ लाई स्थानीय भाषिक डाटासेट प्रयोग गरी परिमार्जन गरिएको छ।

सार्वजनिक गरिएको प्रणालीमा तत्काल पाठ अनुवाद, वेबपेज अनुवाद, फाइल अनुवाद तथा प्रयोगकर्ताको प्रतिक्रिया संकलन गर्ने सुविधा समावेश गरिएको छ। प्रयोगकर्ताले सरकारी वेबसाइटको यूआरएल राखेर सम्पूर्ण वेबपृष्ठ अनुवाद गर्न सक्नेछन् भने .docx.pdf फाइल अपलोड गरी अनुवादित संस्करण प्राप्त गर्न सक्ने व्यवस्था गरिएको छ।

परियोजना टोलीका अनुसार प्रणालीलाई प्रयोगकर्ताको प्रतिक्रिया र मूल्यांकनका आधारमा निरन्तर सुधार गरिनेछ। यसअघि परियोजनाको बीटा परीक्षण, ह्याकाथन तथा विभिन्न सरकारी निकायसँग परामर्श कार्यक्रम सञ्चालन गरिएको थियो। भाषा आयोग, सूचना प्रविधि विभाग र बागमती प्रदेश सरकारसँग पनि यसको प्रयोग र विस्तारबारे छलफल भएको जनाइएको छ।

परियोजनासँग सम्बन्धित अनुसन्धानपत्रहरू अन्तर्राष्ट्रिय सम्मेलन एलआरईसी २०२६, स्पेल २०२५ र ईएएमटी २०२६ मा प्रकाशित तथा स्वीकृत भइसकेका छन्।

समापन समारोहमा भाषा विज्ञ, अनुवादक तथा स्थानीय समुदायका योगदानकर्तालाई सम्मान गरिएको थियो। वरिष्ठ भाषाविद् तथा तामाङ भाषा अभियन्ता अमृत योञ्जन तामाङले भाषा डाटासेट निर्माणका अनुभव साझा गरेका थिए भने प्रमुख अनुवादक इन्द्र तामाङसहितको टोलीको योगदानको प्रशंसा गरिएको थियो।

कार्यक्रमका प्रमुख अतिथि प्रा. डा. माधव पोखरेलले अत्याधुनिक प्रविधिमार्फत भाषा संरक्षणका लागि गरिएको यो पहल नेपालका स्थानीय भाषाको भविष्यका लागि महत्वपूर्ण भएको बताए।

परियोजना टोलीले आगामी दिनमा थप आदिवासी तथा स्थानीय भाषालाई प्रणालीमा समेट्दै स्वचालित वाक् पहिचान (एएसआर) र टेक्स्ट–टु–स्पिच (टीटीएस) प्रविधि समेत विकास गर्ने योजना रहेको जानकारी दिएको छ।

Post a Comment

0 Comments
* Please Don't Spam Here. All the Comments are Reviewed by Admin.
Post a Comment (0)


 


 

#buttons=(Accept !) #days=(20)

Our website uses cookies to enhance your experience. Learn More
Accept !
To Top