சுடச் சுடச் செய்திகள்

தமிழ் கற்றலில் செயற்கை நுண்ணறிவு

தொழில்நுட்பமயமாகிவரும் தமிழ்மொழி கற்றல், ‘ஏஐ’ எனப்படும் செயற்கை நுண்ணறிவுத் தொழில்நுட்பத்திலும் சுவடு பதித்து வருகிறது.

இவ்வாண்டின் சிங்கப்பூர் அறிவியல் விழாவில் காட்சிக்கு வைக்கப்பட்ட சிறப்புத் தொழில்நுட்பங்களில் ‘ஐ2ஆர்’ குரல் மதிப்பீட்டுக் கட்டமைப்பும் ஒன்று. ஜூலை 25ஆம் தேதி முதல் ஆகஸ்ட் 8ஆம் தேதி வரை சிங்கப்பூர் அறிவியல் நிலையத்தின் ஏற்பாட்டில் நடைபெற்ற இந்த மெய்நிகர் விழாவில் பல்வேறு படைப்புகள் இடம்பெற்றன.

மொழி கற்பித்தலுக்கான இந்த மின்னிலக்கச் சாதனம், வாசிப்பவரின் சரளத்தையும் அவரது உச்சரிப்பின் துல்லியத்தையும் மதிப்பிடுகிறது. இந்தக் குறிப்பிட்ட செயற்கை நுண்ணறிவுச் செயலி தமிழ், மலாய் மொழிகளுக்கானது.

“இந்த செயற்கை நுண்ணறிவு செயலிக்கு இரண்டு பணிகள் உண்டு. குறிப்பிட்ட ஒரு மொழியிலுள்ள சொற்களின் வெவ்வேறு ஓசைகளுக்கு இடையிலுள்ள வேறுபாடுகளைப் புரிந்துகொள்வது முதல் பணி. பேசுபவரின் உச்சரிப்பைச் சரிபார்ப்பது மற்றொரு பணி,” என்று விளக்கினார் ஏஸ்டார் அமைப்பைச் சேர்ந்த டாக்டர் நேன்சி எஃப் சென்.

“உதாரணத்திற்கு ஒலிப்பில் வேறுபடும் ‘அரிசி-அரசி, ’மடி-மாடி’ போன்ற சொற்களை இந்தத் தொழில்நுட்பத்தால் வேறுபடுத்த முடியும். அத்துடன், ‘பாவம்’ போன்ற சொற்களை எப்படி உச்சரிக்க வேண்டும் என்பதையும் இந்தத் தொழில்நுட்பம் விளக்கும்,” என்று டாக்டர் சென்னின் குழுவில் இடம்பெற்ற தமிழ் மொழியியல் நிபுணர் திரு ராஜன் வேலு தெரிவித்தார்.

வாசிப்பவர்கள் முறையற்ற இடங்களில் நிறுத்தினால் அல்லது தடுக்கினால் அவற்றையும் இந்தச் செயலி கண்டுபிடித்து வாசிப்பவருக்கு வழங்கப்படும் மதிப்பெண்களைத் தகுந்தபடி குறைக்கும்.

ஈராண்டுகளுக்கு முன்னர் தொடங்கிய இந்தத் தொழில்நுட்பத்தின் தமிழ்ப் பகுதிக்கான பணிகள், முன்னதாக 2014ல் தொடங்கப்பட்ட வேறு சில திட்டங்களின் வளங்களைப் பயன்படுத்துகிறது.

‘காமன் டவுன்’ என்ற உள்ளூர் சிறிய, நடுத்தர நிறுவனத்துடன் இணைந்து இந்தப் பணிகள் மேற்கொள்ளப்படுகின்றன. இந்நிறுவனத்தின் இணையக் கற்றல் கட்டமைப்புடன் இந்தச் செயற்கை நுண்ணறிவுத் தொழில்நுட்பத்தை ஒருங்கிணைப்பதற்கான வேலைப்பாடுகளும் நடைபெற்று வருகின்றன.

இந்தத் தொழில்நுட்பத்தில் தமிழ்மொழிக்குரிய சில சவால்களைப் பற்றி இருவரும் விவரித்தனர்.

“ஆங்கிலத்தைக் காட்டிலும் அதிக எழுத்துகளும் கூட்டெழுத்துகளும் தமிழில் உள்ளன. அதனால் சொற்களிலும் வாக்கியங்களிலும் இடம்பெற்றுள்ள எழுத்துகளைக் கண்டுபிடிக்கும் ஆற்றலை இதில் ஏற்படுத்துவது சவாலாக இருந்தது.

“தமிழில் உள்ள 247 எழுத்துகளையும் கிரந்த எழுத்துகளையும் இணைக்க வேண்டும். அத்துடன், மாணவர்களின் வாசிப்பையும் கேட்டு இந்த எழுத்துகளை அடையாளம் காண வேண்டும்,” என்று தமிழாசிரியர், மொழிபெயர்ப்பாளர், நீதிமன்ற உரைபெயர்ப்பாளர் என தமிழ் சார்ந்த பல்வேறு பணிகளில் அனுபவம் பெற்றுள்ள திரு ராஜன் தெரிவித்தார்.

“இரண்டாவதாக, இந்தத் தொழில்நுட்பத்திற்குப் பயிற்சி கொடுப்பதற்காக பிள்ளைகளின் குரல்களைப் பயன்படுத்த வேண்டி இருந்தது. பிள்ளைகளின் குரல்கள், பெரியவர்களின் குரல்களைவிட உயர் ஸ்ருதியைக் கொண்டிருப்பதால் அவர்கள் பேசுவதைப் புரிந்துகொள்வது தொழில்நுட்பத்திற்கு இன்னும் சிரமமாக இருக்கும். சிங்கப்பூரில் பிள்ளைகளின் தமிழ்க் குரல்பதிவுகளை அதிக அளவில் திரட்டுவதும் சவாலாக இருந்தது,” என்று டாக்டர் சென் தெரிவித்தார்.

இதற்காக உமறுப்புலவர் தமிழ்மொழி நிலையம் மற்றும் தொடக்க, உயர்நிலைப் பள்ளிகளுக்குச் சென்று அங்குள்ள தமிழ் மாணவர்களின் குரல்பதிவுகளைச் சேகரித்தோம். மாணவர்களின் நேரத்திற்கு தகுந்தபடி ஒலிப்பதிவுகளைச் செய்வது, பள்ளிச் சூழலில் பதிவாகும் அந்த ஒலிப்பதிவுகள் தெளிவாக இருப்பதை உறுதி செய்வது போன்றவை சிரமமாக இருந்ததாக திரு ராஜன் விவரித்தார்.

“மூன்றாவதாக, ஆங்கிலத்தைவிட தமிழில் சொல்வளம் அதிகம். அதுவும் தொடர்ந்து பெருகி வருகிறது. ஆனால் இணையத்தில் எழுதப்படும் தமிழ்ப் படைப்புகள் குறைவாக இருப்பது இந்தச் செயற்கை நுண்ணறிவுத் தொழில்நுட்பக் கற்றலுக்கு சற்று சிரமத்தை ஏற்படுத்தியது. தமிழில் கூடுதல் படைப்புகள் இணையத்தில் வெளிவந்தால் வருங்காலத்தில் செயற்கை நுண்ணறிவுத் தொழில்நுட்பம் தமிழ் கற்பதை அவை சுலபமாக்கலாம்,” என்று டாக்டர் சென் கூறினார்.

இந்தத் தொழில்நுட்பம் தற்போது சிங்கப்பூரின் தரநிலைப்படுத்தப்பட்ட எழுத்துத் தமிழ் வாசிப்பைக் கேட்டு மதிப்பிடுவதாக திரு ராஜன் கூறினார்.

பேச்சுத் தமிழையும் தமிழகத்தைச் சேர்ந்த வட்டாரத் தமிழுக்குரிய பேச்சுத் தொனியையும் மிகவும் துல்லியமாக இந்தத் தொழில்நுட்பத்தால் தற்போது கண்டுபிடிக்க முடியாவிட்டாலும் வருங்காலத்தில் அவற்றையும் இத்தொழில்நுட்பம் கற்கலாம் என்று அவர் கூறினார்.

ஒருவிதத்தில் செயற்கை நுண்ணறிவு மனிதரைப் போன்றது என்றனர் இவர்கள்.

“செயற்கை நுண்ணறிவுக்கு கற்றல் வளங்கள் மிகவும் முக்கியம். ஒரு மொழியில் இரண்டு புத்தகங்களை மட்டும் படிப்பவரைக் காட்டிலும் 100 புத்தகங்களைப் படிப்பவரின் மொழியாற்றல் சிறப்பாக இருக்கும். அதேபோல செயற்கை நுண்ணறிவு தொடர்ந்து கற்கும்போது அதன் ஆற்றல் அதிகரிக்கும்,” என்றனர் இவர்கள்.

பொது அறிவிப்புகளில் ஏற்படும் எழுத்துப் பிழைகள் குறித்தும் இவர்கள் பகிர்ந்தனர். லத்தின் எழுத்துருக்கள் அல்லாத மொழிகளுக்கான நிரலிடுதல் சவாலானது என்பதால் தொழில்நுட்ப நிபுணர்கள், திரு ராஜன் போன்ற மொழியியல் நிபுணர்களுடன் கைகோத்து செயல்படுவது மிகவும் முக்கியம் என்று டாக்டர் சென் தெரிவித்தார்.

“தொழில்நுட்பத்தின் மேம்பாடு, சோதனை, பயன்பாடு ஆகிய மூன்று கட்டங்களுக்கு, குறிப்பாக இந்தக் கருவியின் ஆற்றலை ஆழமாக சோதிக்கும் ‘டியூரிங் டெஸ்ட்’ வழியாக தொழில்நுட்ப மாதிரிக்கு திரு ராஜன் போன்ற மொழியியல் நிபுணர்கள்தான் தரநிலையை விதிக்கவேண்டும்,” என்று டாக்டர் சென் கூறினார்.

மனிதர்களால் செய்யப்படும் மொழி தொடர்பிலான சோதனைகள் கடுமையாக இருந்தால் தொழில்நுட்பத்தில் தரத்தை உறுதி செய்யலாம் என்று திரு ராஜன் கூறினார்.

சிங்கப்பூரிலேயே தயாரிக்கப்படும் இணைய தமிழ்ப் படைப்புகள் வருங்கால செயற்கை நுண்ணறிவு கற்றலுக்கு அவசியம் என்பதால் உள்ளூர் தமிழ்ச் சமூகம் இணையத்தில் மேலும் அதிகமாக எழுதவேண்டும் என இவர்கள் கேட்டுக்கொண்டுள்ளனர்.

“பள்ளி மாணவர்கள் தாங்கள் எழுதும் கட்டுரை, கதைகளைப் பதிவேற்றம் செய்வது இதற்குப் பேருதவியாக இருக்கும்,” என்றனர் இவர்கள்.

 
 
Article Paywall 1
தடையற்ற சேவையைப் பெற, சந்தாதாரராகுங்கள்.
தொடக்க சலுகை - தனிநபர் பயன்பாட்டுக்கு $4.90 மட்டுமே!
 
 
 
 
நாங்கள் தரமான செய்திகளை வழங்கவும் இந்த வட்டாரத்தில் தமிழ் வாசகர்களின் எண்ணிக்கையை அதிகரிக்கவும், நீங்கள் சந்தா சேர்வது உதவும்.
 
இன்னும் ஒரு செய்தியை இலவசமாக வாசிக்க
தடையற்ற சேவைக்கு சந்தாதாரராகுங்கள். TM Icon