தமிழ் முரசின் இனிய தீபாவளி நல்வாழ்த்துகள்!
தீபாவளி தொடர்பான செய்திகள், காணொளிகளுக்கு!

மொழி வளத்தைப் பேண செயற்கை நுண்ணறிவை நாடும் இந்தியா

2 mins read
dd36e6d1-d814-42dd-a73b-7d6542e459f6
காசநோய்க்கான நாட்டின் முதல் செயற்கை நுண்ணறிவு அடிப்படையிலான ‘சாட்போட்’டை உருவாக்கும் திட்டத்தின் ஒரு பகுதியாக, இந்திய மாநிலமான கர்நாடகாவில் உள்ள கிராமவாசிகள், தங்கள் தாய்மொழியான கன்னடத்தில் ஏராளமான வாக்கியங்களை ஒரு செயலியில் வாசித்தனர். - படம்: ராய்ட்டர்ஸ்

பெங்களூரு: காசநோய் விழிப்புணர்வுக்கான இந்தியாவின் முதல் செயற்கை நுண்ணறிவு அடிப்படையிலான ‘சாட்போட்’டை உருவாக்கும் திட்டத்தின் ஒரு பகுதியாக கர்நாடகாவில் உள்ள கிராம மக்கள் கன்னட மொழியில் காசநோய் குறித்து பல வாக்கியங்களை ஒரு செயலியில் வாசித்தனர்.

இந்தியாவின் 40 மில்லியனுக்கும் அதிகமானவர்கள் கன்னட மொழி பேசுபவர்கள். கன்னடம் நாட்டின் 22 அதிகாரத்துவ மொழிகளில் ஒன்று. உலகின் அதிக மக்கள் தொகை கொண்ட நாட்டில் 10,000 அல்லது அதற்கும் அதிகமானோர்களால் பேசப்படும் 121க்கும் மேற்பட்ட மொழிகளில் கன்னடமும் ஒன்றாகும்.

எனினும், பேச்சையும் எழுத்தையும் கணினி புரிந்துகொள்ள உதவும் செயற்கை நுண்ணறிவின் ஒரு பகுதியான இயற்கை மொழி செயலாக்கத்தில் இவற்றில் சில மொழிகளே உள்ளடக்கப்பட்டுள்ளன.

இதனால், கோடிக்கணக்கான இந்தியர்கள் பயனுள்ள தகவல்களையும் பல பொருளியல் வாய்ப்புகளையும் பெறத் தவறிவிடுகின்றனர்.

“அனைவருக்கும் செயற்கை நுண்ணறிவு கருவிகள் பயனளிக்க, ஆங்கிலம், பிரஞ்சு, ஸ்பானிஷ் மொழி பேசாதவர்களையும் அவை உள்ளடக்க வேண்டும்,” என்று மைக்ரோசாஃப்ட் ரிசர்ச் இந்தியா நிறுவனத்தின் முதன்மை ஆய்வாளர் திருவாட்டி காளிகா பாலி கூறினார்.

“ஆனால், ஜிபிடி போன்ற பெரியளவிலான மொழி மாதிரியைப் போல இந்திய மொழிகளில் தரவுகளைச் சேகரிக்க வேண்டுமானால் இன்னும் 10 ஆண்டுகள் காத்திருக்க வேண்டும். எனவே, சாட்ஜிபிடி அல்லது லாமா போன்ற செயற்கை நுண்ணறிவு தளங்களில் மேல் அடுக்குகளை உருவாக்க வேண்டும், ” என்று திருவாட்டி பாலி தாம்சன் ராய்ட்டர்ஸ் அறநிறுவனத்திடம் தெரிவித்தார்.

தொழில்நுட்ப நிறுவனமான கார்யாவிற்கான பல்வேறு இந்திய மொழிகளின் மொழி தரவை உருவாக்கும் ஆயிரக்கணக்கானோரில் கர்நாடகாவிலுள்ள கிராம மக்களும் அடங்குவர். மைக்ரோசாஃப்ட், கூகல் போன்ற நிறுவனங்களுக்கு செயற்கை நுண்ணறிவுத் தளங்களுக்கு கல்வி, சுகாதாரம் மற்றும் பிற சேவைகளுக்கான தரவுத் தொகுப்புகளை இந்நிறுவனம் உருவாக்குகிறது.

மின்னிலக்க முறையில் அதிக சேவைகளை வழங்குவதை நோக்கமாகக் கொண்ட இந்திய அரசாங்கம், செயற்கை நுண்ணறிவு அடிப்படையில் மொழிபெயர்க்கும் தளமான பாஷினி மூலம் மொழி தரவுத்தொகுப்புகளை உருவாக்குகிறது.

பல்லாயிரக்கணக்கான இந்தியர்கள் பாஷினிக்கு பங்களித்துள்ளனர்.

குறிப்புச் சொற்கள்