செ.நு. தொடர் – 8 : எந்திரக் கற்றல்
‘சைபர் புத்தா’ வினோத் ஆறுமுகம்
மனிதர்கள் ஏன் சிந்திக்கிறார்கள்? அவர்கள் சிந்தனைக்கு முக்கியமான காரணம் என்ன? அவர்கள் தங்களைச் சுற்றி இருப்பதிலிருந்து கற்றுக் கொகிறார்கள். மொழியைக் கற்றுக் கொள்கிறார்கள். சமூகத்தைப் பற்றிக் கற்றுக் கொள்கிறார்கள். சமூகத்துடன் எப்படி தொடர்பு கொள்ள வேண்டும் என்று கற்றுக் கொள்கிறார்கள். அப்படி எந்திரங்களும் சிந்திக்க வேண்டும் என்றால் அவையும் தகவல்களிலிருந்து கற்றுக் கொள்ள வேண்டும். இந்தத் துறையைத் தான் எந்திரக் கற்றல் (Machine Learning) துறை என அழைக்கிறார்கள்.
ஆனால், இதில் ஒரு சிக்கல் என்னவென்றால், மனிதர்கள் எப்படி கற்றுக் கொள்கிறார்களோ அதே போல எந்திரங்கள் கற்றுக் கொள்வதில்லை. மாறாக இங்குக் கொடுக்கப்படும் தகவல்களில் இருந்து சில லேபிள்களைத் தான் எந்திரங்கள் கற்றுக் கொள்கின்றன.
இப்போது ஓர் எந்திரத்திடம் நீங்கள் காட்டும் ஒளிப்படம் நாய்க்குட்டியா அல்லது யானைக் குட்டியா என்று கண்டுபிடிக்கக் கற்றுக் கொடுக்க வேண்டும் என்று வைத்துக் கொள்ளுங்கள். முதலில் அந்த ஒளிப்படங்களுக்கு மனிதர்கள் லேபிள் செய்வார்கள். ‘இது மூக்கு, இது காது, இது தும்பிக்கை’ என்று. மூக்கு சிறிதாக இருந்தால் அது நாய்க்குட்டி, மூக்கு பெரிதாக இருந்தால் அது யானைக் குட்டி என்று இரு ஒளிப்படங்களில் உள்ள தகவல்களை எல்லாம் முன்பே மனிதர்கள் லேபிள் செய்து வைத்து விடுவார்கள். இந்த ஒளிப்படங்களையும் லேபிள்களையும் நீங்கள் கணினிக்கு உள்ளிட (Input) வேண்டும்.
என்ன, இப்படி இரண்டு ஒளிப்படங்களை உள்ளிட்டால் கணினி கற்றுக் கொள்ளுமா என நீங்கள் கேட்கலாம்?
இல்லை இப்படியாக ஒரு பத்தாயிரம் ஒளிப்படங்களை யாவது உள்ளிட வேண்டும். நீங்கள் எத்தனை ஆயிரம் ஒளிப்படங்களை அதிகமாக உள்ளிடுகிறீர்களோ அந்த அளவிற்கு ஓரளவு எந்திரங்கள் சரியான விடையை அளிக்கும். நினைவில் வைத்துக் கொள்ளுங்கள். அதற்கு முன்பு அத்தனை புகைப்படங்களையும் மனிதர்கள் லேபிள் செய்து வைத்திருக்க வேண்டும். வருங்காலத்தில் கணினிகளுக்குக் கற்றுக் கொடுக்க உதவும் இந்தப் பணி கூட வந்துவிடும்.
நீங்கள் உள்ளிடும் ஆயிரக்கணக்கான ஒளிப்படங்களில் லேபிள்களில் இருந்து கணிதத்தின் உதவியுடன் அந்த அல்காரிதங்கள் தகவல்களைப் பிரித்தெடுத்து, பகுப்பாய்வு செய்து, தான் கற்றுக் கொண்ட பதிலை உங்களுக்குச் சொல்லும். அந்தப் பதில் சரியா தவறா என்று மீண்டும் கணினிக்கு நீங்கள் சொல்ல வேண்டும்.
சரியா தவறா என்பதிலிருந்து கணினி மீண்டும் தன் அல்காரிதங்களை ‘அட்ஜஸ்ட்’ செய்து கொள்ளும். மீண்டும் ஒளிப்படங்களைப் பிரித்து பகுத்தாய்ந்து கற்றுக் கொள்ள முடியும். சரியான விடையைச் சொல்லும் வரை கணினி இந்த வழிமுறைகளை மீண்டும் மீண்டும் செய்யும். இப்படியாக ஆயிரக்கணக்கான ஒளிப்படங்களைக் கொடுத்து ஒரு கணினிக்கு எது நாய்க்குட்டி எது யானைக் குட்டி என்பதை ஓரளவு நீங்கள் கற்றுக் கொடுத்து விட முடியும்.
இந்த உதாரணத்தை வைத்துக் கொண்டே கணினிக்கு ஒளிப்படங்கள் மற்றும் மனிதர்கள் கொடுக்கும் லேபிள்களின் உதவியுடன் பல தகவல் அல்லது செய்திகளைக் கற்றுக் கொடுக்கலாம். அப்படி கற்றுக் கொடுப்பதில் உள்ள நன்மை தீமைகளைப் பற்றி அடுத்த இதழில் பார்ப்போம்.<