முகமது டெர்ரி ஜாக்
எந்த ஒரு சூழ்நிலையிலும் என்ன செய்ய வேண்டும் (அதாவது எந்த நடவடிக்கை எடுக்க வேண்டும்) என்பதைச் சொல்லும் கொள்கை ஒரு ரோபோவின் இதயத்தில் உள்ளது. இது எளிய விதிகளின் தொகுப்பாகவோ அல்லது சிக்கலான கணிதச் செயல்பாடாகவோ இருக்கலாம். ஆனால் விதிகள் அல்லது கணித செயல்பாடு எப்படி இருக்க வேண்டும் என்று உங்களுக்கு எப்படி தெரியும்? அதிர்ஷ்டவசமாக, செயல்பாட்டை தோராயமாக மதிப்பிடுவதற்கு இயந்திர கற்றல் வழிமுறைகள் உள்ளன (எ.கா. கர்னல் இயந்திரங்கள், ஆழமான கற்றல் போன்றவை) அல்லது இந்த விதிகளை தானாகவே ஊகிக்க (எ.கா. தூண்டல் தர்க்க நிரலாக்கம், சீரற்ற காடுகள் போன்றவை). இருப்பினும், மேற்பார்வையிடப்பட்ட கற்றல் அல்காரிதம்களுக்கு நிறைய பயிற்சி தரவுகள் தேவைப்படாமல் இருக்கலாம். பரிணாம முறைகள் (எ.கா. மரபியல் வழிமுறைகள்) மற்றும் பிற தேர்வுமுறை அல்காரிதம்கள் ஒரு கொள்கை-வெளியில் மதிப்பீடு செய்வதற்கும் தேடுவதற்கும் உகந்த விதிகள் அல்லது செயல்பாட்டைக் கண்டறிவதற்கும் எந்த பயிற்சித் தரவும் தேவையில்லை. மாற்றாக, வலுவூட்டல் கற்றலில் செய்யப்படுவது போல், கொள்கையை நேரடியாக தேடலுக்கு (நிலை/செயல்-நிலை இடைவெளி மூலம்) சமன் செய்வதன் மூலம், கற்ற மதிப்பீட்டுச் செயல்பாட்டைப் பயன்படுத்தி (எ.கா. V அல்லது Q-செயல்பாடு) அடுத்த சிறந்த செயலைக் காணலாம்.