- தரவு வரம்புகள், டிகோடிங் மற்றும் அடிப்படை இல்லாமை காரணமாக மாயத்தோற்றங்கள் நம்பத்தகுந்தவை ஆனால் தவறான வெளியீடுகள்.
- பத்திரிகை, மருத்துவம், சட்டம் மற்றும் கல்வி ஆகியவற்றில் உண்மையான வழக்குகள் (பார்ட், சிட்னி, கேலக்டிகா, முடிசூட்டு விழா) மற்றும் அபாயங்கள் உள்ளன.
- தரமான தரவு, சரிபார்ப்பு, மனித கருத்து, எச்சரிக்கைகள் மற்றும் விளக்கமளிக்கும் தன்மை மூலம் அவை குறைக்கப்படுகின்றன.

சமீபத்திய ஆண்டுகளில், செயற்கை நுண்ணறிவு, உட்பட சமீபத்திய தலைமுறை மாதிரிகள், கோட்பாட்டிலிருந்து அன்றாட வாழ்க்கைக்கு நகர்ந்துள்ளது, அதனுடன், அமைதியாகப் புரிந்து கொள்ள வேண்டிய நிகழ்வுகள் உருவாகியுள்ளன. அவற்றில், என்று அழைக்கப்படுபவை IA பிரமைகள், ஜெனரேட்டிவ் மாடல்களில் அடிக்கடி நிகழும், தொடர்ச்சியான உரையாடலாக மாறிவிட்டது, ஏனெனில் அவை ஒரு தானியங்கி பதிலை நாம் எப்போது நம்பலாம் - நம்பக்கூடாது - என்பதை தீர்மானிக்கின்றன.
ஒரு அமைப்பு நம்பத்தகுந்த ஆனால் துல்லியமற்ற, ஜோடிக்கப்பட்ட அல்லது ஆதாரமற்ற உள்ளடக்கத்தை உருவாக்கும் போது, நாம் மாயத்தோற்றங்களைப் பற்றிப் பேசுகிறோம். இந்த வெளியீடுகள் கற்பனையானவை அல்ல: அவை மாதிரிகள் எவ்வாறு கற்றுக்கொள்கின்றன மற்றும் டிகோட் செய்கின்றன, அவர்கள் பார்த்த தரவின் தரம் மற்றும் நிஜ உலகில் தரையிறங்கும் அறிவில் அவர்களின் சொந்த வரம்புகள்.
IA மாயத்தோற்றங்கள் என்றால் என்ன?
ஜெனரேட்டிவ் AI துறையில், ஒரு மாயத்தோற்றம் என்பது ஒரு வெளிப்பாடாகும், அது திடமாகத் தோன்றினாலும், உண்மையான தரவுகளால் ஆதரிக்கப்படவில்லை. அல்லது செல்லுபடியாகும் பயிற்சி முறைகளில். சில நேரங்களில் மாதிரி "இடைவெளிகளை நிரப்புகிறது", மற்ற நேரங்களில் அது மோசமாக டிகோட் செய்கிறது, மேலும், பெரும்பாலும், அது எந்த அடையாளம் காணக்கூடிய வடிவத்தையும் பின்பற்றாத தகவலை உருவாக்குகிறது.
இந்த சொல் உருவகமானது: இயந்திரங்கள் நம்மைப் போல "பார்ப்பதில்லை", ஆனால் படம் பொருந்துகிறது. ஒரு நபர் பார்க்க முடியும் என்பது போல மேகங்களில் உருவங்கள், ஒரு மாதிரி வடிவங்கள் இல்லாத இடங்களில், குறிப்பாக பட அங்கீகாரப் பணிகள் அல்லது மிகவும் சிக்கலான உரையை உருவாக்குவதில்.
சிறந்த மொழி மாதிரிகள் (எல்எல்எம்) பெரிய நிறுவனங்களில் உள்ள ஒழுங்குமுறைகளை அடையாளம் கண்டு, அடுத்த வார்த்தையை கணிப்பதன் மூலம் கற்றுக்கொள்ளுங்கள். இது ஒரு மிகவும் சக்திவாய்ந்த தானியங்குநிரப்புதல், ஆனால் அது இன்னும் தானாக நிரப்பப்படுகிறது: தரவு சத்தமாகவோ அல்லது முழுமையடையாமலோ இருந்தால், அது நம்பத்தகுந்ததாகவும், அதே நேரத்தில், தவறான வெளியீடுகளையும் உருவாக்கக்கூடும்.
மேலும், இந்தக் கற்றலை ஊட்டும் வலையில் பொய்கள் உள்ளன. அமைப்புகள் தாங்களாகவே மீண்டும் மீண்டும் "கற்றுக்கொள்கின்றன" இருக்கும் பிழைகள் மற்றும் சார்புகள், மேலும் சில சமயங்களில் அவர்கள் நேரடியாக மேற்கோள்கள், இணைப்புகள் அல்லது விவரங்களை ஒருபோதும் இல்லாத வகையில் கண்டுபிடித்து, ஏமாற்றும் ஒரு ஒத்திசைவுடன் வழங்குகிறார்கள்.
அவை ஏன் ஏற்படுகின்றன: மாயத்தோற்றங்களுக்கான காரணங்கள்
எந்த ஒரு காரணமும் இல்லை. மிகவும் பொதுவான காரணிகளில் ஒன்று பயிற்சித் தரவில் சார்பு அல்லது துல்லியமின்மைகார்பஸ் முழுமையடையாமல் அல்லது மோசமாக சமநிலையில் இருந்தால், மாதிரி தவறான வடிவங்களைக் கற்றுக்கொள்கிறது, பின்னர் அது அதை எக்ஸ்ட்ராபோலேட் செய்கிறது.
இது மேலும் பாதிக்கிறது அதிகப்படியான பொருத்தம்ஒரு மாதிரி அதன் தரவுகளுடன் அதிகமாகப் பிணைக்கப்படும்போது, அது அதன் பொதுமைப்படுத்தும் திறனை இழக்கிறது. நிஜ வாழ்க்கை சூழ்நிலைகளில், இந்த விறைப்பு தவறான விளக்கங்களுக்கு வழிவகுக்கும், ஏனெனில் அது கற்றுக்கொண்டதை வெவ்வேறு சூழல்களுக்குள் "கட்டாயப்படுத்துகிறது".
La மாதிரி சிக்கலானது மற்றும் மின்மாற்றியின் சொந்த டிகோடிங் ஒரு பாத்திரத்தை வகிக்கிறது. பதில் டோக்கன் மூலம் டோக்கன் எவ்வாறு கட்டமைக்கப்படுகிறது என்பதன் காரணமாக, அதை நங்கூரமிட ஒரு உறுதியான உண்மை அடிப்படை இல்லாமல், வெளியீடு "தண்டவாளங்களை விட்டு வெளியேறும்" சந்தர்ப்பங்கள் உள்ளன.
IA மாயத்தோற்றங்களுக்கு மற்றொரு முக்கிய காரணம், பற்றாக்குறை ஆகும் தரையிறக்கம்இந்த அமைப்பு அதை நிஜ உலக அறிவு அல்லது சரிபார்க்கப்பட்ட ஆதாரங்களுடன் ஒப்பிடவில்லை என்றால், அது நம்பத்தகுந்த ஆனால் தவறான உள்ளடக்கத்தை உருவாக்கக்கூடும்: சுருக்கங்களில் புனையப்பட்ட விவரங்கள் முதல் ஒருபோதும் இல்லாத பக்கங்களுக்கான இணைப்புகள் வரை.
கணினி பார்வையில் ஒரு சிறந்த எடுத்துக்காட்டு: கட்டி செல்களின் படங்களுடன் ஒரு மாதிரியைப் பயிற்றுவித்தால், ஆனால் ஆரோக்கியமான திசுக்களை சேர்க்கவில்லை என்றால், அமைப்பு "பார்க்க"க்கூடும். புற்றுநோய் இல்லாத இடத்தில், ஏனெனில் அவர்களின் கற்றல் பிரபஞ்சத்தில் மாற்று வகுப்பு இல்லை.
பிரச்சனையை விளக்கும் AI மாயத்தோற்றங்களின் உண்மையான வழக்குகள்
பிரபலமான உதாரணங்கள் உள்ளன. அதன் வெளியீட்டு விழாவில், கூகிளின் பார்ட் சாட்பாட் கூறியது ஜேம்ஸ் வெப் விண்வெளி தொலைநோக்கி ஒரு புறக்கோளின் முதல் படங்களை எடுத்திருந்தார், அது சரியானதல்ல. பதில் நன்றாக இருந்தது, ஆனால் அது தவறானது.
மைக்ரோசாப்டின் உரையாடல் AI, அதன் சோதனைகளில் சிட்னி என்று அழைக்கப்படுகிறது, பயனர்களை "காதலிப்பதாக" அறிவித்து, பரிந்துரைப்பதன் மூலம் தலைப்புச் செய்திகளை உருவாக்கியது பொருத்தமற்ற நடத்தை, பிங் ஊழியர்களை உளவு பார்த்ததாகக் கூறப்படுவது போன்றவை. இவை உண்மைகள் அல்ல, அவை எல்லைகளைக் கடந்த உருவாக்கப்பட்ட வெளியீடுகள்.
2022 ஆம் ஆண்டில், பயனர்களுக்கு தகவல்களை வழங்கிய பிறகு, மெட்டா அதன் கேலக்டிகா மாதிரியின் டெமோவை திரும்பப் பெற்றது. தவறான மற்றும் பாரபட்சமானஇந்த டெமோ அறிவியல் திறன்களை நிரூபிக்கும் நோக்கம் கொண்டது, ஆனால் இறுதியில் முறையான ஒத்திசைவு உண்மைத்தன்மைக்கு உத்தரவாதம் அளிக்காது என்பதை நிரூபித்தது.
சார்லஸ் III இன் முடிசூட்டு விழாவின் சுருக்கம் கேட்கப்பட்டபோது ChatGPT உடன் மற்றொரு கல்வி நிகழ்வு நிகழ்ந்தது. அந்த விழா நடைபெற்றதாக அமைப்பு கூறியது மே 9 இன் செவ்வாய் வெஸ்ட்மின்ஸ்டர் அபேயில், உண்மையில் அது மே 6 அன்று. பதில் தெளிவற்றதாக இருந்தது, ஆனால் தகவல் தவறாக இருந்தது.
OpenAI, GPT‑4 இன் வரம்புகளை ஒப்புக்கொண்டுள்ளது — எடுத்துக்காட்டாக சமூக தப்பெண்ணங்கள், பிரமைகள் மற்றும் அறிவுறுத்தல் மோதல்கள் - மேலும் அவற்றைத் தணிக்க இது செயல்படுவதாகக் கூறுகிறது. சமீபத்திய தலைமுறை மாதிரிகள் கூட நழுவக்கூடும் என்பதை இது நினைவூட்டுகிறது.
IA மாயத்தோற்றங்களைப் பொறுத்தவரை, ஒரு சுயாதீன ஆய்வகம் வினோதமான நடத்தைகளைப் புகாரளித்தது: ஒரு சந்தர்ப்பத்தில், O3 கூட இருப்பதை விவரித்தது மேக்புக் ப்ரோவில் செயல்படுத்தப்பட்ட குறியீடு அரட்டை சூழலுக்கு வெளியே, பின்னர் முடிவுகளை நகலெடுத்தால், நீங்கள் செய்ய முடியாத ஒன்று.
ஆய்வகத்திற்கு வெளியே பின்விளைவுகளுடன் பின்னடைவுகள் ஏற்பட்டுள்ளன: ஒரு வழக்கறிஞர் ஒரு மாதிரியால் உருவாக்கப்பட்ட ஆவணங்களை ஒரு நீதிபதியிடம் வழங்கினார், அது கற்பனையான சட்ட வழக்குகள் அடங்கும்உண்மையின் தோற்றம் ஏமாற்றுவதாக இருந்தது, ஆனால் உள்ளடக்கம் இல்லை.
மாதிரிகள் எவ்வாறு செயல்படுகின்றன: பெரிய அளவிலான தானியங்குநிரப்புதல்
ஒரு எல்.எல்.எம்., அதிக அளவிலான உரைகளிலிருந்து கற்றுக்கொள்கிறது, அதன் முக்கிய பணி அடுத்த வார்த்தையை யூகிக்கவும்.இது மனிதனைப் போல பகுத்தறிவதில்லை: இது நிகழ்தகவுகளை மேம்படுத்துகிறது. இந்த வழிமுறை ஒருங்கிணைந்த உரையை உருவாக்குகிறது, ஆனால் இது விவரங்களைக் கண்டுபிடிப்பதற்கான கதவைத் திறக்கிறது.
சூழல் தெளிவற்றதாக இருந்தால் அல்லது அறிவுறுத்தல் ஆதரவு இல்லாமல் ஏதாவது ஒன்றை பரிந்துரைத்தால், மாதிரி மிகவும் நம்பத்தகுந்ததை நிரப்பவும். உங்கள் அளவுருக்களின்படி. முடிவு நன்றாகத் தோன்றலாம், ஆனால் அது சரிபார்க்கக்கூடிய, உண்மையான உண்மைகளை அடிப்படையாகக் கொண்டிருக்காமல் இருக்கலாம்.
சுருக்க ஜெனரேட்டர் ஏன் சேர்க்க முடியும் என்பதை இது விளக்குகிறது மூலப் பிரதியில் இல்லாத தகவல்கள் அல்லது தவறான மேற்கோள்கள் மற்றும் குறிப்புகள் ஏன் தோன்றுகின்றன: ஆவணம் இருக்கிறதா என்று சரிபார்க்காமல் அமைப்பு மேற்கோள் வடிவங்களை விரிவாக்குகிறது.
இமேஜிங்கிலும் இதேபோன்ற ஒன்று நிகழ்கிறது: போதுமான பன்முகத்தன்மை இல்லாமல் அல்லது தரவுத்தொகுப்பில் சார்புகளுடன், மாதிரிகள் உருவாக்க முடியும் ஆறு விரல்கள் கொண்ட கைகள், படிக்க முடியாத உரை அல்லது பொருத்தமற்ற தளவமைப்புகள். காட்சி தொடரியல் பொருந்துகிறது, ஆனால் உள்ளடக்கம் தோல்வியடைகிறது.
நிஜ வாழ்க்கை அபாயங்கள் மற்றும் தாக்கங்கள்
பத்திரிகை மற்றும் தவறான தகவல்களில், இரண்டாம் நிலை நெட்வொர்க்குகள் மற்றும் ஊடகங்களில் ஒரு நம்பத்தகுந்த மாயை பெருக்கப்படலாம். நம்பத்தகுந்ததாகத் தோன்றும் ஒரு ஜோடிக்கப்பட்ட தலைப்பு அல்லது உண்மை. வேகமாகப் பரவக்கூடும், அடுத்தடுத்த திருத்தத்தை சிக்கலாக்குகிறது.
மருத்துவத் துறையில், மோசமாக அளவீடு செய்யப்பட்ட அமைப்பு விளக்கங்களுக்கு வழிவகுக்கும் ஆரோக்கியத்திற்கு ஆபத்தானது, நோயறிதல்கள் முதல் பரிந்துரைகள் வரை. விவேகத்தின் கொள்கை இங்கே விருப்பமானது அல்ல.
சட்ட ரீதியாக, மாதிரிகள் பயனுள்ள வரைவுகளை உருவாக்கலாம், ஆனால் செருகவும் செய்யலாம் இல்லாத நீதித்துறை அல்லது மோசமாக கட்டமைக்கப்பட்ட மேற்கோள்கள். ஒரு தவறு ஒரு செயல்முறைக்கு கடுமையான விளைவுகளை ஏற்படுத்தும்.
கல்வியில், சுருக்கங்கள் அல்லது தானியங்கி பதில்களை குருட்டுத்தனமாக நம்பியிருப்பது நிலைத்திருக்கும். கருத்தியல் பிழைகள்மேற்பார்வை மற்றும் சரிபார்ப்பு இருக்கும் வரை, இந்தக் கருவி கற்றலுக்கு மதிப்புமிக்கது.
தணிப்பு உத்திகள்: என்ன செய்யப்படுகிறது மற்றும் நீங்கள் என்ன செய்ய முடியும்
AI மாயத்தோற்றங்களைத் தவிர்க்க முடியுமா அல்லது குறைந்தபட்சம் குறைக்க முடியுமா? டெவலப்பர்கள் பல அடுக்குகளில் வேலை செய்கிறார்கள்.
முதலாவது ஒன்று தரவு தரத்தை மேம்படுத்துதல்: மூலங்களை சமநிலைப்படுத்துதல், பிழைகளை பிழைதிருத்தம் செய்தல் மற்றும் மாயத்தோற்றங்களை ஊக்குவிக்கும் சார்புகள் மற்றும் இடைவெளிகளைக் குறைக்க கார்போராவைப் புதுப்பித்தல். இதனுடன் சேர்க்கப்பட்ட அமைப்புகள் உண்மை சரிபார்ப்பு (உண்மை சரிபார்ப்பு) மற்றும் ஆக்மென்டட் மீட்பு அணுகுமுறைகள் (ARA), இவை மாதிரியை பதில்களை "கற்பனை" செய்வதற்குப் பதிலாக நம்பகமான ஆவண அடிப்படைகளை நம்பியிருக்க கட்டாயப்படுத்துகின்றன.
உடன் சரிசெய்தல் மனித கருத்து (RLHF மற்றும் பிற வகைகள்) தீங்கு விளைவிக்கும், சார்புடைய அல்லது தவறான வெளியீடுகளைத் தண்டிப்பதற்கும், மாதிரியை மிகவும் எச்சரிக்கையான பதில் பாணிகளில் பயிற்றுவிப்பதற்கும் முக்கியமாக உள்ளது. அவை பெருகும் நம்பகத்தன்மை எச்சரிக்கைகள் இடைமுகங்களில், பதிலில் பிழைகள் இருக்கலாம் என்பதையும், அதைச் சரிபார்ப்பது அவர்களின் பொறுப்பு என்பதையும் பயனருக்கு நினைவூட்டுகிறது, குறிப்பாக உணர்திறன் சூழல்களில்.
நடந்து கொண்டிருக்கும் மற்றொரு முன்னணி, பொருள் விளக்கம்ஒரு அமைப்பு ஒரு கூற்றின் தோற்றத்தை அல்லது ஆதாரங்களுக்கான இணைப்பை விளக்க முடிந்தால், அதை நம்புவதற்கு முன்பு அதன் உண்மைத்தன்மையை மதிப்பிடுவதற்கு பயனருக்கு கூடுதல் கருவிகள் உள்ளன. பயனர்கள் மற்றும் வணிகங்களுக்கு, சில எளிய நடைமுறைகள் ஒரு வித்தியாசத்தை ஏற்படுத்துகின்றன: தரவைச் சரிபார்த்தல், கேட்பது வெளிப்படையான ஆதாரங்கள், அதிக ஆபத்துள்ள பகுதிகளில் பயன்பாட்டைக் கட்டுப்படுத்துங்கள், மனிதர்களை "சுழலில்" வைத்திருங்கள் மற்றும் ஆவண மதிப்பாய்வு ஓட்டங்கள்.
உற்பத்தியாளர்களிடமிருந்து அறியப்பட்ட வரம்புகள் மற்றும் எச்சரிக்கைகள்
மாதிரிகளுக்குப் பொறுப்பான நிறுவனங்கள் வரம்புகளை அங்கீகரிக்கின்றன. GPT-4 விஷயத்தில், அவை வெளிப்படையாக சுட்டிக்காட்டப்பட்டுள்ளன. ஒருதலைப்பட்சங்கள், பிரமைகள் மற்றும் செயலில் உள்ள பணிப் பகுதிகள் குறித்த முரண்பாடான அறிகுறிகள்.
நுகர்வோர் சாட்போட்களில் உள்ள பல ஆரம்ப சிக்கல்கள் மறு செய்கைகளால் குறைக்கப்பட்டது, ஆனால் சிறந்த சூழ்நிலைகளில் கூட, விரும்பத்தகாத விளைவுகள் ஏற்படலாம். பிட்ச் எவ்வளவு உறுதியானது என்றால், அதிக தன்னம்பிக்கை ஏற்படும் அபாயம் அதிகமாகும்.
இந்தக் காரணத்தினால், பெரும்பாலான நிறுவனத் தொடர்புகள் இந்தக் கருவிகளைப் பயன்படுத்த வேண்டாம் என்று வலியுறுத்துகின்றன மருத்துவ அல்லது சட்ட ஆலோசனை நிபுணர் மதிப்பாய்வு இல்லாமல், மேலும் அவை நிகழ்தகவு உதவியாளர்கள், தவறில்லாத தீர்க்கதரிசிகள் அல்ல.
மாயத்தோற்றத்தின் மிகவும் பொதுவான வடிவங்கள்
IA மாயத்தோற்றங்கள் வெளிப்படும் மிகவும் பொதுவான வழி இதுதான்:
- உரையில், பார்ப்பது பொதுவானது மேற்கோள்கள் மற்றும் நூல் பட்டியல்களைக் கண்டுபிடித்தார்.இந்த மாதிரி ஒரு குறிப்பின் "அச்சு"யை நகலெடுக்கிறது, ஆனால் நம்பத்தகுந்த ஆசிரியர்கள், தேதிகள் அல்லது தலைப்புகளைக் கண்டுபிடிக்கிறது.
- கற்பனையான அல்லது கற்பனையான நிகழ்வுகளும் தோன்றும். தவறான தேதிகள் வரலாற்று காலவரிசைகளில். மூன்றாம் சார்லஸின் முடிசூட்டு விழாவின் நிகழ்வு, உரைநடை அதன் திரவத்தன்மையை இழக்காமல் ஒரு தற்காலிக விவரத்தை எவ்வாறு சிதைக்க முடியும் என்பதை விளக்குகிறது.
- படத்தில், கிளாசிக் கலைப்பொருட்கள் அடங்கும் சாத்தியமற்ற உடற்கூறியல் கொண்ட கைகால்கள், படத்திற்குள் படிக்க முடியாத உரைகள் அல்லது முதல் பார்வையில் கவனிக்கப்படாமல் போகும் இடஞ்சார்ந்த முரண்பாடுகள்.
- மொழிபெயர்ப்பில், அமைப்புகள் வாக்கியங்களைக் கண்டுபிடி மிகவும் உள்ளூர் அல்லது அசாதாரண வெளிப்பாடுகளை எதிர்கொள்ளும்போது, அல்லது இலக்கு மொழியில் இல்லாத சமன்பாடுகளை கட்டாயப்படுத்தும்போது.
IA மாயத்தோற்றங்கள் ஒரு தனிமைப்படுத்தப்பட்ட தோல்வி அல்ல, ஆனால் ஒரு வெளிப்படும் பண்பு அபூரண தரவுகளுடன் பயிற்சியளிக்கப்பட்ட நிகழ்தகவு அமைப்புகள். அதன் காரணங்களை அங்கீகரிப்பது, நிஜ வாழ்க்கை நிகழ்வுகளிலிருந்து கற்றுக்கொள்வது மற்றும் தொழில்நுட்ப மற்றும் செயல்முறை தணிப்புகளைப் பயன்படுத்துவது, AI ஐ அர்த்தமுள்ள வழிகளில் பயன்படுத்த அனுமதிக்கிறது, அது எவ்வளவு திரவமாகத் தோன்றினாலும், ஒரு பதில் சரிபார்க்கக்கூடிய அடிப்படையைக் கொண்டிருந்தால் மட்டுமே நம்பிக்கைக்குத் தகுதியானது என்ற உண்மையை மறந்துவிடாமல்.
பல்வேறு டிஜிட்டல் மீடியாக்களில் பத்து வருடங்களுக்கும் மேலான அனுபவத்துடன் தொழில்நுட்பம் மற்றும் இணைய சிக்கல்களில் நிபுணத்துவம் பெற்ற ஆசிரியர். நான் ஈ-காமர்ஸ், கம்யூனிகேஷன், ஆன்லைன் மார்க்கெட்டிங் மற்றும் விளம்பர நிறுவனங்களுக்கு எடிட்டராகவும், உள்ளடக்கத்தை உருவாக்குபவராகவும் பணியாற்றியுள்ளேன். பொருளாதாரம், நிதி மற்றும் பிற துறைகளின் இணையதளங்களிலும் நான் எழுதியுள்ளேன். என் வேலையும் என் விருப்பம். இப்போது, என் கட்டுரைகள் மூலம் Tecnobits, நமது வாழ்க்கையை மேம்படுத்த தொழில்நுட்ப உலகம் ஒவ்வொரு நாளும் நமக்கு வழங்கும் அனைத்து செய்திகளையும் புதிய வாய்ப்புகளையும் ஆராய முயற்சிக்கிறேன்.