- GPT-4.5 သည် ပြန်လည်ပြင်ဆင်ထားသော Turing စမ်းသပ်မှုတွင် ပါဝင်သူများ၏ 73% ကို လူသားဖြစ်ကြောင်း ဆွဲဆောင်နိုင်ခဲ့သည်။
- စမ်းသပ်မှုတွင် AI ၏အောင်မြင်မှုသည် ညွှန်ကြားချက်များနှင့် "ကိုယ်ရည်ကိုယ်သွေး" ကို လက်ခံကျင့်သုံးမှုအပေါ်တွင် များစွာမူတည်ကြောင်း ထုတ်ဖော်ပြသခဲ့သည်။
- LLaMa-3.1 ကဲ့သို့သော အခြားသော မော်ဒယ်များသည် အောင်မြင်မှုနှုန်း နည်းပါးပြီး စိတ်ကြိုက်ပြင်ဆင်ခြင်းမရှိဘဲ ရလဒ်များ သိသိသာသာ ကျဆင်းသွားသည်။
- လေ့လာမှုသည် ဉာဏ်ရည်တု၏ လက်ရှိကန့်သတ်ချက်များနှင့် ၎င်း၏ တိုးမြင့်လာသော စကားပြောဆိုမှုဆိုင်ရာ လက်တွေ့ဆန်မှုနှင့် ဆက်စပ်သည့် အန္တရာယ်များအကြောင်း မေးခွန်းထုတ်သည်။

တကယ့်လူသားနဲ့ စကားပြောစက်ကို ခွဲခြားနိုင်ပါ့မလား။ Alan Turing မှ လွန်ခဲ့သော ဆယ်စုနှစ် ခုနစ်ခုကျော်က ပထမဆုံး ဖြေဆိုခဲ့သော အဆိုပါမေးခွန်းသည် စိန်ခေါ်မှုရှိသော အခြေအနေတွင် အဆင့်အမြင့်ဆုံး ဉာဏ်ရည်တုမော်ဒယ်များကို စမ်းသပ်ခဲ့သည့် မကြာသေးမီက စမ်းသပ်မှုတစ်ခုအပြီးတွင် အသစ်တဖန် ဆွဲဆောင်မှု ရရှိခဲ့သည်။
ကယ်လီဖိုးနီးယားတက္ကသိုလ်၊ San Diego မှ သုတေသီများက သုတေသနပြုလုပ်ခဲ့သည်။ လူသားနှင့် အတုအကြား ခွဲခြားသိမြင်နိုင်မှုကို စိန်ခေါ်သည့် လေ့လာမှုတစ်ခု။ဌ။ စမ်းသပ်မှုရဲ့ဗဟိုမှာ၊ GPT-4.5 မော်ဒယ် OpenAI သည် တိကျသောအခြေအနေများအောက်တွင် Turing Test ကို အောင်နိုင်ရုံသာမက၊ သူကိုယ်တိုင်က တကယ့်လူတွေထက် လူသားအဖြစ်တောင် မကြာခဏ သတ်မှတ်ခံရတယ်။
ပြင်းထန်သောအခြေအနေများအောက်တွင် စမ်းသပ်မှုတစ်ခု
သုတေသီ Cameron Jones နှင့် Benjamin Bergen ဦးဆောင်သော လေ့လာမှု၊ ဂန္ထဝင် Turing Test ၏ မွမ်းမံထားသော ဗားရှင်းကို အာရုံစိုက်ထားသည်။တက္ကသိုလ်ကျောင်းသားများနှင့် အွန်လိုင်းပလက်ဖောင်းအသုံးပြုသူများ အပါအဝင် လူ 300 ကျော် တက်ရောက်ခဲ့ကြသည်။ ငါးမိနစ်ကြာ ဆွေးနွေးပွဲများအတွင်း ပါဝင်သူတစ်ဦးစီသည် စကားဝိုင်းနှစ်ခုကို တစ်ပြိုင်နက် ပြုလုပ်ခဲ့သည်- တစ်ခုမှာ လူသားတစ်ဦးနှင့် ဉာဏ်ရည်တုစနစ်တစ်ခုပါရှိသည်။ အဆုံးသတ်မှာ, စကားဝိုင်းမှာ ဘယ်သူက လူသားဖြစ်တယ်ဆိုတာ သူတို့ ဆုံးဖြတ်ရမယ်။.
ရလဒ်က သိသိသာသာ GPT-4.5 မော်ဒယ်ကို ရောဂါဖြစ်ပွားမှု၏ 73% တွင် လူသားအဖြစ်မြင်သည်။ ဥပမာအားဖြင့်၊ ဒစ်ဂျစ်တယ်ယဉ်ကျေးမှုကို တတ်ကျွမ်းသော လူငယ်တစ်ဦး၏ သတ်မှတ်ထားသော ကိုယ်ရည်ကိုယ်သွေးကို ရရှိသောအခါ။ ဤရာခိုင်နှုန်းသည် စမ်းသပ်မှုအောင်မြင်ပြီးကြောင်း ထည့်သွင်းစဉ်းစားခြင်းအတွက် ကိန်းဂဏန်းအဆင့်ကို ကျော်လွန်ရုံသာမက ဤစမ်းသပ်မှုတွင် လူသားအစစ်အမှန်များ ပေါ်လာနိုင်သည့်စွမ်းရည်ကိုလည်း ကျော်လွန်နေပါသည်။ ဤချဉ်းကပ်နည်းသည် စိတ်ကူးကို အားဖြည့်ပေးသည်။ la အတုထောက်လှမ်းရေး မကြာသေးမီ ဆယ်စုနှစ်များအတွင်း တိုးတက်ပြောင်းလဲလာခဲ့သည်။
သို့သော်လည်း AI သည် တိကျသောကိုယ်ရည်ကိုယ်သွေးကို မပေးခဲ့ဘဲ နောက်ထပ်မနှိုးဆော်ဘဲ လူသားအသွင်ပေါ်လာစေရန် ခိုင်းစေသောအခါ ၎င်း၏ထိရောက်မှုမှာ ၃၆ ရာခိုင်နှုန်းအထိ ကျဆင်းသွားခဲ့သည်။ ဒါက မျဉ်းသားပါ။ အကြောင်းအရာ၏ အရေးပါမှုနှင့် လမ်းညွှန်ချက်များတွင် ပုဂ္ဂိုလ်ရေးသီးသန့်ပြုလုပ်ခြင်း။ ဘာသာစကားပုံစံများကို ပေးအပ်သည်။
မော်ဒယ်များနှင့် မျှော်လင့်မထားသောရလဒ်များကြား နှိုင်းယှဉ်ခြင်း။
GPT-4.5 နှင့်အတူ၊ စမ်းသပ်မှုတွင် အခြားသော မော်ဒယ်များ ပါဝင်သည်။ Meta ၏ LLaMa-3.1-405Bစိတ်ကူးယဉ်ကိုယ်ရည်ကိုယ်သွေးကိုလည်း ပံ့ပိုးပေးသည့်အခါ 56% တိကျမှုနှုန်းကို ရရှိခဲ့သည်။ ဤကိန်းဂဏန်းသည် GPT-4.5 ထက်နိမ့်သော်လည်း၊ ၎င်းသည် အခွင့်အလမ်းထက်သာလွန်နေသေးသည်။ ဆန့်ကျင်ဘက်အနေဖြင့်၊ 4 ခုနှစ်များမှ GPT-60o သို့မဟုတ် ဝါရင့် chatbot ELIZA ကဲ့သို့သော အခြားဗားရှင်းများသည် 21% နှင့် 23% အသီးသီးရှိကြပြီး လက်ရှိနှင့် ပဏာမနည်းပညာများအကြား ကွာဟချက်ကို ရှင်းလင်းစေသည်။
ဤရလဒ်များ Turing Test ကဲ့သို့သော အလုပ်တစ်ခုတွင် AI ၏အောင်မြင်မှုသည် မော်ဒယ်ကိုယ်တိုင်ထက် ၎င်းကို မည်ကဲ့သို့ ညွှန်ကြားသည်ဆိုသည့်အပေါ် များစွာပိုမူတည်ကြောင်းပြသပါ။. သော့ချက်မှာ လူသားဉာဏ်ရည်ဉာဏ်သွေးကို အသိစိတ်ရှိရှိ အတုယူရန်မဟုတ်ဘဲ ယုံကြည်ရလောက်သော အခန်းကဏ္ဍကို ချမှတ်ရန်ဖြစ်သည်။ မည်ကဲ့သို့ နက်နက်နဲနဲ စေ့စေ့စပ်စပ် သိလိုပါက ကွန်ပျူတာ အချိန်ကြာလာတာနဲ့အမျှ စိတ်ဝင်စားစရာကောင်းတဲ့ အချက်အလက်တွေကို သင်တွေ့လိမ့်မယ်။
ထို့အပြင်၊ ဆန်းပြားသောညွှန်ကြားချက်များဖြင့်ပင်၊ အချို့သောမော်ဒယ်များသည် လုံလောက်သောယုံကြည်စိတ်ချရသော စကားပြောဆိုမှုကို မထိန်းသိမ်းနိုင်ခဲ့ကြောင်း တွေ့ရှိရပါသည်။ GPT-4o သည် စိန်ခေါ်မှုအနည်းငယ်ရှိသည့် AI တစ်ခုဖြစ်ကြောင်း ဝန်ခံခဲ့သည်။လူသားချင်းစကားပြောဆိုသူများကြားတွင် ယုံကြည်စိတ်ချရမှု လျင်မြန်စွာ ဆုံးရှုံးသွားသော၊
လှည့်စားဖို့ ဒါမှမဟုတ် တွေးဖို့လား။ Turing Test အငြင်းပွားမှု
Turing Test ကို ကျော်ဖြတ်ခြင်းသည် AI သည် သင်ပြောသည့်အရာကို နားလည်သည် သို့မဟုတ် သင့်စကားများကို သိရှိသည်ဟု မဆိုလိုပါ။ ဤသည်မှာ ကျွမ်းကျင်သူများကြားတွင် ကြီးကျယ်သော ဆွေးနွေးမှုများထဲမှ တစ်ခုဖြစ်သည်။ အချို့က ဤအောင်မြင်မှုသည် လူ့အပြုအမူကို ပုံဖော်ရာတွင် သိသာထင်ရှားသော တိုးတက်မှုအဖြစ် ဂုဏ်ပြုကြသော်လည်း အချို့က ထိုသို့ယူဆကြသည်။ ဤစမ်းသပ်မှုအမျိုးအစားသည် အတုစနစ်တစ်ခု၏ "စစ်မှန်သောဉာဏ်ရည်" ကို တိုင်းတာခြင်းအတွက် အားကိုးစရာမရှိတော့ပါ။.
Google အင်ဂျင်နီယာ François Chollet ကဲ့သို့သော ကျွမ်းကျင်သူများက ထောက်ပြသည်။ Turing Test သည် လက်ရှိအသုံးဝင်သော တိုင်းတာခြင်းထက် အတွေးအခေါ်ဆိုင်ရာ စမ်းသပ်မှုတစ်ခုဖြစ်သည်။. ဤအမြင်အရ AI သည် ကျွန်ုပ်တို့ကို လှည့်ဖြားသောကြောင့် အကြောင်းပြချက် သို့မဟုတ် ကမ္ဘာကြီးကို နက်နဲစွာ နားလည်သည်ဟု မဆိုလိုပါ။ ယင်းအစား၊ ၎င်းသည် ဖြစ်နိုင်ခြေရှိသော အဖြေများကို တည်ဆောက်ရန် စာသားသန်းပေါင်းများစွာမှ သင်ယူထားသော ပုံစံများကို အသုံးချသည်။ ဤနယ်ပယ်ကို ပိုမိုနားလည်ရန်၊ သင်သည် မည်သူဖြစ်သည်ကို သင်စစ်ဆေးနိုင်သည်။ AI တည်ထောင်သူ.
ထို့ကြောင့် စိုးရိမ်စရာမှာ ဤ AI များ လုပ်ဆောင်နိုင်သည့်အရာမှာ များများစားစား မဟုတ်ဘဲ ကျွန်ုပ်တို့ ထင်မြင်ထားသည့်အရာ ဖြစ်သည်။ စကားပြောဆိုမှုစနစ်များကို လူတို့၏ သဘောထားကို မရိုးမသားဖြစ်စေသည်။60 ခုနှစ်များတွင် ELIZA ကဲ့သို့ပင် အချိန်ကြာလာသည်နှင့်အမျှ ပျောက်ကွယ်သွားပုံမပေါ်ပါ။ ယနေ့ခေတ်တွင် အဆိုပါဖြစ်စဉ်ကို ပိုမိုခေတ်မီဆန်းသစ်သော မော်ဒယ်များဖြင့် ချဲ့ထွင်ထားပါသည်။
လူသားဆန်လွန်းသော AI ၏ အသုံးချမှုများနှင့် အန္တရာယ်များ
စကားတိုတစ်ခုတွင် AI သည် လူသားတစ်ဦးထံ ပေးပို့နိုင်သည့်အချက်က အခွင့်အလမ်းများကို ပေးစွမ်းနိုင်သည်သာမက၊ သိသာထင်ရှားသောအန္တရာယ်များရှိသည်။ လုံခြုံရေး၊ ပညာရေးနှင့် လူမှုဆက်ဆံရေးကဏ္ဍများတွင်
- အထောက်အထားလိမ်လည်မှု: ယုံကြည်ခြင်း AI ကို လိမ်လည်မှု သို့မဟုတ် လူမှုအင်ဂျင်နီယာ လှုံ့ဆော်မှုများတွင် အသုံးပြုနိုင်သည်။
- မဟုတ်မမှန်သော အချက်အလက် လူသားစကားပြောဆိုမှုကို ဖန်တီးပေးနိုင်သည့် မော်ဒယ်များသည် သတင်းအတုများကို ကြိုးကိုင်ခြင်း သို့မဟုတ် ဖြန့်ခြင်းအတွက် ထိရောက်သောကိရိယာများ ဖြစ်နိုင်သည်။
- အလုပ်သမား အလိုအလျောက်စနစ်- ဖောက်သည်ဝန်ဆောင်မှု သို့မဟုတ် နည်းပညာပံ့ပိုးမှုကဲ့သို့သော ကဏ္ဍများကို ဤစကားပြောဆိုမှုဆိုင်ရာ AI များဖြင့် အစားထိုးနိုင်ပြီး လူသားအလုပ်အကိုင်ကို ထိခိုက်စေပါသည်။
- ပညာရေးနှင့် အကဲဖြတ်ခြင်း- စာသားကို လူတစ်ဦး သို့မဟုတ် AI မှ ရေးထားခြင်းရှိမရှိ စစ်ဆေးခြင်းသည် ပညာရပ်နယ်ပယ်တွင် အကျိုးဆက်များနှင့်အတူ ရှုပ်ထွေးသောအလုပ်ဖြစ်လာသည်။
သုတေသီများကလည်း မည်ကဲ့သို့ သတိပေးခဲ့သည် ဤနည်းပညာများ၏ စံသတ်မှတ်ခြင်းသည် ၎င်းတို့၏ ထောက်လှမ်းမှုကို ပိုမိုခက်ခဲစေနိုင်သည်။ အနာဂတ်တွင် ကျွန်ုပ်တို့သည် အလိုအလျောက်စနစ်များနှင့် အပြန်အလှန်ဆက်ဆံခြင်းကို ပိုမိုကျင့်သားရလာသည်နှင့်အမျှ ကျွန်ုပ်တို့သည် ကျွန်ုပ်တို့၏သတိမထားမိခြင်းကို ရှောင်ရှားနိုင်ကာ ယင်းမော်ဒယ်များကို ကျွန်ုပ်တို့သတိမထားမိဘဲ လူသားအချင်းချင်း အပြန်အလှန်ပြောဆိုသူနှင့် ခွဲခြား၍မရသောဖြစ်လာစေရန် ပိုမိုလွယ်ကူလာစေသည်။
နောက်ထပ် ထပ်တလဲလဲ စိုးရိမ်စရာမှာ ၎င်း၏ ကျင့်ဝတ်များကို အကောင်အထည်ဖော်ခြင်း ဖြစ်သည်။ AI သည် ၎င်း၏အတုအယောင်သဘာဝကို မထုတ်ဖော်ဘဲ လူသားအဖြစ် မည်မျှအတိုင်းအတာအထိ ဟန်ဆောင်သင့်သနည်း။ လက်တွေ့ဘဝအခြေအနေများတွင် မည်သို့မည်ပုံနှင့် မည်သည့်အချိန်တွင် အသုံးပြုရမည်ကို ရှင်းလင်းစွာ ကန့်သတ်ထားသင့်ပါသလား။
GPT-4.5 သည် ကျွန်ုပ်တို့ကဲ့သို့ စက်များအကြောင်းပြသည်ဟု မဖော်ပြထားပါ။သို့သော် ၎င်းတို့သည် ကျွန်ုပ်တို့ကို ခွဲခြားရခက်စေသည့် နည်းလမ်းဖြင့် အတုယူနိုင်ကြောင်း ထင်ရှားစေသည်။ ဤမှတ်တိုင်သည် စက်၏အရာကြောင့်မဟုတ်ဘဲ၊ ၎င်းသည် ကျွန်ုပ်တို့အား မေးခွန်းထုတ်စေသည့်အရာတစ်ခုကြောင့်- ဒစ်ဂျစ်တယ်ခေတ်တွင် "လူသား" ဖြစ်ရခြင်း၏အဓိပ္ပာယ်နှင့် ပတ်သက်၍ ကျွန်ုပ်တို့၏ကိုယ်ပိုင်အယူအဆများသည် အတုအစစ်အမှန်နှင့် ပေါင်းစည်းထားသည့်အရာဖြစ်သည်။
ကျွန်တော်သည် သူ၏ "geek" စိတ်ဝင်စားမှုများကို အသက်မွေးဝမ်းကြောင်းတစ်ခုအဖြစ် ပြောင်းလဲပေးသော နည်းပညာကို ဝါသနာပါသူတစ်ဦးဖြစ်သည်။ ကျွန်ုပ်သည် စူးစမ်းလိုစိတ်ဖြင့် ပရိုဂရမ်အမျိုးမျိုးဖြင့် ခေတ်မီနည်းပညာများကို အသုံးပြုကာ ဘဝကို 10 နှစ်ကျော် ကုန်ဆုံးခဲ့သည်။ ယခု ကျွန်ုပ်သည် ကွန်ပျူတာနည်းပညာနှင့် ဗီဒီယိုဂိမ်းများကို အထူးပြုရပြီ။ အဘယ်ကြောင့်ဆိုသော် ကျွန်ုပ်သည် နည်းပညာနှင့် ဗီဒီယိုဂိမ်းများပေါ်ရှိ ဝဘ်ဆိုဒ်အမျိုးမျိုးအတွက် ၅ နှစ်ကျော်ကြာအောင် ရေးသားခဲ့ပြီး လူတိုင်းနားလည်နိုင်သော ဘာသာစကားဖြင့် သင်လိုအပ်သော အချက်အလက်များကို ပေးလိုသည့် ဆောင်းပါးများကို ဖန်တီးနေသောကြောင့် ဖြစ်ပါသည်။
သင့်တွင်မေးခွန်းများရှိပါက၊ ကျွန်ုပ်၏အသိပညာသည် Windows လည်ပတ်မှုစနစ်အပြင် မိုဘိုင်းလ်ဖုန်းများအတွက် Android နှင့်ပတ်သက်သည့်အရာအားလုံးမှပါဝင်ပါသည်။ ပြီးတော့ ငါ့ရဲ့ကတိကဝတ်က မင်းအတွက်ပါပဲ၊ ငါ အမြဲတမ်း မိနစ်အနည်းငယ်လောက် အချိန်ပေးပြီး ဒီအင်တာနက်ကမ္ဘာမှာ မင်းရှိနိုင်သမျှမေးခွန်းတွေကို ဖြေရှင်းဖို့ ကူညီပေးဖို့ ဆန္ဒရှိနေတယ်။


