Gabhann GPT-4.5 an tástáil turing le cruinneas 73%.

D'éirigh le GPT-4.5 a chur ina luí ar 73% de na rannpháirtithe go raibh sé daonna i dtástáil leasaithe Turing.
Léirigh an turgnamh go mbraitheann rath AI go mór ar threoracha agus ar "pearsantacht" a ghlacadh.
Fuair samhlacha eile ar nós LLaMa-3.1 rátaí ratha níos ísle, agus gan saincheapadh, thit na torthaí go suntasach.
Ardaíonn an staidéar ceisteanna faoi theorainneacha reatha na hintleachta saorga agus na rioscaí a bhaineann lena réalachas comhrá méadaitheach.

An mbeifeá in ann idirdhealú a dhéanamh idir comhrá le fíordhuine agus le meaisín? Tá an cheist, a cuireadh ar dtús níos mó ná seacht mbliana ó shin ag Alan Turing, tar éis tarraingt arís tar éis turgnaimh le déanaí a rinne tástáil ar na múnlaí is forbartha d'intleacht shaorga i gcomhthéacs dúshlánach.

Tá taighdeoirí in Ollscoil California, San Diego tar éis a staidéar a thugann dúshlán ár gcumas idirdhealú a dhéanamh idir cad is daonna agus cad atá saorgal. I lár an turgnaimh, an tsamhail GPT-4.5 Ní hamháin gur éirigh le OpenAI pas a fháil sa Tástáil Turing faoi choinníollacha sonracha, ach freisin Aithníodh é mar dhuine daonna níos minicí ná mar a bhí daoine fíor iad féin.

Turgnamh faoi dhianchoinníollacha

An staidéar, faoi stiúir na taighdeoirí Cameron Jones agus Benjamin Bergen, dírithe ar leagan modhnaithe den Triail Turing clasaiceach, áit ar ghlac níos mó ná 300 duine páirt, lena n-áirítear mic léinn ollscoile agus úsáideoirí ardáin ar líne. Le linn seisiúin cúig nóiméad, bhí dhá chomhrá ag gach rannpháirtí ag an am céanna: ceann le duine agus ceann le córas hintleachta saorga. Sa deireadh, Bhí orthu a mheas cé acu de na hidirghabhálaithe a bhí daonna.

Ábhar eisiach - Cliceáil Anseo Manus AI: An hintleachta saorga Síneach a bhfuil sé mar aidhm aige an todhchaí a threorú

Bhí an toradh iontach: braitheadh an tsamhail GPT-4.5 mar mhúnla daonna i 73% de na cásanna nuair a sannadh pearsantacht shainithe dó - mar shampla, pearsantacht fear óg a bhfuil eolas aige ar chultúr digiteach. Sháraigh an céatadán seo ní hamháin an tairseach staitistiúil chun an tástáil a ritheadh a mheas, ach sháraigh sé fiú cumas na bhfíordhuine láithriú daonna sa turgnamh seo. Treisíonn an cur chuige seo an smaoineamh ar conas la faisnéis shaorga tagtha chun cinn le blianta beaga anuas.

Mar sin féin, nuair nach raibh pearsantacht shonrach ag an AI agus gur iarradh air go simplí a bheith i láthair an duine gan a thuilleadh leideanna, thit a éifeachtacht go 36%. Cuireann sé seo béim ar an tábhacht an chomhthéacs agus an phearsantú i dtreoracha (leideanna) tugtha do mhúnlaí teanga.

Comparáid idir samhlacha agus torthaí gan choinne

In éineacht le GPT-4.5, chuimsigh an turgnamh samhlacha eile ar nós LLaMa-3.1-405B Meta, a bhain ráta cruinnis 56% amach nuair a tugadh pearsantacht ficseanúil freisin. Cé go bhfuil an figiúr seo níos ísle ná an figiúr GPT-4.5, tá sé fós os cionn seans. I gcodarsnacht leis sin, níor sháraigh leaganacha eile cosúil le GPT-4o nó an veteran chatbot ELIZA, ó na 60í, 21% agus 23% faoi seach, rud a fhágann go soiléir an t-achar idir teicneolaíochtaí reatha agus primitive.

Na torthaí seo a thaispeáint go mbraitheann rathúlacht AI i dtasc cosúil le Triail Turing i bhfad níos mó ar an gcaoi a dtugtar treoir dó ná ar an tsamhail féin. Is í an eochair ná ról inchreidte a ghlacadh, gan insamhladh a dhéanamh go comhfhiosach ar fhaisnéis dhaonna. Más mian leat a delve níos doimhne isteach conas an computadora Le himeacht ama, gheobhaidh tú eolas suimiúil.

Ábhar eisiach - Cliceáil Anseo Amazon Nova Premier AI: Gach eolas faoi mhúnla ilmhódach is airde chun cinn AWS

Ina theannta sin, fuarthas amach, fiú le treoracha sofaisticiúla, nach raibh samhlacha áirithe in ann comhrá a bhí diongbháilte go leor a choinneáil. D'admhaigh GPT-4o gur AI a bhí ann gan dúshlán a thabhairt, rud a chaill creidiúnacht go tapa le hidirghabhálaithe daonna.

Cheat nó smaoineamh? An chonspóid Turing Test

Ní thugtar le tuiscint nuair a théann an Triail Turing ar aghaidh go dtuigeann AI cad a deir sé nó go bhfuil sé ar an eolas faoina fhocail. Seo ceann de na díospóireachtaí móra idir saineolaithe. Cé go gceiliúrann roinnt daoine an éacht seo mar dhul chun cinn suntasach in insamhladh iompar daonna, measann daoine eile é sin Níl an cineál tástála seo iontaofa a thuilleadh chun "fíor-intleacht" córas saorga a thomhas.

Tá aird tugtha ag saineolaithe ar nós François Chollet, innealtóir Google, air sin Is turgnamh fealsúnach níos mó é Triail Turing ná mar thomhas atá úsáideach faoi láthair. De réir an dearcadh seo, díreach toisc go meallann AI sinn ní chiallaíonn sé go ndéanann sé cúiseanna nó go bhfuil tuiscint dhomhain aige ar an domhan. Ina ionad sin, baintear úsáid as patrúin a foghlaimíodh ó na milliúin téacs chun freagraí sochreidte a chruthú. Chun an réimse seo a thuiscint níos fearr, is féidir leat dul i gcomhairle le cé hé an bunaitheoir AI.

Is é an rud is measa, mar sin, ná an méid is féidir leis na AIanna seo a dhéanamh, ach an méid a chreidimid a dhéanann siad. An claonadh daonna chun córais chomhrá a antrapamorphize, mar a bhí cheana féin le ELIZA sna 60í, is cosúil nach bhfuil sé imithe le himeacht ama. Sa lá atá inniu ann, déantar an feiniméan a mhéadú le samhlacha i bhfad níos sofaisticiúla.

Feidhmchláir agus rioscaí AI a fhuaimeann ró-dhaonna

Tugann an fhíric gur féidir le AI pas a fháil don duine i gcomhrá gearr deiseanna, ach freisin rioscaí suntasacha ag baint leis i dtéarmaí slándála, oideachais agus caidreamh sóisialta.

Calaois aitheantais: d'fhéadfaí AI áititheach a úsáid i bhfeachtais scam nó innealtóireachta sóisialta.
Mífhaisnéis: D’fhéadfadh múnlaí atá in ann urlabhra dhaonna a ghiniúint a bheith ina n-uirlisí éifeachtacha chun nuacht bhréige a ionramháil nó a scaipeadh.
Uathoibriú oibre: D’fhéadfaí na AIanna comhráiteacha seo a chur in ionad earnálacha amhail seirbhís do chustaiméirí nó tacaíocht theicniúil, rud a chuirfeadh isteach ar fhostaíocht dhaonna.
Oideachas agus meastóireacht: Is tasc casta é a fháil amach cé acu ar scríobh duine nó ar AI a scríobh téacs, agus beidh iarmhairtí aige sa réimse acadúil.

Ábhar eisiach - Cliceáil Anseo Airm cinniúint: Plota, Carachtair agus go leor eile

Tá rabhadh tugtha ag taighdeoirí freisin faoi conas D'fhéadfadh caighdeánú na dteicneolaíochtaí seo a bheith níos deacra iad a bhrath. sa todhchaí. De réir mar a théimid i dtaithí ar idirghníomhú le córais uathoibrithe, d’fhéadfaimis ár ngarda a ligean síos, rud a d’fhágfadh go mbeadh sé níos fusa do na samhlacha seo a bheith do-aitheanta ó idirghabhálaí daonna gan é a thuiscint.

Ábhar imní eile a thagann chun cinn arís agus arís eile is ea an eitic a bhaineann lena chur chun feidhme. Cé chomh mór agus is ceart do AI ligean air gur duine é gan a nádúr saorga a chur ar an eolas? Ar cheart teorainneacha soiléire a bheith ann maidir le conas agus cathain is féidir é a úsáid i gcomhthéacsanna réadacha?

Níor léirigh GPT-4.5 go bhfuil cúiseanna meaisíní mar a dhéanaimid, ach tá sé ráite go soiléir gur féidir leo aithris a dhéanamh orainne ar bhealach a fhágann go bhfuil sé deacair iad a idirdhealú. Is pointe casaidh é an chloch mhíle seo, ní mar gheall ar cad é an meaisín, ach mar gheall ar an méid a chuireann sé orainn ceist a chur orainn: ár gcuid smaointe féin faoi cad a chiallaíonn sé a bheith “daoine” san aois dhigiteach nuair a chumascann an saorga leis an bhfíor.

Alberto navarro

Is díograiseoir teicneolaíochta mé a bhfuil a leasanna "geek" iompú isteach i ngairm. Tá níos mó ná 10 mbliana de mo shaol caite agam ag baint úsáide as teicneolaíocht cheannródaíoch agus ag tinkering le gach cineál clár as fiosracht íon. Anois tá mé speisialaithe i dteicneolaíocht ríomhaireachta agus cluichí físeáin. Tá sé seo amhlaidh toisc go bhfuil mé ag scríobh le breis agus 5 bliana do shuímh Ghréasáin éagsúla ar theicneolaíocht agus físchluichí, ag cruthú ailt a fhéachann leis an eolas atá uait a thabhairt duit i dteanga atá intuigthe do chách.

Má tá aon cheist agat, raon mo chuid eolais ó gach rud a bhaineann le córas oibriúcháin Windows chomh maith le Android d'fhóin phóca. Agus is é mo thiomantas duit, táim i gcónaí sásta cúpla nóiméad a chaitheamh agus cabhrú leat aon cheisteanna a d’fhéadfadh a bheith agat sa saol idirlín seo a réiteach.