- Google DeepMind ak OpenAI anonse ke modèl entèlijans atifisyèl yo te rive jwenn nòt lò nan Olenpik Matematik Entènasyonal pou elèv lekòl segondè.
- Toulede modèl yo te rezoud senk nan sis pwoblèm yo, lè l sèvi avèk sistèm jeneral ki kapab rezone nan lang natirèl.
- Òganizasyon IMO a te sètifye rezilta Google yo ofisyèlman, pandan ke OpenAI te evalye ekstènman pa ansyen medayis yo.
- Etap enpòtan sa a make yon avansman siyifikatif nan itilizasyon IA pou travay rezònman matematik konplèks, ak enplikasyon pou rechèch syantifik.
Peyizaj entèlijans atifisyèl nan mond akademik la fèk sibi yon gwo chanjman apre anons ke Modèl IA Google DeepMind ak OpenAI yo te rive jwenn nòt ki nesesè pou yon meday lò nan prestijye Olenpik Matematik Entènasyonal la. (IMO). Reyalizasyon sa a reprezante yon gwo pwogrè nan kapasite machin yo pou abòde pwoblèm matematik nan nivo pi bon elèv lekòl segondè nan mond lan.
Toulede konpayi yo, konsidere kòm lidè nan devlopman sistèm IA avanse, Yo anonse ke modèl yo te pase senk sou sis tès nan konpetisyon an., li te jwenn yon nòt 35 pwen sou 42, ki anjeneral garanti rekonesans "lò" nan konpetisyon an. Rezilta sa a te reyalize lè l sèvi avèk modèl jeneral ki trete deklarasyon lè l sèvi avèk lang natirèl, kidonk li te abandone metòd anvan yo ki te baze sou tradiksyon nan lang fòmèl oswa kalkil sistematik.
Patisipasyon ak verifikasyon nan IMO a
Edisyon IMO a kote modèl sa yo te patisipe a te fèt nan Sunshine Coast, Queensland (Ostrali), ak plis pase 630 elèv ki soti nan 113 delegasyonYon total 67 konpetitè imen te genyen meday lò a, yon chif ki mete eksplwa IA a nan yon kontèks kote gen anpil demann ak konpetisyon.
Validasyon rezilta yo te fèt pa Kolaborasyon sere Google ak komite òganizatè a, ki te sètifye ofisyèlman pèfòmans IA li a epi ki te etabli pwosedi pou pibliye done yo apre yon revizyon endepandan. Pou pati pa li, OpenAI te fè yon otoevalyasyon, lè l sèvi avèk twa ansyen medaye IMO pou kalifye rezilta yo anba menm règ ak konpetitè yo.
Nouvo modèl ak metòd

Pi gwo nouvote edisyon sa a se nan itilize nan modèl rezònman enfòmèl, tankou Gemini Deep Think Google la, pwosesis sa a epi rezoud pwoblèm dirèkteman nan lang natirèlKapasite sa a pèmèt IA analize diferan chemen solisyon an paralèl, chwazi estrateji ki pi apwopriye a nan yon tan menm jan ak sa elèv yo te genyen: 4,5 èdtan pa egzamen san sipò ekstèn tankou kalkilatris oswa entènèt la.
Google te mete aksan sou ke modèl li a te kapab egzekite rezònman an yon fason klè ak detaye, pandan ke OpenAI te mete aksan sou posiblite pou pote plizyè liy panse an menm tan grasa informatique entansif., byenke yo te rekonèt ke vèsyon sa yo p ap disponib pou piblik la nan kout tèm.
Deba ak dout sou rezilta yo
Pandan ke pwogrè a pa ka nye, Fason OpenAI kominike rezilta li yo te kreye konfli.Òganizasyon IMO a te mande konpayi patisipan yo pou yo pa divilge done yo anvan seremoni evalyasyon an ak seremoni prim yo, yon demann Google te respekte, men OpenAI pa t respekte l estrikteman.
Anplis de sa, kèk ekspè ak manm komite te avèti sou mank transparans an relasyon ak resous enfòmatik yo itilize ak posiblite pou entèvansyon imen nan kèk pwosesisSepandan, jeneralman kominote a aksepte validite matematik solisyon IA prezante yo.
Enplikasyon pou lavni rechèch matematik la

Pwogrè modèl Google ak OpenAI yo reyalize ranfòse lide ke Entèlijans atifisyèl ka vin yon zouti kle pou adrese pwoblèm ki poko rezoud nan matematik, ansanm ak nan lòt domèn tankou fizik. Chèchè tankou Junehyuk Jung nan Inivèsite Brown kwè nou pre yon kolaborasyon pi sere ant matematisyen ak sistèm IA ki pral simonte baryè syantifik enpòtan, pou kondwi inovasyon nan plizyè disiplin.
Anplis konpetisyon prensipal la, IMO a te prezante Pri Olenpik Matematik IA ane sa a., ki vo 10 milyon dola, ki vize ankouraje kreyasyon modèl IA ouvè pou matematik. Prim sa a te ale nan yon ekip Nvidia, sa ki demontre gwo enterè kominote teknoloji a nan kalite defi sa yo ak pwofesyonnalizasyon k ap grandi nan sektè a.
Limit ak avni IA nan matematik
Youn nan pi bon moman apre konpetisyon an se gwo diferans ant modèl rechèch yo ak sa yo aksesib pou piblik laMalgre ke IA laboratwa a te rive jwenn rezilta enpresyonan, vèsyon sous ouvè li yo poko menm jwenn yon meday bwonz nan tès IMO yo. Sa soulve kesyon sou évolutivité ak demokratizasyon teknoloji sa yo, ansanm ak degre matirite modèl biznis aktyèl yo konpare ak tokay eksperimantal yo.
Ritm pwogrè nan entèlijans atifisyèl nan matematik la miltipliye atant sou kapasite li pou rezoud defi istorik yo. Sepandan, Ni kominote matematik la ni kominote teknolojik la rekòmande pou kenbe yon pozisyon pridan., pou asire yon evalyasyon rigoureux ak transparan anvan yo aksepte rezilta final yo.
Dènye edisyon an nan Olenpik Matematik Entènasyonal la make yon pwen tournan pou entèlijans atifisyèl., sa ki konsolide Google ak OpenAI kòm lidè nan aplikasyon modèl rezònman avanse. Malgre ke kesyon rete sou metodoloji a ak disponiblite piblik solisyon sa yo, avansman sa a endike yon chemen pwomèt pou yon kolaborasyon ki pi sere ant moun ak machin nan rezoud pwoblèm konplèks nan matematik ak lòt disiplin syantifik.
Mwen se yon antouzyast teknoloji ki te vire enterè "jik" li nan yon pwofesyon. Mwen te pase plis pase 10 ane nan lavi mwen itilize teknoloji dènye kri ak brikolaj ak tout kalite pwogram nan pi kiryozite. Koulye a, mwen te espesyalize nan teknoloji òdinatè ak jwèt videyo. Sa a se paske depi plis pase 5 ane mwen ap ekri pou divès sit entènèt sou teknoloji ak jwèt videyo, kreye atik ki ap chèche ba w enfòmasyon ou bezwen an nan yon lang ke tout moun konprann.
Si w gen nenpòt kesyon, konesans mwen varye ant tout bagay ki gen rapò ak sistèm operasyon Windows la ak Android pou telefòn mobil yo. Ak angajman mwen se avè ou, mwen toujou dispoze pase kèk minit epi ede ou rezoud nenpòt kesyon ou ka genyen nan mond entènèt sa a.

