- Společnosti Google DeepMind a OpenAI oznámily, že jejich modely umělé inteligence dosáhly zlatých ocenění na Mezinárodní matematické olympiádě pro středoškoláky.
- Oba modely vyřešily pět ze šesti problémů pomocí univerzálních systémů schopných uvažování v přirozeném jazyce.
- Organizace IMO oficiálně certifikovala výsledky Googlu, zatímco OpenAI byla externě hodnocena bývalými medailisty.
- Tento milník představuje významný pokrok ve využívání umělé inteligence pro složité úkoly matematického uvažování s důsledky pro vědecký výzkum.
Situace v oblasti umělé inteligence v akademické sféře prošla významnou změnou po oznámení, že Modely umělé inteligence od Google DeepMind a OpenAI dosáhly požadovaného skóre pro zlatou medaili na prestižní Mezinárodní matematické olympiádě. (IMO). Tento úspěch představuje významný pokrok ve schopnosti strojů řešit matematické problémy na úrovni nejlepších středoškoláků na světě.
Obě společnosti, považované za lídry ve vývoji pokročilých systémů umělé inteligence, Oznámili, že jejich modely uspěly v pěti ze šesti testů v soutěži., přičemž dosáhl skóre 35 bodů ze 42, což obvykle zaručuje „zlaté“ uznání v soutěži. Tohoto výsledku bylo dosaženo pomocí univerzálních modelů, které zpracovávají příkazy pomocí přirozeného jazyka, čímž se odklonily od předchozích metod založených na překladu do formálních jazyků nebo systematických výpočtech.
Účast a ověřování v IMO
Veletrh IMO, kterého se tyto modely zúčastnily, se konal v Sunshine Coast v Queenslandu (Austrálie) a zúčastnilo se ho více než 630 studentů ze 113 delegacíZlatou medaili získalo celkem 67 lidských soutěžících, což zasazuje výkon umělé inteligence do kontextu vysoké poptávky a konkurence.
Validaci výsledků provedla Úzká spolupráce společnosti Google s organizačním výborem, která oficiálně certifikovala výkon své umělé inteligence a zavedla postupy pro zveřejňování dat po nezávislém přezkumu. Ze své strany OpenAI provedla sebehodnocenís využitím tří bývalých medailistů IMO ke kvalifikaci jejich výsledků podle stejných pravidel jako pro soutěžící.
Nové modely a metody

Hlavní novinkou této edice je, že použití neformální modely uvažování, jako například Gemini Deep Think od Googlu, které zpracovávají a řeší problémy přímo v přirozeném jazyceTato schopnost umožňuje umělé inteligenci analyzovat různé cesty řešení paralelně, výběr nejvhodnější strategie v čase podobném tomu, jaký měli studenti: 4,5 hodiny na zkoušku bez externí podpory například kalkulačky nebo internet.
Google zdůraznil, že jeho model byl schopen realizovat argumentaci jasným a podrobným způsobem, zatímco OpenAI zdůraznila možnost realizace více myšlenkových linií současně prostřednictvím intenzivního výpočetního zpracování., ačkoliv uznali, že tyto verze nebudou v krátkodobém horizontu veřejnosti dostupné.
Debata a skepse ohledně výsledků
I když je pokrok nepopiratelný, Způsob, jakým OpenAI sdělovala své výsledky, vyvolal kontroverzi.Organizace IMO požádala zúčastněné společnosti, aby před hodnocením a slavnostním předáváním cen nezveřejňovaly svá data, což je požadavek, který Google respektoval, ale OpenAI se ho striktně nedodržel.
Kromě toho někteří odborníci a členové výboru varovali před nedostatek transparentnosti ve vztahu k použitým výpočetním zdrojům a možnosti lidského zásahu do některých procesůKomunita však obecně akceptuje matematickou platnost řešení prezentovaných umělou inteligencí.
Důsledky pro budoucnost matematického výzkumu

Pokrok dosažený modely Google a OpenAI posiluje myšlenku, že Umělá inteligence se může stát klíčovým nástrojem řešit nevyřešené problémy v matematice, ale i v dalších oblastech, jako je fyzika. Výzkumníci jako Junehyuk Jung z Brownovy univerzity se domnívají, že jsme blízko užší spolupráci mezi matematiky a systémy umělé inteligence, která překoná významné vědecké bariéry a podnítí inovace napříč různými obory.
Kromě hlavní soutěže letos IMO udělila cenu za matematickou olympiádu v oblasti umělé inteligence.v hodnotě 10 milionů dolarů, jehož cílem je podpořit vytváření otevřených modelů umělé inteligence pro matematiku. Toto ocenění získal tým ze společnosti Nvidia, což dokazuje silný zájem technologické komunity o tyto typy výzev a rostoucí profesionalizaci tohoto odvětví.
Omezení a budoucnost umělé inteligence v matematice
Jedním z vrcholů po soutěži je velký rozdíl mezi výzkumnými modely a těmi, které jsou přístupné veřejnostiPřestože laboratorní umělá inteligence dosáhla působivých výsledků, její open source verze dosud v testech IMO nezískaly ani bronzovou medaili. To vyvolává otázky ohledně škálovatelnosti a demokratizace těchto technologií, stejně jako ohledně stupně vyspělosti současných obchodních modelů ve srovnání s jejich experimentálními protějšky.
Tempo pokroku v oblasti umělé inteligence v matematice však znásobilo očekávání ohledně její schopnosti řešit historické výzvy. Matematická i technologická komunita doporučují zachovat opatrný postoj., čímž se zajistí důsledné a transparentní hodnocení před přijetím konečných výsledků.
Nejnovější vydání Mezinárodní matematická olympiáda znamenala zlom pro umělou inteligenci., čímž se Google a OpenAI upevňují jako lídři v aplikaci pokročilých modelů uvažování. Ačkoli přetrvávají otázky ohledně metodologie a veřejné dostupnosti těchto řešení, tento průlom naznačuje slibnou cestu ke stále užší spolupráci mezi lidmi a stroji při řešení složitých problémů v matematice a dalších vědních oborech.
Jsem technologický nadšenec, který ze svých „geekovských“ zájmů udělal profesi. Strávil jsem více než 10 let svého života používáním nejmodernějších technologií a vrtáním se všemi druhy programů z čisté zvědavosti. Nyní se specializuji na počítačovou techniku a videohry. Je to proto, že již více než 5 let píšu pro různé webové stránky o technologiích a videohrách a tvořím články, které se vám snaží poskytnout informace, které potřebujete, v jazyce, který je srozumitelný všem.
Pokud máte nějaké dotazy, mé znalosti sahají od všeho, co se týká operačního systému Windows a také Androidu pro mobilní telefony. A můj závazek je vůči vám, jsem vždy ochoten strávit pár minut a pomoci vám vyřešit jakékoli otázky, které můžete mít v tomto internetovém světě.

