OpenAI nthuav tawm o3 thiab o3 Mini: cov qauv tshiab rau kev xav siab hauv kev txawj ntse

Hloov tshiab kawg: 12/23/2024

o3 thiab o3 mini-2

OpenAI, lub tuam txhab pioneering nyob rau hauv lub tshav pob ntawm kev txawj ntse txawj ntse, tau tshaj tawm nws qhov tseeb ua ntej: cov qauv o3 thiab o3 Mini. Cov kev daws teeb meem tshiab no, tsim tshwj xeeb los daws cov haujlwm uas yuav tsum muaj kev xav siab, cog lus tias yuav muaj kev vam meej loj dua piv rau cov qauv qub dhau los xws li o1. Txawm hais tias lawv tseem tsis tau muaj rau cov pej xeem sawv daws, lawv twb ua rau muaj kev zoo siab hauv zej zog technology.

Txij li thaum lawv tso tawm thawj zaug, cov qauv kev xav tau ua pov thawj tias yog cov cuab yeej tseem ceeb hauv cov ntawv thov uas xav tau qhov tseeb thiab cov ncauj lus kom ntxaws. Nrog o3 thiab o3 Mini, OpenAI nrhiav kev txhawb nqa nws cov thawj coj hauv kev lag luam, nthuav qhia kev txhim kho ntau yam hauv kev ua haujlwm thiab kev siv yooj yim.

Características destacadas de los nuevos modelos

OpenAI o3 ua haujlwm

Ib qho ntawm qhov tseem ceeb ntawm o3 yog nws lub peev xwm daws cov teeb meem nyuaj los ntawm kev rhuav tshem lawv mus rau hauv cov kauj ruam me. Cov txheej txheem no, hu ua "kev xav saw," tso cai rau tus qauv los tshuaj xyuas txhua theem ua ntej muab cov lus teb kawg. Qhov no ua kom tsis yog tsuas yog ntau dua qhov tseeb, tab sis kuj piav qhia ntxaws txog koj qhov laj thawj, ib yam dab tsi tseem ceeb rau cov sectors xws li kev kawm, kev kawm qib siab thiab kev tshawb fawb tshawb fawb.

Cov ntsiab lus tshwj xeeb - Nyem qhov no  Kev Tshawb Xyuas Lub Khw: Chrome's AI feature tshiab hloov pauv kev yuav khoom hauv online

Cov kev ntsuam xyuas tau ua los txog tam sim no tau tsim cov txiaj ntsig zoo. Piv txwv li, nyob rau hauv lub benchmark SWE-Bench Verified, o3 ua tiav 22,8% nce piv rau nws cov thawj coj o1, nce mus txog qhov tseeb ntawm 84,9%. Hauv lwm qhov kev ntsuam xyuas tseem ceeb, lub American Invitational Mathematics Exam 2024, o3 tau 96,7%, ua tsis tau ib lo lus nug xwb.

Tsis tas li ntawd, o3 Mini, qhov ua kom zoo dua qub thiab sib dua, yog tsim los rau cov kev siv tshwj xeeb thiab cov khoom siv uas muaj peev xwm siv tau tsawg dua. Ob qho qauv tau txais txiaj ntsig los ntawm qhov tshwj xeeb tshwj xeeb: cov neeg siv tuaj yeem kho qhov "lub sij hawm tsim nyog" nruab nrab ntawm qis, nruab nrab thiab siab. Qhov no tso cai rau kev ceev los yog precision ua ntej nyob ntawm cov ntsiab lus, ib qho tseem ceeb ua ntej piv rau cov qauv yav dhau los.

Ib kauj ruam zoo rau kev txawj ntse txawj ntse

Kev ntsuas kev ua tau zoo hauv OpenAI

OpenAI tsis tau saib xyuas qhov tseem ceeb ntawm hom thiab nws qhov cuam tshuam rau kev ua lag luam. Raws li lub tuam txhab, lawv tau txiav txim siab hla lub npe "o2" kom tsis txhob muaj teeb meem kev cai lij choj nrog rau lub tuam txhab kev sib txuas lus Askiv O2. Qhov kev txav no, txawm tias xav paub, qhia txog kev mloog rau kev nthuav dav ntawm lub tuam txhab coj los ntawm Sam Altman.

Cov ntsiab lus tshwj xeeb - Nyem qhov no  Yuav siv GPT-4.5 Orion li cas: nta, txhim kho thiab muaj

Tshaj li kev txhim kho kev lag luam, cov qauv tshiab kuj sawv cev rau ib kauj ruam tseem ceeb rau inteligencia artificial general (AGI). Hauv kev xeem zoo li ARC-AGI, tsim los ntsuas tib neeg zoo li kev txawj ntse, o3 tau qhab nia ntawm 87,5%, deb tshaj nws cov thawj coj.

Muaj thiab nkag mus rau thaum ntxov

OpenAI o3 muaj

Txawm hais tias cov qauv tseem tsis tau npaj rau kev tshaj tawm rau pej xeem, OpenAI tau qhib cov npe tos rau cov kws tshawb fawb txog kev nyab xeeb xav sim o3 Mini. Cov qauv no yuav muaj nyob rau thaum ntxov 2025, ua raws li tom qab xyoo ntawd los ntawm o3. Lub tuam txhab cog lus tias ob qho tib si yuav muaj nyob rau hauv kev tso npe, txawm hais tias cov ntsiab lus tshwj xeeb tseem tsis tau tshwm sim.

Qhov kev maj mam ua kom yooj yim no tso cai rau OpenAI ua qhov kev sim dav dav kom ntseeg tau tias muaj kev nyab xeeb thiab ua haujlwm ntawm cov qauv, ib qho tseem ceeb hauv kev txhim kho kev txawj ntse ntse.

Kev sib tw ua lag luam: OpenAI vs Google

Kev sib tw ntawm OpenAI thiab Google

Kev tshaj tawm ntawm o3 thiab o3 Mini qauv los ntawm lub sijhawm muaj kev sib tw hnyav hauv AI sector. Google, rau nws feem, tsis ntev los no tau tshaj tawm nws "Xav Hom" hauv Gemini 2.0 Flash, thev naus laus zis uas tseem nrhiav kev txhim kho cov laj thawj kev xav hauv AI qauv. Txawm li cas los xij, OpenAI zoo li lean mus rau kev maj mam thiab tshwj xeeb tsom mus kom ze, tsis zoo li nws cov neeg sib tw tus qauv ntau yam.

Cov ntsiab lus tshwj xeeb - Nyem qhov no  Apple sim Veritas, tus tshiab Siri nrog rau sab hauv ChatGPT-style chatbot.

Ob lub tuam txhab tau thawb cov ciam teb ntawm qhov ua tau hauv kev txawj ntse, ua kom pom tseeb tias yav tom ntej ntawm daim teb no yuav nyob ntawm ob qho tib si kev nce qib thiab cov tswv yim siv.

Cov qauv o3 thiab o3 Mini sawv cev rau kev nce qib tseem ceeb hauv kev tshawb nrhiav kom meej dua, txhim khu kev qha thiab tshwj xeeb kev txawj ntse. Nws lub peev xwm los daws cov teeb meem nyuaj nrog cov txheej txheem logic qhib kev muaj peev xwm tshiab rau kev tshawb fawb, kev tshaj lij thiab kev kawm ntawv, kos npe ua ntej thiab tom qab hauv kev txhim kho cov txheej txheem kev xav zoo siab.