GPT-5.1-Codex-Max: Gervigreind fyrir langar verkefni

Ný líkan sem sérhæfir sig í forritun með þjöppun fyrir langar lotur án þess að missa samræmi.
Mælanlegar framfarir í viðmiðum (SWE-Bench, SWE-Lancer, Terminal-Bench) og notkun færri tákna.
Fáanlegt fyrir Plus, Pro, Business, Edu og Enterprise; samþætting við Codex verkfæri; opinbert API fyrirhugað.
Einangrað umhverfi án nets sjálfgefið, með öryggis- og eftirlitsstýringum.

OpenAI hefur kynnt GPT-5.1-Codex-Max, A ný líkan af gervigreind sem beinist að hugbúnaðarþróun sem fylgir lofa að halda stefnunni í langtímaverkefnum án þess að missa samhengiðÍ reynd erum við að tala um a þróun Codex fær um að sinna flóknum verkefnum í marga klukkutíma, með úrbætur í skilvirkni og hraða sem eru áberandi í raunverulegum vinnuferlum.

Stóra nýjungin felst í getu þess til að rökstyðja á viðvarandi hátt þökk sé minnisstjórnunartækni sem kallast þjöppunÞessi aðferð gerir það að verkum að samhengisglugginn getur mettað sig áður en hann verður ofhlaðinn. Kerfið greinir afritunaratriði, tekur saman aukahlutinn og geymir það nauðsynlegasta.og þannig forðast þau dæmigerðu mistök sem tefja langtímaverkefni.

Hvað er GPT-5.1-Codex-Max?

Það er sérstakt líkan fyrir forritun sem er fínstillt fyrir útvíkkuð verkefni í hugbúnaðarverkfræðiFrá kóðaúttekt til að búa til pull requests og styðja við framhliðarþróun. Ólíkt fyrri kynslóðum er það þjálfaðir til að viðhalda samræmi á löngum vinnudögum og í töluverðum stærðargeymslum.

OpenAI setur GPT-5.1-Codex-Max eitt skref ofar Codex með því að leyfa samfelld flæði í 24 klukkustundir eða lengur án þess að niðurbrotsáhrif komi niður áFyrir þær byggingarvörur þýðir þetta færri truflanir vegna samhengismarka og minni tímasóun í að útskýra verkefni aftur og aftur í endurteknum endurtekningum.

Tækninýjungar og þjöppunartækni

Lykillinn er í söguþjöppunLíkanið greinir hvaða hlutar samhengisins eru bókstaflega óþarfir, dregur þá saman og geymir mikilvægar heimildir til að halda áfram með verkefnið án þess að ofhlaða minnið. Þessi aðferð er einnig kölluð „þjöppun“ í sumum efnum, en hún lýsir sama ferli við að sía samhengið á snjallan hátt.

Einkarétt efni - Smelltu hér Google kort brellur

Með þessum grunni getur GPT-5.1-Codex-Max haldið áfram að endurtaka kóðann, laga villur og endurskipuleggja Hægt er að keyra heilar einingar án þess að samhengisglugginn verði flöskuháls. Í tilfellum þar sem mikil notkun er mikil dregur það einnig úr fjölda tákna sem þarf til vinnslu, sem hefur áhrif á bæði kostnað og seinkun.

Líkanið felur í sér stillingu fyrir „Mjög há“ rökstuðningur Fyrir erfið vandamál, með það að markmiði að kafa dýpra í greiningu þegar verkefnið krefst þess, en um leið viðhalda samræmi í niðurstöðum í ferlum með mörgum skrefum og ósjálfstæði.

Árangur og viðmið: hvað tölurnar segja

GPT-5.1-Codex-Max viðmiðunargildi

Í innri mati sem einblíndi á forritun, GPT-5.1-Codex-Max er framför frá forvera sínum á mismunandi vígstöðvum, með hærri árangurshlutfall og meiri skilvirkni táknaÞessar niðurstöður, sem OpenAI birti, Þær endurspegla prófanir á raunverulegum verkfræðilegum verkefnum og rafhlöðum eins og SWE-Bench Verified, SWE-Lancer IC SWE og Terminal-Bench 2.0..

Meðal sameiginlegra gagna nær líkanið u.þ.b. 77,9% á SWE-Bench staðfest (samanborið við 73,7% af GPT-5.1-Codex), skrár 79,9% í SWE-Lancer IC SWE og nær árangri 58,1% í Terminal-Bench 2.0Ennfremur, í langvarandi samhengi, hefur hraðaaukning upp á 27% til 42% mælst í dæmigerðum verkefnum samanborið við Codex, samkvæmt sömu heimildum.

Í samanburði sem birtur er við aðrar gerðir, svo sem Gemini 3 ProOpenAI stefnir að því að ná smá forskoti í nokkrum forritunarviðmiðum, og þar á meðal jafnrétti í samkeppnisprófum eins og LiveCodeBench ProMikilvægt er að hafa í huga að þessar tölur koma frá innri mælingar og getur verið mismunandi eftir framleiðsluumhverfi.

Einkarétt efni - Smelltu hér Hvernig á að opna VBOX skrá

Samþættingar, verkfæri og framboð á Spáni og í Evrópu

GPT-5.1-Codex-Max er nú virkt á yfirborðum sem byggja á CodexOpinberar CLI, IDE viðbætur og kóðaúttektarþjónustur OpenAI vistkerfiFyrirtækið gefur til kynna að aðgangur að almennum API-viðmótum muni koma síðar, sem gerir teymum kleift að hefja prófanir á því í dag. innfæddur verkfæri á meðan þeir undirbúa sérsniðnar samþættingar.

Hvað varðar framboð í atvinnuskyni, þá áætlanirnar ChatGPT Plus, Pro, Business, Edu og Enterprise Þar á meðal er nýja gerðin frá upphafi. Notendur og stofnanir á Spáni og í öðrum heimshlutum. ESB Með þessum áskriftum geturðu virkjað það í flæðunum þínum án þess að þurfa að setja upp fleiri kerfi, svo framarlega sem þú notar samhæf yfirborð Codex.

OpenAI bendir einnig á að líkanið sé fínstillt til að virka í Windows umhverfi, sem víkkar út fyrir Unix og auðveldar notkun þess í fyrirtækjum með blandaða þróunargarða og stöðluð fyrirtækjatól.

Rekstraröryggi og áhættustýringar

Til að draga úr áhættu í löngum framkvæmdum virkar líkanið í einangrað vinnusvæðián leyfis til að skrifa utan sjálfgefins gildissviðs. Ennfremur er nettenging óvirk nema það sé sérstaklega virkjað af ábyrgum forritara, sem styrkir Persónuvernd.

Umhverfið felur í sér ferla sem eftirlit sem greina óeðlilega virkni og trufla ferli ef grunur leikur á misnotkun. Þessi stilling leitast við að vega og meta sjálfstæði umboðsmanna og tryggja hæfilega öryggi fyrir teymi sem stjórna viðkvæmum kóða eða mikilvægum geymslum.

Notkunartilvik þar sem það leggur mest af mörkum

Forritunarlíkan GPT-5.1-Codex-Max

Helsti kosturinn birtist í störfum sem krefjast viðvarandi minnis og samfellu: Umfangsmikil endurgerð, villuleit sem krefst langvarandi eftirlits, stöðugra kóðayfirferða og sjálfvirkni á „pull requests“ í stórum geymslum.Í þessum verkefnum dregur þjöppun úr „slit“ samhengisins og viðheldur samræmi.

Einkarétt efni - Smelltu hér Hvernig á að breyta ræsihljóði Windows 11

Fyrir sprotafyrirtæki og tækniteymi, Að úthluta þessum ferlum yfir á stöðugt líkan gerir kleift að einbeita sér betur að forgangsröðun vörutil að flýta fyrir afhendingum og draga úr villum sem stafa af þreytu eða handvirkri endurtekningu. Allt þetta, með straumlínulagaðri táknnotkun en í fyrri útgáfum.

Fjölþátta verkefni þar sem samfella milli funda er mikilvæg.
Aðstoðað CI/CD með eftirliti og leiðréttingum sem færast fram í bakgrunni.
Stuðningur við framhlið og umsagnir um samhengi í flóknum notendasögum.
Bilunargreining og villuleit langvarandi án þess að útskýra málið aftur á nokkurra klukkustunda fresti.

Mismunur samanborið við Codex og aðrar gerðir

GPT-5.1-Codex-Max samanburður

Helsti munurinn frá klassíska Codex liggur ekki aðeins í hráa kraftinum, heldur einnig í árangursrík samhengisstjórnun Til langs tíma litið skar Codex úr í tilteknum verkefnum; Codex-Max er hannað fyrir viðvarandi ferla, þar sem líkanið virkar sem samstarfsaðili sem missir ekki tökin eftir því sem tíminn líður.

Samanburður við valkosti eins og Gemini 3 Pro Þeir halla sér að GPT-5.1-Codex-Max í nokkrum kóðunarprófum Samkvæmt gögnum sem birt voru, þó Það skynsamlegasta er að sannreyna þessar niðurstöður í okkar eigin umhverfi og með raunverulegu vinnuálagi. áður en það er staðlað í vinnsluferli stofnunar.

Allir sem þurfa kóðastýrða gervigreind sem þolir tæknileg maraþon án þess að þreytast munu finna... GPT-5.1-Codex-Max valkostur sem er sérstaklega sniðinn að samfellu, sjálfgefnu öryggi og skilvirkni tákna; safn eiginleika sem, í teymum á Spáni og í Evrópu með krefjandi takti, geta skilað sér í hraðari afhendingum og fínni viðhaldi kóða.

Tengd grein:

Gemini 3 Pro: Svona kemur nýja gerðin frá Google til Spánar

Alberto navarro

Ég er tækniáhugamaður sem hefur breytt "nörda" áhugamálum sínum í fag. Ég hef eytt meira en 10 árum af lífi mínu í að nota háþróaða tækni og fikta í alls kyns forritum af einskærri forvitni. Nú hef ég sérhæft mig í tölvutækni og tölvuleikjum. Þetta er vegna þess að í meira en 5 ár hef ég skrifað fyrir ýmsar vefsíður um tækni og tölvuleiki, búið til greinar sem leitast við að veita þér þær upplýsingar sem þú þarft á tungumáli sem er skiljanlegt fyrir alla.

Ef þú hefur einhverjar spurningar þá nær þekking mín frá öllu sem tengist Windows stýrikerfinu sem og Android fyrir farsíma. Og skuldbinding mín er til þín, ég er alltaf tilbúin að eyða nokkrum mínútum og hjálpa þér að leysa allar spurningar sem þú gætir haft í þessum internetheimi.