Kursförändring: OpenAI förbereder en AI-modell med öppen vikt

OpenAI kommer att släppa en ny öppenviktad språkmodell med avancerade resonemang.
Det kommer att tillåta lokal exekvering och viss nivå av anpassning, även om det inte kommer att vara helt öppen källkod.
Altman erkänner en förändring i strategin på företaget, under press från konkurrenter som Meta och DeepSeek.
OpenAI kommer att vara värd för globala evenemang för att samla feedback från communityn innan lanseringen.

Öppen AI, företaget bakom populära artificiell intelligensutveckling som ChatGPT, har bekräftat att man arbetar med lanseringen av en ny språkmodell som kommer att markera en vändpunkt viktig i sin politik för teknisk öppenhet. Denna modell, klassificerad som "öppen vikt", kommer att innehålla avancerade resonemang och utvecklingsmöjligheter kan köras på lokala enheter, vilket representerar ett viktigt steg mot en större decentralisering av användningen av AI.

Sam Altman, verkställande direktör för OpenAI, förklarade att denna rörelse Det representerar en betydande förändring från det slutna förhållningssätt som företaget har haft de senaste åren.. Även om det inte är en helt öppen källkodsmodell, kommer den att tillåta utvecklare att arbeta direkt med de tränade vikterna i det neurala nätverket, underlättar dess anpassning till olika behov utan att exponera känsliga inre detaljer som datauppsättningar eller hela arkitekturen.

Relaterad artikel:

OpenAI lanserar o3 och o3 Mini: nya modeller för avancerade resonemang inom artificiell intelligens

En ny, mer tillgänglig, men inte helt öppen modell

öppen AI-modell från OpenAI

Den öppna viktmodellen som OpenAI förbereder kommer att vara den första med dessa egenskaper som företaget har lanserat sedan GPT-2 2019. Till skillnad från det första experimentet lovar den nya modellen avancerade resonemangsförmåga, jämförbara med de för o3-mini-modellen, också från OpenAI, som konsoliderar sig som det högsta prestandaförslaget inom universum av halvöppna modeller.

Rent praktiskt kommer det att erbjuda en mellanöppning: Utvecklare kommer att kunna ladda ner vikterna, finjustera dem och integrera dem i sina egna lösningar., men utan tillgång till den ursprungliga utbildningsdatan eller den interna tekniska strukturen. Detta säkerställer kontroll över dess användning, samtidigt som det tillåter viss flexibilitet och samarbete.

Exklusivt innehåll - Klicka här De bästa apparna för artificiell intelligens för att studera och få bättre betyg

Beslutet kommer mitt i ett växande konkurrenstryck. Modeller som Metas Llama eller Googles Gemma har vunnit mark i ekosystemet tack vare ett mer öppet förhållningssätt. I själva verket erkänner OpenAI att man i flera år har haft en mycket sluten hållning, något som Altman har beskrivit som "att vara på fel sida av historien".

Relaterad artikel:

Google lanserar Gemma 3: dess mest avancerade AI med öppen källkod för en enda GPU

Lyssna på samhället: evenemang för att samla in input

För att anpassa den nya modellen till tekniska användares verkliga förväntningar har OpenAI initierat en omgång av direkt samarbete med samhället. Genom ett återkopplingsformulär på sin webbplats söker den åsikter om vilka funktioner du skulle vilja se implementerade i det nya verktyget.

Dessutom planerar företaget att utvecklas evenemang på plats testning och möte med utvecklare. De första sessionerna kommer att äga rum i San Francisco och kommer senare att expandera till städer i Europa och Asien-Stillahavsområdet. Dessa möten kommer att tillåta oss att visa upp första prototyper och samla in förslag på förbättringar innan den officiella lanseringen.

Steven Heidel, en medlem av OpenAI tekniska team, bekräftade att modellen kommer att kunna köras på lokal hårdvara. Denna detalj är relevant, eftersom eliminerar exklusivt beroende av molntjänster, ger vika för lösningar med större självständighet och integritet.

Relaterad artikel:

Hugging Face släpper en öppen klon av DeepSeek-R1-modellen

Risker, kontroll och etiskt ramverk för användning

AI-modell med öppna vikter

Entusiasm för mer tillgängliga modeller samexisterar med oro över deras missbruk. Forskare och säkerhetsexperter har varnat för att sådana kraftfulla verktyg, som kan modifieras efter publicering, kan underlätta skadlig användning.

Exklusivt innehåll - Klicka här Ny kontrovers kring en Xbox-jobbannons med en AI-genererad bild

Som svar på detta har medlemmar av OpenAI-säkerhetsteamet, såsom Johannes Heidecke, betonat att modellen kommer att gå igenom en rigorös granskningsprocess. bedömning enligt "Preparedness Framework" av företaget. OpenAI försäkrar att de inte kommer att släppa någon version som utgör en katastrofal risk för samhället.

Dessutom kan implicita begränsningar sättas i användningslicensen, vilket begränsar aktiviteter som omvänd konstruktion eller användning i känsliga sammanhang i vissa länder. För närvarande har OpenAI inte specificerat detaljer om licensen under vilken modellen kommer att distribueras.

Ett svar på en allt mer konkurrensutsatt industri

Den planerade lanseringen av modellen med öppen vikt kommer vid en tidpunkt då kapplöpningen om AI-herravälde har intensifierats. DeepSeek, ett kinesiskt AI-labb, har fått stor uppmärksamhet med sin helt öppna R1-modell, som kan matcha eller till och med överträffa några av OpenAI:s egna modeller till en bråkdel av den typiska utvecklingskostnaden.

Likaså har Meta med sin Llama-familj och Google med Gemma konsoliderat förslag inom öppen källkodsområdet. Detta har tvingat OpenAI för att ompröva sin strategi, väljer en partiell öppning för att inte tappa greppet mot sina huvudkonkurrenter.

Även om tekniska detaljer som antalet modellparametrar, sammanhangsfönstret eller träningsmetoderna som tillämpas ännu inte har avslöjats, har Altman försäkrat att det kommer att vara en modell "mycket konkurrenskraftig i resonemang", vilket lämnar dörren öppen för att den ska kunna positionera sig över andra befintliga öppna alternativ.

Relaterad artikel:

Hur man skapar 3D-modeller från 2D-bilder

Vad är en öppenviktsmodell egentligen?

Jämförelse av modeller med öppen vikt

I en värld av artificiell intelligens är en "öppen vikt" modell en som gör sina tränade vikter offentligt tillgängliga. Dessa vikter är de numeriska värden som genereras under din träningsprocess och som låter dig göra förutsägelser eller generera text.

Exklusivt innehåll - Klicka här Vad är artificiell intelligens (AI) och maskininlärning?

Till skillnad från helt öppna modeller som också exponerar källkod, träningsdata och arkitektur, erbjuder öppenviktsmodeller mindre transparens men större användbarhet än slutna modeller som endast är tillgängliga via API:er.

Detta gör det möjligt för utvecklare Anpassa befintliga modeller utan att börja om från början, uppnå specifika anpassningar till lägre kostnader. Det underlättar också lokalt utförande, vilket är särskilt användbart för företag eller myndigheter som kräver större integritet.

Relaterad artikel:

Hur man skapar 3D-modeller med Hunyuan3D nästan utan ansträngning

Framåtblick: modellen som en vändpunkt

Med detta initiativ försöker OpenAI inte bara konkurrera tekniskt utan också bygga om broar med en utvecklargemenskap som värdesätter samarbete, öppenhet och teknisk autonomi.

Det finns inget officiellt releasedatum ännu, men det förväntas ske någon gång under andra halvan av 2025. Under tiden, Tester, händelser och feedback kommer att sätta kursen. av vad som kan vara en av OpenAI:s mest ambitiösa satsningar sedan starten.

Även om det inte är helt öppet, representerar beslutet att släppa en öppen viktmodell med avancerade resonemangsmöjligheter en vändpunkt. viktig strategisk för OpenAI. I en alltmer konkurrensutsatt miljö och med allt öppnare modeller försöker detta drag att placera företaget i en mellanting mellan absolut kontroll och transparens, bibehålla ledarskapet utan att tappa kontakten med det globala tekniska samhället.

Alberto Navarro

Jag är en teknikentusiast som har gjort sina "nördar"-intressen till ett yrke. Jag har tillbringat mer än 10 år av mitt liv med att använda den senaste tekniken och mixtrat med alla typer av program av ren nyfikenhet. Nu har jag specialiserat mig på datateknik och tv-spel. Detta beror på att jag i mer än 5 år har arbetat med att skriva för olika webbplatser om teknik och videospel, skapa artiklar som försöker ge dig den information du behöver på ett språk som är begripligt för alla.

Om du har några frågor sträcker sig min kunskap från allt som rör operativsystemet Windows samt Android för mobiltelefoner. Och mitt engagemang är för dig, jag är alltid villig att spendera några minuter och hjälpa dig att lösa alla frågor du kan ha i den här internetvärlden.