Ang OpenAI ay tumataya sa isang 'open-weight' na modelo: ito ang magiging hitsura ng bago nitong AI na may advanced na pangangatwiran.

Huling pag-update: 01/04/2025

  • Maglalabas ang OpenAI ng bagong open-weighted na modelo ng wika na may advanced na pangangatwiran.
  • Papayagan nito ang lokal na pagpapatupad at ilang antas ng pagpapasadya, bagama't hindi ito magiging ganap na open source.
  • Kinikilala ni Altman ang isang pagbabago sa diskarte sa kumpanya, sa ilalim ng presyon mula sa mga kakumpitensya tulad ng Meta at DeepSeek.
  • Magho-host ang OpenAI ng mga pandaigdigang kaganapan upang mangalap ng feedback ng komunidad bago ilunsad.
OpenAI 'open-weight' na modelo

 

OpenAI, ang kumpanya sa likod ng mga sikat na pagpapaunlad ng artificial intelligence tulad ng ChatGPT, ay nakumpirma na ito ay nagtatrabaho sa paglulunsad ng isang bagong modelo ng wika na magmarka ng isang pagbabago mahalaga sa patakarang pagiging bukas ng teknolohiya nito. Ang modelong ito, inuri bilang "bukas na timbang", ay magsasama ng mga advanced na pangangatwiran at mga kakayahan sa pag-unlad maaaring patakbuhin sa mga lokal na device, na kumakatawan sa isang mahalagang hakbang tungo sa higit na desentralisasyon ng paggamit ng AI.

Sam Altman, executive director ng OpenAI, ipinaliwanag na ang kilusang ito Ito ay kumakatawan sa isang makabuluhang pagbabago mula sa saradong diskarte na pinanatili ng kumpanya sa mga nakaraang taon.. Bagama't hindi ito isang ganap na open source na modelo, ito ay magbibigay-daan sa mga developer na gumana nang direkta sa mga sinanay na timbang ng neural network, pinapadali ang pagbagay nito sa iba't ibang pangangailangan nang hindi inilalantad ang mga sensitibong panloob na detalye gaya ng mga data set o ang buong arkitektura.

o3 at o3 mini-2
Kaugnay na artikulo:
Inilunsad ng OpenAI ang o3 at o3 Mini: mga bagong modelo para sa advanced na pangangatwiran sa artificial intelligence

Isang bago, mas naa-access, ngunit hindi ganap na bukas na modelo

open-weight AI model mula sa OpenAI

Ang modelong open-weight na inihahanda ng OpenAI ang magiging una sa mga katangiang ito na inilunsad ng kumpanya mula noon GPT-2 noong 2019. Hindi tulad ng unang eksperimento na iyon, nangangako ang bagong modelo advanced na mga kasanayan sa pangangatwiran, maihahambing sa mga modelo ng o3-mini, mula rin sa OpenAI, na pinagsasama-sama ang sarili bilang panukalang may pinakamataas na pagganap sa loob ng uniberso ng mga semi-open na modelo.

Sa mga praktikal na termino, mag-aalok ito ng intermediate opening: Magagawa ng mga developer na i-download ang mga timbang, i-fine-tune ang mga ito, at isama ang mga ito sa sarili nilang mga solusyon., ngunit walang access sa orihinal na data ng pagsasanay o sa panloob na istrukturang teknikal. Tinitiyak nito ang kontrol sa paggamit nito, habang nagbibigay-daan para sa ilang flexibility at pakikipagtulungan.

Eksklusibong nilalaman - Mag-click Dito  Libre na ang Gemini 2.5 Pro: Narito kung paano gumagana ang pinakakomprehensibong modelo ng AI ng Google.

Dumarating ang desisyon sa gitna ng lumalagong presyur sa kompetisyon. Ang mga modelo tulad ng Meta's Llama o Google's Gemma ay nakakuha ng lupa sa ecosystem salamat sa isang mas bukas na diskarte. Sa katunayan, kinikilala ng OpenAI na sa loob ng maraming taon ay pinanatili nito ang isang napakasaradong paninindigan, isang bagay na inilarawan ni Altman bilang "pagiging nasa maling panig ng kasaysayan".

Inilunsad ng Google ang Gemma 3-4
Kaugnay na artikulo:
Inilunsad ng Google ang Gemma 3: ang pinaka-advanced na open-source na AI nito para sa isang GPU

Pakikinig sa komunidad: mga kaganapan upang mangalap ng input

Upang maiangkop ang bagong modelo sa mga tunay na inaasahan ng mga teknikal na gumagamit, sinimulan ng OpenAI ang isang round ng direktang pakikipagtulungan sa komunidad. Sa pamamagitan ng isang form ng feedback sa website nito, naghahanap ito ng mga opinyon sa kung anong mga tampok ang gusto mong makitang ipinatupad sa bagong tool.

Bilang karagdagan, ang kumpanya ay nagpaplano na bumuo eventos presenciales pagsubok at pakikipagpulong sa mga developer. Ang mga unang session ay magaganap sa San Francisco, at sa kalaunan ay lalawak sa mga lungsod sa Europa at sa rehiyon ng Asia-Pacific. Ang mga pagpupulong na ito ay magbibigay-daan sa amin na magpakita ng mga paunang prototype at mangalap ng mga mungkahi para sa mga pagpapabuti bago ang opisyal na paglulunsad.

Si Steven Heidel, isang miyembro ng OpenAI technical team, ay nakumpirma na ang modelo ay maaaring tumakbo sa lokal na hardware. Ang detalyeng ito ay may kaugnayan, dahil inaalis ang eksklusibong pag-asa sa mga serbisyo ng cloud, nagbibigay daan sa mga solusyon na may higit na awtonomiya at privacy.

DeepSeek-R1 bukas na clone
Kaugnay na artikulo:
Ang Hugging Face ay naglabas ng bukas na clone ng DeepSeek-R1 na modelo

Mga panganib, kontrol at etikal na balangkas ng paggamit

AI model na may open weights

Ang sigasig para sa mas madaling ma-access na mga modelo ay kasabay ng mga alalahanin tungkol sa kanilang maling paggamit. Nagbabala ang mga mananaliksik at mga eksperto sa seguridad na ang gayong makapangyarihang mga tool, na maaaring baguhin pagkatapos mailathala, ay maaaring mapadali ang malisyosong paggamit.

Eksklusibong nilalaman - Mag-click Dito  Opisyal na ngayon ang Jetson AGX Thor: ito ang kit ng NVIDIA para magbigay ng tunay na awtonomiya sa mga robot na pang-industriya, medikal, at humanoid.

Bilang tugon dito, ang mga miyembro ng OpenAI security team, tulad ni Johannes Heidecke, ay nagbigay-diin na ang modelo ay dadaan sa isang mahigpit na proseso ng pag-vetting. pagtatasa ayon sa "Preparedness Framework" ng kumpanya. Tinitiyak ng OpenAI na hindi nito ilalabas ang anumang bersyon na nagdudulot ng malaking panganib sa lipunan.

Bilang karagdagan, maaaring magtakda ng mga implicit na limitasyon sa lisensya sa paggamit, na naghihigpit sa mga aktibidad gaya ng reverse engineering o paggamit sa mga sensitibong konteksto sa ilang partikular na bansa. Sa ngayon, hindi pa tinukoy ng OpenAI ang mga detalye tungkol sa lisensya kung saan ipapamahagi ang modelo.

Isang tugon sa lalong lumalagong industriya

Ang nakaplanong paglulunsad ng open-weight na modelo ay dumating sa panahon na ang karera para sa AI supremacy ay tumindi. DeepSeek, isang Chinese AI lab, ay nakakuha ng malaking atensyon sa ganap nitong bukas na modelong R1, na may kakayahang tumugma o kahit na lampasan ang ilan sa mga pinagmamay-ariang modelo ng OpenAI sa isang maliit na bahagi ng karaniwang gastos sa pagpapaunlad.

Gayundin, ang Meta kasama ang pamilyang Llama nito at ang Google kasama si Gemma ay may pinagsama-samang mga panukala sa open-source field. Ito ay pinilit OpenAI upang pag-isipang muli ang diskarte nito, pinipili ang bahagyang pagbubukas upang hindi mawala ang traksyon laban sa mga pangunahing kakumpitensya nito.

Bagama't ang mga teknikal na detalye tulad ng bilang ng mga parameter ng modelo, ang window ng konteksto o ang mga pamamaraan ng pagsasanay na inilapat ay hindi pa naihayag, tiniyak ni Altman na ito ay magiging isang modelo "napaka competitive sa pangangatwiran", na nag-iiwan sa pinto na bukas para ito ay iposisyon ang sarili sa itaas ng iba pang umiiral na bukas na mga alternatibo.

crear modelos 3D
Kaugnay na artikulo:
Paano lumikha ng mga modelong 3D mula sa mga 2D na imahe

Ano ba talaga ang open-weight model?

Paghahambing ng mga modelo ng open-weight

Sa mundo ng artificial intelligence, ang isang "open-weight" na modelo ay isa na ginagawang available sa publiko ang kanyang sinanay na mga timbang. Ang mga timbang na ito ay ang mga numerical na halaga na nabuo sa panahon ng iyong proseso ng pagsasanay at nagbibigay-daan sa iyong gumawa ng mga hula o bumuo ng teksto.

Eksklusibong nilalaman - Mag-click Dito  Ano ang Azure SRE Agent: Lahat ng kailangan mong malaman tungkol sa ahente ng pagiging maaasahan ng Microsoft Azure sa 2025

Hindi tulad ng mga ganap na bukas na modelo na naglalantad din ng source code, data ng pagsasanay, at arkitektura, ang mga open-weight na modelo ay nag-aalok ng mas kaunting transparency ngunit higit na kakayahang magamit kaysa sa mga closed model na maa-access lamang sa pamamagitan ng mga API.

Esto permite a los desarrolladores I-customize ang mga kasalukuyang modelo nang hindi nagsisimula sa simula, pagkamit ng mga partikular na adaptasyon sa mas mababang gastos. Pinapadali din nito ang lokal na pagpapatupad, na lalong kapaki-pakinabang para sa mga negosyo o pamahalaan na nangangailangan ng higit na privacy.

Hunyuan3D
Kaugnay na artikulo:
Paano gumawa ng mga 3D na modelo gamit ang Hunyuan3D nang halos walang kahirap-hirap

Pagtingin sa unahan: ang modelo bilang isang turning point

Sa inisyatiba na ito, hindi lamang hinahangad ng OpenAI na makipagkumpitensya sa teknikal, kundi pati na rin muling itayo ang mga tulay sa isang komunidad ng developer na pinahahalagahan ang pakikipagtulungan, pagiging bukas at teknolohikal na awtonomiya.

Wala pang opisyal na petsa ng pagpapalabas, ngunit inaasahang mangyayari ito sa ikalawang kalahati ng 2025. Samantala, Ang mga pagsubok, kaganapan, at feedback ang magtatakda ng kurso. ng kung ano ang maaaring isa sa mga pinaka-ambisyosong taya ng OpenAI mula nang ito ay mabuo.

Bagama't hindi ganap na bukas, ang desisyon na maglabas ng isang open-weight na modelo na may mga advanced na kakayahan sa pangangatwiran ay kumakatawan sa isang punto ng pagbabago. mahalagang estratehiko para sa OpenAI. Sa isang lalong mapagkumpitensyang kapaligiran at sa lalong nagiging bukas na mga modelo, ang hakbang na ito ay naglalayong iposisyon ang kumpanya sa gitna sa pagitan ng ganap na kontrol at transparency, pagpapanatili ng pamumuno nang hindi nawawala ang pakikipag-ugnayan sa pandaigdigang teknikal na komunidad.