- OpenAI 發布 gpt-oss-120b 和 gpt-oss-20b 作為根據 Apache 2.0 許可證授權的開放權重語言模型。
- 它們允許本地執行、定制、商業使用,並提供接近 o3 和 o4-mini 等專有模型的性能。
- 專注於高階推理、鍊式思維和對自主工具的支援。
- 安全一直是首要任務,並設有獨立審查和防止惡意使用的協議。
OpenAI改變了策略 並推出了 GPT-OSS-120B 和 GPT-OSS-20B,這是 開放式重量 該公司五年多來一直在發布新作品。此次發布標誌著該公司打破了封閉式開發政策,並打開了 開發者、公司和個人 可以使用先進的人工智慧,而無需依賴專有服務或產生大量成本。
兩種型號現已上市 在 Hugging Face 平台上免費 並根據 Apache 2.0 許可證分發。這允許任何用戶 在本地運行它們,使它們適應特定的任務,將它們整合到您自己的軟體中,甚至將它們用於商業目的,而無需任何額外的付款或限制。 OpenAI 強調這項運動 它致力於讓人工智慧在全球範圍內更容易獲得,並在透明和問責的框架內促進創新。.
GPT-OSS-120B 的關鍵技術特性

GPT-OSS-120B 模型因其基於「混合專家」(MoE)的架構而脫穎而出,讓您管理 117.000億個參數 效率卓越:每個處理過的代幣僅啟動 5.100 億個代幣。這使得它儘管規模龐大,卻可以在單一 80 GB 的 GPU 上運行,這對於擁有中等先進資源的研究中心和公司來說,是可承受的。同時,gpt-oss-20b 版本針對記憶體較小的設備,可以在消費級硬體甚至配備 16 GB RAM 的筆記型電腦上運行。
在這兩種情況下 選擇了高級推理 使用思路鏈技術,將每個反應分解為解釋性的中間步驟。 這些模型使用以 STEM 為重點的資料進行訓練、程式設計和常識,為他們提供 為複雜任務奠定堅實的基礎 以及使用特定工具,例如網路搜尋或運行 Python 程式碼。
性能和實際應用
對比試驗表明 gpt-oss-120b 接近 o4-mini 的水平 並且在大多數程式設計、數學競賽和醫療保健任務上均優於 OpenAI 的 o3-mini。 gpt-oss-20b 車型更輕量,能夠與 DeepSeek R1 等第三方解決方案相媲美,並在特定任務(尤其是在邊緣設備上)上超越某些基準測試。
它的另一個優點是 可定制性:使用者可根據任務調整推理程度(低、中或高), 從而平衡延遲和準確性此配置以及離線和防火牆後運行模型的選項在具有隱私限製或審計需求的公司環境中特別有用。
安全、審計和社區
OpenAI 特別關注 安全和降低風險 在這些模型中,推遲發表,以便對其進行嚴格的內部和外部評估。他們 內建過濾器和校準協議,防止誤用,例如網路安全或生物技術等領域的敏感資訊的產生或身分盜竊。
另外, 該公司邀請社區參與紅隊挑戰,配備了 500.000萬美元基金鼓勵發現新的漏洞 以及新出現的威脅。
至於限制, OpenAI 認識到儘管其架構先進, 開放模型的「幻覺」發生率可能比專有模型略高。,其培訓主要使用英語數據進行。然而,現有的文件和控制措施有助於審計和 這些模型的不斷調整,促進全球人工智慧生態系統內負責任和安全的使用。
整合、授權和採用前景
兩種型號的權重均以 MXFP4 格式提供,並且已提供 PyTorch 和 Apple Metal 的參考實現,並改進了對 Azure、AWS、vLLM、llama.cpp、LM Studio、Baseten 和 Cloudflare 等平台的支援。 Apache 2.0 許可證允許 使用極為靈活,包括將其貨幣化、重新分發以及整合到第三方工具中的可能性。
對於西班牙和歐洲商界來說,gpt-oss-120b 和 gpt-oss-20b 的到來為 自動化分析,開發智慧助手 y 保持對數據的控制 在自身基礎設施內,同時降低成本並加速創新週期。考慮到人工智慧在不同領域的潛在重要性, 這些工具可讓您在 AI 中進行實驗和研究,而無需依賴外部 API 或限制性授權。,促進自身的技術發展。
這項進步使科技業參與者能夠使用更開放、透明和更具適應性的工具,從而促進更具協作性和負責任的創新生態系統。
我是一名技術愛好者,已將自己的“極客”興趣變成了職業。出於純粹的好奇心,我花了 10 多年的時間使用尖端技術並修改各種程序。現在我專攻電腦技術和電玩遊戲。這是因為五年多來,我一直在為各種技術和視頻遊戲網站撰寫文章,力求以每個人都能理解的語言為您提供所需的資訊。
如果您有任何疑問,我的知識範圍涵蓋與 Windows 作業系統以及手機 Android 相關的所有內容。我對您的承諾是,我總是願意花幾分鐘幫助您解決在這個網路世界中可能遇到的任何問題。
