- OpenAI udostępnia gpt-oss-120b i gpt-oss-20b jako otwarte modele językowe licencjonowane na podstawie licencji Apache 2.0.
- Umożliwiają one lokalne wykonanie, personalizację, wykorzystanie komercyjne i oferują wydajność zbliżoną do zastrzeżonych modeli, takich jak o3 i o4-mini.
- Skupienie się na zaawansowanym rozumowaniu, myśleniu łańcuchowym i obsłudze autonomicznych narzędzi.
- Bezpieczeństwo jest priorytetem, przeprowadzamy niezależne przeglądy i wdrażamy protokoły chroniące przed złośliwym wykorzystaniem.
OpenAI zmieniło swoją strategię i wprowadził gpt-oss-120b wraz z gpt-oss-20b, pierwszymi modelami językowymi otwarte ciężary które firma opublikowała w ciągu ponad pięciu lat. To wydanie oznacza zerwanie z polityką firmy dotyczącą zamkniętych projektów i otwiera drzwi do deweloperzy, firmy i osoby prywatne mogą korzystać z zaawansowanej sztucznej inteligencji bez konieczności korzystania z zastrzeżonych usług lub ponoszenia dużych kosztów.
Oba modele są już dostępne w bezpłatnie na platformie Hugging Face i są dystrybuowane na licencji Apache 2.0. Dzięki temu każdy użytkownik może uruchamiaj je lokalnie, dostosuj je do konkretnych zadań, zintegruj z własnym oprogramowaniem, a nawet wykorzystaj w celach komercyjnych, bez żadnych dodatkowych opłat lub ograniczeń. OpenAI podkreśla, że dzięki temu ruchowi Celem jest zwiększenie dostępności sztucznej inteligencji na całym świecie oraz wspieranie innowacyjności w oparciu o zasady przejrzystości i odpowiedzialności..
Kluczowe cechy techniczne gpt-oss-120b

Model gpt-oss-120b wyróżnia się architekturą opartą na „mieszance ekspertów” (MoE), co pozwala na zarządzanie 117.000 miliardów parametrów Z niezwykłą wydajnością: na każdy przetworzony token przypada zaledwie 5.100 miliarda aktywowanych tokenów. Dzięki temu, pomimo swoich rozmiarów, możliwe jest uruchomienie na jednym procesorze graficznym o pojemności 80 GB, co jest przystępnym cenowo wymogiem dla ośrodków badawczych i firm o umiarkowanie zaawansowanych zasobach. Wariant gpt-oss-20b jest natomiast przeznaczony dla urządzeń z mniejszą ilością pamięci i może działać na sprzęcie konsumenckim, a nawet laptopach z 16 GB pamięci RAM.
W obu przypadkach, wybrano zaawansowane rozumowanie stosując technikę łańcucha myślowego, pozwalającą na rozbicie każdej odpowiedzi na wyjaśniające kroki pośrednie. Modele są trenowane przy użyciu danych skupionych wokół nauk ścisłych, technicznych, inżynieryjnych i matematycznych (STEM), programowanie i wiedza ogólna, która im to zapewnia solidne podstawy do złożonych zadań i korzystanie ze specjalnych narzędzi, takich jak przeszukiwanie Internetu lub uruchamianie kodu Pythona.
Wydajność i praktyczne zastosowania
Testy porównawcze pokazują, że gpt-oss-120b zbliża się do poziomu o4-mini i przewyższa o3-mini firmy OpenAI w większości zadań programistycznych, matematycznych i medycznych. Model gpt-oss-20b, będąc lżejszym, konkuruje z rozwiązaniami innych firm, takimi jak DeepSeek R1, i przewyższa niektóre testy porównawcze w określonych zadaniach, zwłaszcza na urządzeniach brzegowych.
Kolejną jego mocną stroną jest możliwość dostosowywania:Użytkownik może dostosować stopień rozumowania (niski, średni lub wysoki) w zależności od zadania, równoważąc w ten sposób opóźnienie i dokładnośćTaka konfiguracja, a także opcja uruchamiania modeli w trybie offline i za zaporą sieciową, jest szczególnie przydatna w środowiskach korporacyjnych z ograniczeniami prywatności lub potrzebami audytu.
Bezpieczeństwo, audyt i społeczność
OpenAI zwróciło szczególną uwagę na bezpieczeństwo i redukcja ryzyka w tych modelach, opóźniając ich publikację, aby poddać je rygorystycznej ocenie wewnętrznej i zewnętrznej. Mają Wbudowane filtry i protokoły wyrównywania zapobiegające niewłaściwemu wykorzystaniutakie jak generowanie poufnych informacji lub kradzież tożsamości w obszarach takich jak cyberbezpieczeństwo lub biotechnologia.
Ponadto, Firma zaprosiła społeczność do udziału w wyzwaniach „red teaming”, wyposażony w Fundusz w wysokości 500.000 XNUMX dolarów ma na celu wspieranie wykrywania nowych luk w zabezpieczeniach i nowe zagrożenia.
Jeśli chodzi o ograniczenia, OpenAI zdaje sobie sprawę, żepomimo zaawansowanej architektury, Otwarte modele mogą mieć nieco wyższy wskaźnik „halucynacji” niż ich zastrzeżone odpowiedniki., a jego szkolenie przeprowadzono głównie z wykorzystaniem danych w języku angielskim. Jednakże dokumentacja i wdrożone kontrole ułatwiają audyt i ciągła regulacja tych modeli, promując odpowiedzialne i bezpieczne korzystanie z globalnego ekosystemu sztucznej inteligencji.
Perspektywy integracji, licencjonowania i adopcji
Wagi dla obu modeli są dostępne w formacie MXFP4, a implementacje referencyjne dla PyTorch, Apple Metal i ulepszone wsparcie dla platform takich jak Azure, AWS, vLLM, llama.cpp, LM Studio, Baseten i Cloudflare już istnieją. Licencja Apache 2.0 pozwala niezwykle elastyczne zastosowanie, w tym możliwość ich monetyzacji, redystrybucji i integrowania z narzędziami stron trzecich.
Dla hiszpańskiej i europejskiej społeczności biznesowej pojawienie się gpt-oss-120b i gpt-oss-20b otwiera nowe możliwości automatyzacja analiz, rozwój inteligentnych asystentów y zachować kontrolę nad danymi w ramach własnych infrastruktur, jednocześnie obniżając koszty i przyspieszając cykle innowacji. Biorąc pod uwagę potencjalne znaczenie sztucznej inteligencji w różnych sektorach, Narzędzia te umożliwiają eksperymentowanie i prowadzenie badań w zakresie sztucznej inteligencji bez konieczności korzystania z zewnętrznych interfejsów API lub restrykcyjnych licencji., promując własny rozwój technologiczny.
Dzięki temu postępowi podmioty z sektora technologicznego zyskują dostęp do bardziej otwartych, przejrzystych i elastycznych narzędzi, promując w ten sposób bardziej współpracujący i odpowiedzialny ekosystem innowacji.
Jestem entuzjastą technologii, który swoje „geekowskie” zainteresowania przekształcił w zawód. Spędziłem ponad 10 lat mojego życia, korzystając z najnowocześniejszych technologii i majsterkując przy wszelkiego rodzaju programach z czystej ciekawości. Teraz specjalizuję się w technologii komputerowej i grach wideo. Dzieje się tak dlatego, że od ponad 5 lat piszę dla różnych serwisów poświęconych technologii i grom wideo, tworząc artykuły, których celem jest dostarczenie potrzebnych informacji w języku zrozumiałym dla każdego.
Jeśli masz jakieś pytania, moja wiedza obejmuje wszystko, co jest związane z systemem operacyjnym Windows, a także Androidem dla telefonów komórkowych. Moje zaangażowanie jest wobec Ciebie. Zawsze jestem gotowy poświęcić kilka minut i pomóc Ci rozwiązać wszelkie pytania, jakie możesz mieć w tym internetowym świecie.
