Sztuczna inteligencja Claude z Anthropic gra w Pokémony na Twitchu i zaskakuje swoimi umiejętnościami rozumowania

Ostatnia aktualizacja: 28/02/2025

  • Claude 3.7 Sonnet od Anthropica został przetestowany w grze Pokémon Red na Twitchu.
  • Model sztucznej inteligencji wykazał znaczący postęp w rozumowaniu i podejmowaniu decyzji.
  • Udało mu się pokonać pierwszych trzech Liderów Sali w grze, czego nie udało się dokonać poprzednim wersjom.
  • Anthropic podkreśla wykorzystanie gier wideo jako metody oceny sztucznej inteligencji.
Najważniejszy moment Claude’a Ai w Pokémon

Anthropic zaskoczył świat sztucznej inteligencji pokazując, jak daleko może posunąć się nowy model Claude 3.7 Sonnet w realizacji złożonych zadań. Przy tej okazji i w ramach innowacyjnego testu możliwości, System sztucznej inteligencji został wdrożony do gry Pokémon Red w Twitch, gdzie widzowie mogli śledzić postępy na żywo.

Eksperyment ma na celu pokazanie, w jaki sposób sztuczna inteligencja może podejmować strategiczne decyzje i nauczyć się poruszać w dynamicznym środowisku bez ingerencji człowieka. Jest to kamień milowy w porównaniu z poprzednimi wersjami modelu, którym nie udało się pokonać początkowych barier w grze.

Ekskluzywna zawartość — kliknij tutaj  Kompletny przewodnik po korzystaniu z Google Veo 3: metody, wymagania i wskazówki 2025

Sonet Claude 3.7 pokazuje postęp w rozumowaniu

Klaudiusz 3.7 Sonet

Aby ocenić ulepszenia modelu AI, Anthropic udostępnił mu pewne kluczowe narzędzia: Wyświetlanie pikseli wejściowych, podstawowej pamięci i sterowania przyciskami. Dzięki tym elementom Claude był w stanie interpretować to, co działo się w grze i podejmować decyzje opierając się na jej wewnętrznej logice.

W poprzednich modelach, takich jak Claude 3.0 Sonnet, sztuczna inteligencja Nie udało mu się nawet opuścić domu głównego bohatera.. Jednak w tej nowej wersji system znacznie się rozwinął i udało mu się pokonać Brocka, Misty i porucznika Surge'a, trzech pierwszych Liderów Sali w grze.

Podróż obejmująca 35.000 XNUMX akcji w świecie Pokémon

Claude AI gra w Pokémon

Podróż Claude'a w Pokémon Red nie była łatwa. Według danych udostępnionych przez Anthropic, sztuczna inteligencja wykonała około 35.000 XNUMX akcji aż udało mu się pokonać etap Ciudad Carmín. Dokładny czas trwania tego procesu nie został określony, ale model mógł dostosować się do zmian i uczyć się wzorców podczas występu.

Ekskluzywna zawartość — kliknij tutaj  Google Scholar Labs: Tak działa nowe wyszukiwanie akademickie oparte na sztucznej inteligencji

Wykorzystanie gier wideo do oceny sztucznej inteligencji nie jest niczym nowym. Jednakże eksperyment ten wzmacnia ideę, że Środowiska te mogą stać się podstawowymi narzędziami do pomiaru postępu w modelach sztucznej inteligencji zdolnych do rozumowania i adaptacji.

Poza grą: Claude 3.7 Sonet i jego zastosowania w świecie rzeczywistym

Anthropic przedstawia Claude 3.7 Sonet-2

Oprócz zademonstrowania umiejętności w grze Pokémon Red, Anthropic podkreślił, że jego model sztucznej inteligencji jest w stanie rozwiązywać złożone problemy w takich dziedzinach jak matematyka, programowanie i kodowanie. W ramach udoskonaleń dodano funkcję o nazwie Claude Code, która umożliwia sztucznej inteligencji wyszukiwanie i edycję kodu, uruchamianie testów, a nawet pracę z narzędziami takimi jak GitHub.

Dla zainteresowanych przetestowaniem możliwości modelu Claude 3.7 Sonnet jest teraz dostępny na różnych platformach, w tym: Aplikacja Claude'a, Anthropic API, Amazon Bedrock i Google Cloud, utrzymując ten sam koszt dostępu, co w poprzedniej wersji.

Klaudiusz 3.7 Sonet
Podobne artykuł:
Anthropic przedstawia sonet Claude 3.7: hybrydowa sztuczna inteligencja z zaawansowanym rozumowaniem

Fakt, że Claude 3.7 Sonnet zdołał pokonać kluczowe etapy w Pokémon Red, wzmacnia ideę, że Sztuczna inteligencja robi ogromne postępy w zakresie rozumowania i uczenia się. Ten rodzaj testów otwiera drzwi do Nowe zastosowania w świecie rzeczywistymod automatyzacji zadań po rozwiązywanie złożonych problemów bez ingerencji człowieka.

Ekskluzywna zawartość — kliknij tutaj  Jak poznać moje IQ za pomocą tonometru?