De AI van Anthropic, Claude, speelt Pokémon op Twitch en verrast met zijn redeneervermogen

Laatste update: 28/02/2025

  • Claude 3.7 Sonnet van Anthropic is getest met Pokémon Red op Twitch.
  • Het AI-model heeft aanzienlijke vooruitgang geboekt op het gebied van redeneren en besluitvorming.
  • Het lukte hem om de eerste drie Gym Leaders in het spel te verslaan, iets wat eerdere versies niet lukte.
  • Anthropic benadrukt het gebruik van videogames als evaluatiemethode voor kunstmatige intelligentie.
Claude Ai's meest kritieke moment in Pokémon

Anthropic heeft de wereld van kunstmatige intelligentie verrast door te laten zien hoe ver het nieuwe model Claude 3.7 Sonnet kan gaan bij complexe taken. Bij deze gelegenheid, en als onderdeel van een innovatieve test van capaciteiten, Het AI-systeem werd ingezet om Pokémon Red te spelen in Trekken, waar kijkers de voortgang live konden volgen.

Het experiment wil laten zien hoe kunstmatige intelligentie kan strategische beslissingen nemen en leren hoe je zonder menselijke tussenkomst door een dynamische omgeving kunt navigeren. Dit is een mijlpaal vergeleken met eerdere versies van het model, die er niet in slaagden om de eerste obstakels in het spel te overwinnen.

Exclusieve inhoud - Klik hier  Complete handleiding voor het gebruik van Google Veo 3: methoden, vereisten en tips 2025

Claude 3.7 Sonnet toont vooruitgang in redeneren

Claude 3.7 Sonnet

Om de verbeteringen aan het AI-model te evalueren, heeft Anthropic het model voorzien van een aantal belangrijke tools: Weergavepixelinvoer, basisgeheugen en knopbediening. Dankzij deze elementen kon Claude interpreteren wat er in het spel gebeurde en beslissingen nemen op basis van de interne logica.

In eerdere modellen, zoals de Claude 3.0 Sonnet, was kunstmatige intelligentie Het lukte hem niet eens om het huis van de hoofdpersoon te verlaten.. In deze nieuwe versie is het systeem echter aanzienlijk verbeterd en is het erin geslaagd om Brock, Misty en Lt. Surge, de eerste drie Gym Leaders in het spel, te verslaan.

Een reis van 35.000 acties binnen de Pokémon-wereld

Claude AI speelt Pokémon

Claude's reis in Pokémon Red was niet gemakkelijk. Volgens gegevens van Anthropic heeft de AI uitgevoerd ongeveer 35.000 aandelen totdat hij de Ciudad Carmín-fase wist te overwinnen. De exacte tijd die dit proces in beslag nam, werd niet gespecificeerd, maar het vermogen van het model om aanpassen aan veranderingen en patronen leren tijdens hun optreden.

Exclusieve inhoud - Klik hier  Google Scholar Labs: zo werkt de nieuwe AI-gestuurde academische zoekfunctie

Het gebruik van videogames om kunstmatige intelligentie te evalueren is niet nieuw. Dit experiment versterkt echter het idee dat Deze omgevingen kunnen fundamentele hulpmiddelen worden om de voortgang te meten van AI-modellen die in staat zijn om te redeneren en zich aan te passen.

Verder dan het spel: Claude 3.7 Sonnet en zijn toepassingen in de echte wereld

Anthropic presenteert Claude 3.7 Sonnet-2

Naast het demonstreren van vaardigheden binnen Pokémon Red, heeft Anthropic benadrukt dat zijn AI-model in staat is om complexe problemen oplossen op gebieden zoals wiskunde, programmeren en coderen. Een van de verbeteringen is de toevoeging van een functie met de naam Claude Code. Hiermee kan AI code doorzoeken en bewerken, tests uitvoeren en zelfs met tools als GitHub werken.

Voor degenen die geïnteresseerd zijn in het testen van de mogelijkheden van het model, is Claude 3.7 Sonnet nu beschikbaar op verschillende platforms, waaronder De app van Claude, Anthropic API, Amazon Bedrock en Google Cloud, waarbij dezelfde toegangskosten als in de vorige versie behouden blijven.

Claude 3.7 Sonnet
Gerelateerd artikel:
Anthropic introduceert Claude 3.7 Sonnet: hybride AI met geavanceerde redenering

Het feit dat Claude 3.7 Sonnet erin is geslaagd om belangrijke fasen in Pokémon Red te overwinnen, versterkt het idee dat Kunstmatige intelligentie boekt grote vooruitgang op het gebied van redeneren en leren. Dit type testen opent de deur naar Nieuwe toepassingen in de echte wereld, van het automatiseren van taken tot het oplossen van complexe problemen zonder menselijke tussenkomst.

Exclusieve inhoud - Klik hier  Hoe weet ik mijn IQ met Tontometer?