- Claude 3.7 Sonnet van Anthropic is getest met Pokémon Red op Twitch.
- Het AI-model heeft aanzienlijke vooruitgang geboekt op het gebied van redeneren en besluitvorming.
- Het lukte hem om de eerste drie Gym Leaders in het spel te verslaan, iets wat eerdere versies niet lukte.
- Anthropic benadrukt het gebruik van videogames als evaluatiemethode voor kunstmatige intelligentie.
Anthropic heeft de wereld van kunstmatige intelligentie verrast door te laten zien hoe ver het nieuwe model Claude 3.7 Sonnet kan gaan bij complexe taken. Bij deze gelegenheid, en als onderdeel van een innovatieve test van capaciteiten, Het AI-systeem werd ingezet om Pokémon Red te spelen in Trekken, waar kijkers de voortgang live konden volgen.
Het experiment wil laten zien hoe kunstmatige intelligentie kan strategische beslissingen nemen en leren hoe je zonder menselijke tussenkomst door een dynamische omgeving kunt navigeren. Dit is een mijlpaal vergeleken met eerdere versies van het model, die er niet in slaagden om de eerste obstakels in het spel te overwinnen.
Claude 3.7 Sonnet toont vooruitgang in redeneren

Om de verbeteringen aan het AI-model te evalueren, heeft Anthropic het model voorzien van een aantal belangrijke tools: Weergavepixelinvoer, basisgeheugen en knopbediening. Dankzij deze elementen kon Claude interpreteren wat er in het spel gebeurde en beslissingen nemen op basis van de interne logica.
In eerdere modellen, zoals de Claude 3.0 Sonnet, was kunstmatige intelligentie Het lukte hem niet eens om het huis van de hoofdpersoon te verlaten.. In deze nieuwe versie is het systeem echter aanzienlijk verbeterd en is het erin geslaagd om Brock, Misty en Lt. Surge, de eerste drie Gym Leaders in het spel, te verslaan.
Een reis van 35.000 acties binnen de Pokémon-wereld

Claude's reis in Pokémon Red was niet gemakkelijk. Volgens gegevens van Anthropic heeft de AI uitgevoerd ongeveer 35.000 aandelen totdat hij de Ciudad Carmín-fase wist te overwinnen. De exacte tijd die dit proces in beslag nam, werd niet gespecificeerd, maar het vermogen van het model om aanpassen aan veranderingen en patronen leren tijdens hun optreden.
Het gebruik van videogames om kunstmatige intelligentie te evalueren is niet nieuw. Dit experiment versterkt echter het idee dat Deze omgevingen kunnen fundamentele hulpmiddelen worden om de voortgang te meten van AI-modellen die in staat zijn om te redeneren en zich aan te passen.
Verder dan het spel: Claude 3.7 Sonnet en zijn toepassingen in de echte wereld

Naast het demonstreren van vaardigheden binnen Pokémon Red, heeft Anthropic benadrukt dat zijn AI-model in staat is om complexe problemen oplossen op gebieden zoals wiskunde, programmeren en coderen. Een van de verbeteringen is de toevoeging van een functie met de naam Claude Code. Hiermee kan AI code doorzoeken en bewerken, tests uitvoeren en zelfs met tools als GitHub werken.
Voor degenen die geïnteresseerd zijn in het testen van de mogelijkheden van het model, is Claude 3.7 Sonnet nu beschikbaar op verschillende platforms, waaronder De app van Claude, Anthropic API, Amazon Bedrock en Google Cloud, waarbij dezelfde toegangskosten als in de vorige versie behouden blijven.
Het feit dat Claude 3.7 Sonnet erin is geslaagd om belangrijke fasen in Pokémon Red te overwinnen, versterkt het idee dat Kunstmatige intelligentie boekt grote vooruitgang op het gebied van redeneren en leren. Dit type testen opent de deur naar Nieuwe toepassingen in de echte wereld, van het automatiseren van taken tot het oplossen van complexe problemen zonder menselijke tussenkomst.
Ik ben een technologieliefhebber die van zijn 'nerd'-interesses zijn beroep heeft gemaakt. Ik heb meer dan 10 jaar van mijn leven doorgebracht met het gebruik van de allernieuwste technologie en het sleutelen aan allerlei programma's uit pure nieuwsgierigheid. Nu heb ik mij gespecialiseerd in computertechnologie en videogames. Dit komt omdat ik al meer dan vijf jaar voor verschillende websites over technologie en videogames schrijf en artikelen heb gemaakt die proberen u de informatie te geven die u nodig heeft in een taal die voor iedereen begrijpelijk is.
Als je vragen hebt, mijn kennis strekt zich uit van alles wat te maken heeft met het Windows-besturingssysteem tot Android voor mobiele telefoons. En mijn toewijding is aan jou, ik ben altijd bereid om een paar minuten te besteden en je te helpen bij het oplossen van eventuele vragen die je hebt in deze internetwereld.