- Dem Anthropic säi Claude 3.7 Sonnet gouf getest fir Pokémon Red op Twitch ze spillen.
- Den AI Modell huet bedeitend Fortschrëtter am Begrënnung an Entscheedungsprozess bewisen.
- Hien huet et fäerdeg bruecht déi éischt dräi Gym Leader am Spill ze besiegen, eppes wat fréier Versiounen net erreecht hunn.
- Anthropic beliicht d'Benotzung vu Videospiller als Evaluatiounsmethod fir kënschtlech Intelligenz.
Anthropic huet d'Welt vun der kënschtlecher Intelligenz iwwerrascht duerch ze weisen wéi wäit säin neie Claude 3.7 Sonnet Modell a komplexen Aufgaben ka goen. Bei dëser Geleeënheet, an als Deel vun engem innovativen Test vu Fäegkeeten, Den AI System gouf gesat fir Pokémon Red ze spillen Twitch, wou Zuschauer de Fortschrëtt live verfollege konnten.
D'Experiment probéiert ze weisen wéi kënschtlech Intelligenz kann strategesch Entscheedungen huelen a léiert en dynamescht Ëmfeld ze navigéieren ouni mënschlech Interventioun. Dëst markéiert e Meilesteen am Verglach zu fréiere Versioune vum Modell, deen et net fäerdeg bruecht huet fréi Barrièren am Spill ze iwwerwannen.
Claude 3.7 Sonnet weist Fortschrëtter am Begrënnung

Fir Verbesserungen vum AI Modell ze evaluéieren, huet Anthropic et mat bestëmmte Schlësselinstrumenter geliwwert: Display Pixel Input, Basis Erënnerung a Knäppchen Kontroll. Dank dësen Elementer konnt de Claude interpretéieren wat am Spill geschitt ass an Entscheedungen huelen op Basis vu senger interner Logik.
A fréiere Modeller, wéi de Claude 3.0 Sonnet, kënschtlech Intelligenz Hien huet et net emol fäerdeg bruecht d'Haus vum Haaptpersonnage ze verloossen.. Wéi och ëmmer, an dëser neier Iteratioun ass de System wesentlech fortgeschratt, et fäerdeg bruecht de Brock, Misty a Lt Surge ze schloen, déi éischt dräi Gym Leaders am Spill.
Eng Rees vu 35.000 Aktiounen an der Pokémon Welt

Dem Claude seng Rees am Pokémon Red war net einfach. Laut Donnéeën zur Verfügung gestallt vun Anthropic, huet d'AI ausgefouert ronn 35.000 Aktien bis et fäerdeg ass d'Ciudad Carmín Etapp ze iwwerwannen. Déi genee Zäit huet dëse Prozess net uginn, awer d'Fäegkeet vum Modell un Ännerungen unzepassen an Mustere léieren während hirer Leeschtung.
Videospiller benotzen fir kënschtlech Intelligenz ze evaluéieren ass net nei. Wéi och ëmmer, dëst Experiment verstäerkt d'Iddi datt Dës Ëmfeld kënne fundamental Tools ginn fir de Fortschrëtt an AI Modeller ze moossen, déi fäeg sinn ze begrënnen an unzepassen.
Iwwert d'Spill: Claude 3.7 Sonnet a seng real-Welt Uwendungen

Zousätzlech fir Fäegkeeten am Pokémon Red ze demonstréieren, huet Anthropic betount datt säin AI Modell fäeg ass komplex Problemer léisen a Beräicher wéi Mathematik, Programméiere a Kodéierung. Als Deel vu senge Verbesserungen ass eng Feature mam Numm Claude Code bäigefüügt, wat AI erlaabt Code ze sichen an z'änneren, Tester auszeféieren an och mat Tools wéi GitHub ze schaffen.
Fir déi, déi interesséiert sinn d'Fäegkeeten vum Modell ze testen, ass de Claude 3.7 Sonnet elo op verschiddene Plattformen verfügbar, inklusiv Dem Claude seng App, Anthropic API, Amazon Bedrock a Google Cloud, déi selwecht Zougangskäschte behalen wéi seng fréier Versioun.
D'Tatsaach datt de Claude 3.7 Sonnet et fäerdeg bruecht huet Schlësselstadien am Pokémon Red ze iwwerwannen, verstäerkt d'Iddi datt Kënschtlech Intelligenz geet mat Sprangen a Grenzen vir a punkto Begrënnung a Léieren. Dës Zort Test mécht d'Dier op Nei real-Welt Uwendungen, vun der Automatiséierung vun Aufgaben bis zur Léisung vu komplexe Probleemer ouni mënschlech Interventioun.
Ech sinn en Technologie-Enthusiast, deen seng "Geek" Interesse an e Beruff ëmgewandelt huet. Ech hu méi wéi 10 Joer vu mengem Liewen verbruecht mat modernste Technologie a mat all Zorte vu Programmer aus purer Virwëtzegkeet ze manipuléieren. Elo hunn ech op Computertechnologie a Videospiller spezialiséiert. Dëst ass well ech zënter méi wéi 5 Joer fir verschidde Websäiten iwwer Technologie a Videospiller geschriwwen hunn, Artikelen erstallt déi probéieren Iech d'Informatioun ze ginn déi Dir braucht an enger Sprooch déi jidderee verständlech ass.
Wann Dir Froen hutt, da läit mäi Wëssen vun allem wat mam Windows Betriebssystem verbonnen ass, souwéi Android fir Handyen. A mäi Engagement ass fir Iech, ech sinn ëmmer bereet e puer Minutten ze verbréngen an Iech ze hëllefen all Froen ze léisen déi Dir an dëser Internetwelt hutt.