Ο AI Claude του Anthropic παίζει Pokémon στο Twitch και εκπλήσσει με την συλλογιστική του ικανότητα

Τελευταία ενημέρωση: 28/02/2025

  • Το σονέτο Claude 3.7 του Anthropic έχει δοκιμαστεί παίζοντας Pokémon Red στο Twitch.
  • Το μοντέλο AI έχει επιδείξει σημαντική πρόοδο στη λογική και τη λήψη αποφάσεων.
  • Κατάφερε να νικήσει τους τρεις πρώτους Gym Leaders στο παιχνίδι, κάτι που δεν κατάφεραν να πετύχουν οι προηγούμενες εκδόσεις.
  • Το Anthropic τονίζει τη χρήση βιντεοπαιχνιδιών ως μέθοδο αξιολόγησης για την τεχνητή νοημοσύνη.
Η πιο κρίσιμη στιγμή του Claude Ai στο Pokémon

Η Anthropic έχει εκπλήξει τον κόσμο της τεχνητής νοημοσύνης δείχνοντας πόσο μακριά μπορεί να φτάσει το νέο μοντέλο Claude 3.7 Sonnet σε περίπλοκες εργασίες. Με αυτή την ευκαιρία, και ως μέρος μιας καινοτόμου δοκιμής ικανοτήτων, Το σύστημα AI τέθηκε για να παίξει το Pokémon Red Twitch, όπου οι θεατές μπορούσαν να παρακολουθήσουν ζωντανά την εξέλιξη.

Το πείραμα επιδιώκει να δείξει πώς μπορεί η τεχνητή νοημοσύνη λήψη στρατηγικών αποφάσεων και να μάθουν να πλοηγούνται σε ένα δυναμικό περιβάλλον χωρίς ανθρώπινη παρέμβαση. Αυτό σηματοδοτεί ένα ορόσημο σε σύγκριση με προηγούμενες εκδόσεις του μοντέλου, οι οποίες απέτυχαν να ξεπεράσουν τα πρώτα εμπόδια μέσα στο παιχνίδι.

Αποκλειστικό περιεχόμενο - Κάντε κλικ εδώ  Πλήρης οδηγός για τη χρήση του Google Veo 3: Μέθοδοι, απαιτήσεις και συμβουλές 2025

Claude 3.7 Sonnet καταδεικνύει προόδους στον συλλογισμό

Σονέτο Claude 3.7

Για να αξιολογήσει τις βελτιώσεις στο μοντέλο AI, η Anthropic του παρείχε ορισμένα βασικά εργαλεία: Εμφάνιση εισόδου pixel, βασικής μνήμης και ελέγχου κουμπιών. Χάρη σε αυτά τα στοιχεία, ο Claude μπόρεσε να ερμηνεύσει τι συνέβαινε στο παιχνίδι και να πάρει αποφάσεις με βάση την εσωτερική του λογική.

Σε προηγούμενα μοντέλα, όπως το Claude 3.0 Sonnet, η τεχνητή νοημοσύνη Δεν πρόλαβε καν να φύγει από το σπίτι του κεντρικού ήρωα.. Ωστόσο, σε αυτή τη νέα επανάληψη, το σύστημα έχει προχωρήσει σημαντικά, καταφέρνοντας να κερδίσει τους Brock, Misty και Lt. Surge, τους τρεις πρώτους Gym Leaders του παιχνιδιού.

Ένα ταξίδι 35.000 ενεργειών στον κόσμο των Pokémon

Ο Claude AI παίζει Pokémon

Το ταξίδι του Claude στο Pokémon Red δεν ήταν εύκολο. Σύμφωνα με στοιχεία που έδωσε το Anthropic, το AI εκτελέστηκε περίπου 35.000 μετοχές μέχρι να καταφέρει να ξεπεράσει τη σκηνή του Ciudad Carmín. Δεν προσδιορίστηκε ο ακριβής χρόνος που χρειάστηκε αυτή η διαδικασία, αλλά η ικανότητα του μοντέλου προσαρμόζονται στις αλλαγές και μαθαίνουν πρότυπα κατά την παράστασή τους.

Αποκλειστικό περιεχόμενο - Κάντε κλικ εδώ  Google Scholar Labs: Έτσι λειτουργεί η νέα ακαδημαϊκή αναζήτηση με τεχνητή νοημοσύνη

Η χρήση βιντεοπαιχνιδιών για την αξιολόγηση της τεχνητής νοημοσύνης δεν είναι νέα. Ωστόσο, αυτό το πείραμα ενισχύει την ιδέα ότι Αυτά τα περιβάλλοντα μπορούν να γίνουν θεμελιώδη εργαλεία για τη μέτρηση της προόδου σε μοντέλα τεχνητής νοημοσύνης ικανά να συλλογιστούν και να προσαρμοστούν.

Πέρα από το παιχνίδι: Claude 3.7 Sonnet και οι εφαρμογές του στον πραγματικό κόσμο

Το Anthropic παρουσιάζει τον Claude 3.7 Sonnet-2

Εκτός από την επίδειξη δεξιοτήτων στο Pokémon Red, η Anthropic έχει τονίσει ότι το μοντέλο AI της είναι ικανό να επιλύουν πολύπλοκα προβλήματα σε τομείς όπως τα μαθηματικά, ο προγραμματισμός και η κωδικοποίηση. Ως μέρος των βελτιώσεων του, προστέθηκε ένα χαρακτηριστικό που ονομάζεται Claude Code, το οποίο επιτρέπει στην τεχνητή νοημοσύνη να αναζητά και να επεξεργάζεται κώδικα, να εκτελεί δοκιμές και ακόμη και να εργάζεται με εργαλεία όπως το GitHub.

Για όσους ενδιαφέρονται να δοκιμάσουν τις δυνατότητες του μοντέλου, το Claude 3.7 Sonnet είναι πλέον διαθέσιμο σε διάφορες πλατφόρμες, όπως Η εφαρμογή του Claude, το Anthropic API, το Amazon Bedrock και το Google Cloud, διατηρώντας το ίδιο κόστος πρόσβασης με την προηγούμενη έκδοσή του.

Σονέτο Claude 3.7
σχετικό άρθρο:
Η Anthropic παρουσιάζει το Σονέτο Claude 3.7: Hybrid AI with Advanced Reasoning

Το γεγονός ότι ο Claude 3.7 Sonnet κατάφερε να ξεπεράσει βασικά στάδια στο Pokémon Red ενισχύει την ιδέα ότι Η τεχνητή νοημοσύνη προχωρά με άλματα και όρια όσον αφορά τη λογική και τη μάθηση. Αυτός ο τύπος δοκιμών ανοίγει την πόρτα σε Νέες εφαρμογές πραγματικού κόσμου, από την αυτοματοποίηση εργασιών έως την επίλυση σύνθετων προβλημάτων χωρίς ανθρώπινη παρέμβαση.

Αποκλειστικό περιεχόμενο - Κάντε κλικ εδώ  Πώς μπορώ να γνωρίζω το IQ μου με το τονόμετρο;