- Το σονέτο Claude 3.7 του Anthropic έχει δοκιμαστεί παίζοντας Pokémon Red στο Twitch.
- Το μοντέλο AI έχει επιδείξει σημαντική πρόοδο στη λογική και τη λήψη αποφάσεων.
- Κατάφερε να νικήσει τους τρεις πρώτους Gym Leaders στο παιχνίδι, κάτι που δεν κατάφεραν να πετύχουν οι προηγούμενες εκδόσεις.
- Το Anthropic τονίζει τη χρήση βιντεοπαιχνιδιών ως μέθοδο αξιολόγησης για την τεχνητή νοημοσύνη.
Η Anthropic έχει εκπλήξει τον κόσμο της τεχνητής νοημοσύνης δείχνοντας πόσο μακριά μπορεί να φτάσει το νέο μοντέλο Claude 3.7 Sonnet σε περίπλοκες εργασίες. Με αυτή την ευκαιρία, και ως μέρος μιας καινοτόμου δοκιμής ικανοτήτων, Το σύστημα AI τέθηκε για να παίξει το Pokémon Red Twitch, όπου οι θεατές μπορούσαν να παρακολουθήσουν ζωντανά την εξέλιξη.
Το πείραμα επιδιώκει να δείξει πώς μπορεί η τεχνητή νοημοσύνη λήψη στρατηγικών αποφάσεων και να μάθουν να πλοηγούνται σε ένα δυναμικό περιβάλλον χωρίς ανθρώπινη παρέμβαση. Αυτό σηματοδοτεί ένα ορόσημο σε σύγκριση με προηγούμενες εκδόσεις του μοντέλου, οι οποίες απέτυχαν να ξεπεράσουν τα πρώτα εμπόδια μέσα στο παιχνίδι.
Claude 3.7 Sonnet καταδεικνύει προόδους στον συλλογισμό

Για να αξιολογήσει τις βελτιώσεις στο μοντέλο AI, η Anthropic του παρείχε ορισμένα βασικά εργαλεία: Εμφάνιση εισόδου pixel, βασικής μνήμης και ελέγχου κουμπιών. Χάρη σε αυτά τα στοιχεία, ο Claude μπόρεσε να ερμηνεύσει τι συνέβαινε στο παιχνίδι και να πάρει αποφάσεις με βάση την εσωτερική του λογική.
Σε προηγούμενα μοντέλα, όπως το Claude 3.0 Sonnet, η τεχνητή νοημοσύνη Δεν πρόλαβε καν να φύγει από το σπίτι του κεντρικού ήρωα.. Ωστόσο, σε αυτή τη νέα επανάληψη, το σύστημα έχει προχωρήσει σημαντικά, καταφέρνοντας να κερδίσει τους Brock, Misty και Lt. Surge, τους τρεις πρώτους Gym Leaders του παιχνιδιού.
Ένα ταξίδι 35.000 ενεργειών στον κόσμο των Pokémon

Το ταξίδι του Claude στο Pokémon Red δεν ήταν εύκολο. Σύμφωνα με στοιχεία που έδωσε το Anthropic, το AI εκτελέστηκε περίπου 35.000 μετοχές μέχρι να καταφέρει να ξεπεράσει τη σκηνή του Ciudad Carmín. Δεν προσδιορίστηκε ο ακριβής χρόνος που χρειάστηκε αυτή η διαδικασία, αλλά η ικανότητα του μοντέλου προσαρμόζονται στις αλλαγές και μαθαίνουν πρότυπα κατά την παράστασή τους.
Η χρήση βιντεοπαιχνιδιών για την αξιολόγηση της τεχνητής νοημοσύνης δεν είναι νέα. Ωστόσο, αυτό το πείραμα ενισχύει την ιδέα ότι Αυτά τα περιβάλλοντα μπορούν να γίνουν θεμελιώδη εργαλεία για τη μέτρηση της προόδου σε μοντέλα τεχνητής νοημοσύνης ικανά να συλλογιστούν και να προσαρμοστούν.
Πέρα από το παιχνίδι: Claude 3.7 Sonnet και οι εφαρμογές του στον πραγματικό κόσμο

Εκτός από την επίδειξη δεξιοτήτων στο Pokémon Red, η Anthropic έχει τονίσει ότι το μοντέλο AI της είναι ικανό να επιλύουν πολύπλοκα προβλήματα σε τομείς όπως τα μαθηματικά, ο προγραμματισμός και η κωδικοποίηση. Ως μέρος των βελτιώσεων του, προστέθηκε ένα χαρακτηριστικό που ονομάζεται Claude Code, το οποίο επιτρέπει στην τεχνητή νοημοσύνη να αναζητά και να επεξεργάζεται κώδικα, να εκτελεί δοκιμές και ακόμη και να εργάζεται με εργαλεία όπως το GitHub.
Για όσους ενδιαφέρονται να δοκιμάσουν τις δυνατότητες του μοντέλου, το Claude 3.7 Sonnet είναι πλέον διαθέσιμο σε διάφορες πλατφόρμες, όπως Η εφαρμογή του Claude, το Anthropic API, το Amazon Bedrock και το Google Cloud, διατηρώντας το ίδιο κόστος πρόσβασης με την προηγούμενη έκδοσή του.
Το γεγονός ότι ο Claude 3.7 Sonnet κατάφερε να ξεπεράσει βασικά στάδια στο Pokémon Red ενισχύει την ιδέα ότι Η τεχνητή νοημοσύνη προχωρά με άλματα και όρια όσον αφορά τη λογική και τη μάθηση. Αυτός ο τύπος δοκιμών ανοίγει την πόρτα σε Νέες εφαρμογές πραγματικού κόσμου, από την αυτοματοποίηση εργασιών έως την επίλυση σύνθετων προβλημάτων χωρίς ανθρώπινη παρέμβαση.
Είμαι λάτρης της τεχνολογίας που έχει μετατρέψει τα «γκικ» ενδιαφέροντά του σε επάγγελμα. Έχω περάσει περισσότερα από 10 χρόνια της ζωής μου χρησιμοποιώντας τεχνολογία αιχμής και ασχολούμαι με όλα τα είδη προγραμμάτων από καθαρή περιέργεια. Τώρα έχω ειδικευτεί στην τεχνολογία υπολογιστών και στα βιντεοπαιχνίδια. Αυτό οφείλεται στο γεγονός ότι για περισσότερα από 5 χρόνια εργάζομαι γράφοντας για διάφορους ιστότοπους σχετικά με την τεχνολογία και τα βιντεοπαιχνίδια, δημιουργώντας άρθρα που επιδιώκουν να σας δώσουν τις πληροφορίες που χρειάζεστε σε μια γλώσσα κατανοητή από όλους.
Αν έχετε απορίες, οι γνώσεις μου κυμαίνονται από οτιδήποτε σχετίζεται με το λειτουργικό σύστημα Windows καθώς και με Android για κινητά τηλέφωνα. Και η δέσμευσή μου είναι απέναντί σας, είμαι πάντα πρόθυμος να αφιερώσω λίγα λεπτά και να σας βοηθήσω να επιλύσετε τυχόν απορίες που μπορεί να έχετε σε αυτόν τον κόσμο του Διαδικτύου.