- קלוד 3.7 סונטה של Anthropic נבדק לשחק Pokémon Red ב-Twitch.
- מודל הבינה המלאכותית הוכיח התקדמות משמעותית בהיגיון וקבלת החלטות.
- הוא הצליח להביס את שלושת מובילי הכושר הראשונים במשחק, דבר שגרסאות קודמות לא הצליחו להשיג.
- אנתרופיק מדגישה את השימוש במשחקי וידאו כשיטת הערכה לבינה מלאכותית.
אנתרופיק הפתיעה את עולם הבינה המלאכותית על ידי הדגמה עד כמה דגם קלוד 3.7 סונט החדש שלו יכול להגיע במשימות מורכבות. בהזדמנות זו, וכחלק ממבחן יכולות חדשני, מערכת הבינה המלאכותית הוכנסה לשחק בו Pokémon Red פִּרפּוּר, שם הצופים יכלו לעקוב אחרי ההתקדמות בשידור חי.
הניסוי מבקש להראות כיצד בינה מלאכותית יכולה לקבל החלטות אסטרטגיות וללמוד לנווט בסביבה דינמית ללא התערבות אנושית. זה מסמן אבן דרך בהשוואה לגרסאות קודמות של הדגם, שלא הצליחו להתגבר על מחסומים מוקדמים במשחק.
קלוד 3.7 סונטה מדגים התקדמות בהיגיון

כדי להעריך שיפורים במודל ה-AI, Anthropic סיפקה לו כלים מרכזיים מסוימים: כניסת פיקסלים לתצוגה, זיכרון בסיסי ושליטה בכפתורים. הודות לאלמנטים הללו, קלוד הצליח לפרש את המתרחש במשחק ולקבל החלטות על סמך ההיגיון הפנימי שלו.
בדגמים קודמים, כמו קלוד 3.0 סונט, בינה מלאכותית הוא אפילו לא הספיק לצאת מהבית של הדמות הראשית.. עם זאת, באיטרציה החדשה הזו, המערכת התקדמה במידה ניכרת, והצליחה לנצח את ברוק, מיסטי וסגן סורג', שלושת מובילי חדר הכושר הראשונים במשחק.
מסע של 35.000 פעולות בתוך עולם הפוקימונים

המסע של קלוד בפוקימון אדום לא היה קל. על פי נתונים שסיפקה Anthropic, ה-AI הוצא להורג בסביבות 35.000 מניות עד שהצליחו להתגבר על שלב סיודאד כרמין. לא צוין הזמן המדויק של תהליך זה, אלא יכולתו של הדגם להסתגל לשינויים וללמוד דפוסים במהלך ההופעה שלהם.
השימוש במשחקי וידאו כדי להעריך בינה מלאכותית אינו חדש. עם זאת, ניסוי זה מחזק את הרעיון סביבות אלו יכולות להפוך לכלים בסיסיים למדוד התקדמות במודלים של AI המסוגלים להגיב ולהסתגל.
מעבר למשחק: קלוד 3.7 סונט ויישומי העולם האמיתי שלו

בנוסף להפגנת מיומנויות בתוך Pokémon Red, Anthropic הדגישה שמודל הבינה המלאכותית שלה מסוגל לפתור בעיות מורכבות בתחומים כמו מתמטיקה, תכנות וקידוד. כחלק מהשיפורים שלו, נוספה תכונה בשם Claude Code, המאפשרת AI לחפש ולערוך קוד, להריץ בדיקות ואפילו לעבוד עם כלים כמו GitHub.
למעוניינים לבדוק את יכולות הדגם, קלוד 3.7 Sonnet זמין כעת במגוון פלטפורמות, כולל האפליקציה של קלוד, Anthropic API, Amazon Bedrock ו-Google Cloud, שמירה על אותה עלות גישה כמו הגרסה הקודמת שלה.
העובדה שקלוד 3.7 סונט הצליח להתגבר על שלבים מרכזיים בפוקימון רד מחזקת את הרעיון בינה מלאכותית מתקדמת בצעדי ענק מבחינת חשיבה ולמידה. סוג זה של בדיקות פותח את הדלת יישומים חדשים בעולם האמיתי, מאוטומציה של משימות ועד לפתרון בעיות מורכבות ללא התערבות אנושית.
אני חובב טכנולוגיה שהפך את תחומי העניין ה"חנון" שלו למקצוע. ביליתי יותר מ-10 שנים מחיי בטכנולוגיה מתקדמת והתעסקות עם כל מיני תוכניות מתוך סקרנות טהורה. עכשיו התמחיתי בטכנולוגיית מחשבים ומשחקי וידאו. הסיבה לכך היא שכבר יותר מ-5 שנים אני כותב לאתרים שונים בנושאי טכנולוגיה ומשחקי וידאו, ויוצר מאמרים המבקשים לתת לכם את המידע הדרוש לכם בשפה מובנת לכולם.
אם יש לך שאלות, הידע שלי נע מכל מה שקשור למערכת ההפעלה Windows וכן אנדרואיד לטלפונים ניידים. והמחויבות שלי היא אליך, אני תמיד מוכן להקדיש כמה דקות ולעזור לך לפתור כל שאלה שיש לך בעולם האינטרנט הזה.