קלוד סונט 4.5: קפיצת מדרגה בקידוד, סוכנים ושימוש במחשב

העדכון אחרון: 02/10/2025

  • הוא מציג ביצועים של 61,4% ב-OSWorld ומוביל במבחן SWE. מאומת
  • מטפל במשימות מורכבות במשך יותר מ-30 שעות ומייצר עד 64.000 טוקנים
  • עדכונים ל-Claude Code ול-Claude Agent SDK החדש עבור סוכנים
  • אבטחה משופרת (ASL-3) ואותו מחיר: 3$/15$ למיליון טוקנים

תמונה של דגם קלוד סונט 4.5

אנתרופיק הוציאה את Claude Sonnet 4.5, גרסה מתפתחת המתמקדת בתכנות, סוכנים ובקרת מחשבים, שמטרתה לאחד את הפלטפורמה בסביבות מקצועיות. בנוף עם יריבים ברמה גבוהה, החברה מתארת ​​את הגרסה הזו כ... מודל משוכלל ושימושי יותר למשימות הנדסיות עד היום

הגרסה החדשה מתבססת על הרקורד של משפחת סונט, שכבר שיפרה את החשיבה והקידוד בגרסאות קודמות. בהתבסס על בסיס זה, גרסה 4.5 שואפת להרחיב את ההיקף המעשי עם התקדמות ב... התמדה של קשב, שימוש בכלים ופרודוקטיביות, שמירה על אסטרטגיה זהירה בתחום הביטחון וההתאמות.

יכולות מפתח ושיפורי ביצועים

תמונה כללית של קלוד סונטה 4.5

לפי אנתרופיק, קלוד סונט 4.5 מסוגל לשמור על ריכוז במשך יותר מ-30 שעות במשימות מורכבות. ורב-שלבי, מה שמעדיף פרויקטים ארוכים שבהם נדרשת המשכיות של ההקשר. הוא תומך גם בתפוקות של עד 64.000 אסימונים בתגובה אחת, ומציע פקדים להתאמת "זמן החשיבה" לפני התגובה, תוך איזון בין מהירות לפרטים לפי הצורך.

תוכן בלעדי - לחץ כאן  כיצד להשתמש ב-Riffusion: בינה מלאכותית שהופכת טקסט למוזיקה בזמן אמת

במשימות אמיתיות מול המחשב, החברה מדווחת על 61,4% ב-OSWorld, זינוק ניכר לעומת 42,2% של קודמתה באותו מבחן.בתרחישים מעשיים, המודל יכול לגלוש באינטרנט, להשלים גיליונות אלקטרוניים ולבצע פעולות ביישומי שולחן עבודה מהתוסף של Chrome, מה שמפחית את ניטור המשתמשים הרציף.

ארץ התכנות מרכז את רוב השיפוריםבהערכה של SWE-bench Verified, שהתמקדה בקידוד שיושם על פרויקטים מהעולם האמיתי, סונטה 4.5 מובילה את הדרך עם 77,2%. (עם תצורות שמגדילות את המספר תחת מחשוב מקבילי). אנתרופיק מציע שהמודל מכסה את כל מחזור הפיתוח: תכנון, יישום, שיפוץ ותחזוקה של בסיסי קוד גדולים.

מעבר לפיתוח טהור, אנתרופיקה מזהה שימושים הדורשים זרימות ממושכות ותיאום שלבים.מאבטחת סייבר ופיננסים ועד לפרודוקטיביות משרדית ומחקר תוך שימוש בנתונים פנימיים וחיצוניים. בהקשרים אלה, ההבטחה טמונה בסוכנים יציבים יותר המסוגלים לקיים עבודה ארוכת טווח מבלי לאבד עקביות.

כלי פיתוח ומערכת אקולוגית

קלוד קוד

ההשקה מגיעה מלווה ב מה חדש ב-Claude Code: מחסומים כדי לשמור את ההתקדמות ולחזור למצבים קודמים, כגון היסטוריית גרסאות, אחד ממשק טרמינל משופץ, הרחבה מקורית עבור Visual Studio Code ושיפורים בעריכת הקשר וזיכרון דרך ה-API כדי להריץ משימות ארוכות יותר.

תוכן בלעדי - לחץ כאן  פלנטיר בינה מלאכותית: הבינה המלאכותית הארגונית שעומדת בציפיות של מיקרוסופט

אנתרופיק גם מציג בבכורה את ערכת פיתוח תוכנה של קלוד סוכן, אשר משכפל את התשתית בה משתמשת החברה כדי לבנות את הסוכנים שלה.הערכה מציעה כלים לזיכרון לטווח ארוך, מערכות הרשאות ותיאום בין סוכני משנה, ומאפשרת יצירת פתרונות אוטומטיים המשתפים פעולה לקראת מטרות משותפות וקישוריות מאובטחת עם כלים כגון WireGuard.

כהשלמה, החברה מאפשרת באופן זמני את "Imagine with Claude", הדגמה המאפשרת לנו להתבונן כיצד המודל מייצר תוכנה בזמן אמת אין קוד מוגדר מראש. תצוגה מקדימה זו, הזמינה לזמן מוגבל למשתמשי Max, ממחישה את הפוטנציאל של המודל ליצירה אינטראקטיבית.

ביטחון, יישור קו וחוסן

אנתרופיק כולל את סונטה 4.5 ברמת ההגנה שלה רמת בטיחות 3 של בינה מלאכותית (ASL-3), עם מסננים שאומנו לזהות תוכן מסוכן, במיוחד כזה הקשור לסיכוני CBRN. החברה טוענת שהפחיתה חיוביים שגויות פי עשרה בהשוואה לגרסה הראשונית של מסווגים אלה, ומציע המשכיות שיחה עם סונטה 4 במקרה של נעילת אבטחה.

במקביל, החברה מבטיחה כי המודל מפחית התנהגויות לא רצויות כגון חנופה או תגובות מטעות ומחזק את ההגנות מפני ניסיונות הזרקה מהירהאמצעים אלה נועדו להשתמש אמין יותר בסביבות ארגוניות, כאשר ביצוע פעולות אוטומטיות דורש בקרות ויכולת מעקב.

תוכן בלעדי - לחץ כאן  מהי למידת חיזוק?

זמינות, פלטפורמות ומחירים

תמונה מאת קלוד סונט 4.5

קלוד סונטה 4.5 זמין ב-Claude.ai (אינטרנט, iOS ואנדרואיד) ולמפתחים דרך פלטפורמת המפתחים של קלוד, עם שילוב בשירותים כמו Amazon Bedrock ו-Google Cloud Vertex AI. התוכנית החינמית פועלת עם מגבלת סשן שמתאפסת כל חמש שעות ומספר משתנה של הודעות לפי דרישה. המחירים נשארים זהים.3 דולר למיליון אסימוני קלט ו-15 דולר למיליון אסימוני פלט.

בין תכונות הגישה החדשות, תוסף Chrome של קלוד מושק למשתמשי Max. נרשם בעבר ברשימת ההמתנה. למרות שהמדדים מצביעים על שיפורים משמעותיים בהשוואה לגרסאות קודמות, Anthropic מציינת שהביצועים בפועל תלויים במקרה השימוש ובתקציב ההיגיון שהוגדר עבור כל משימה.

עם שילוב של התקדמות בקידוד, אוטונומיה גדולה יותר לסוכנים ומיקוד מחמיר יותר באבטחה, קלוד סונט 4.5 ממוצב כאופציה מוצקה עבור צוותים טכניים הזקוקים להמשכיות ובקרה בתהליכים ארוכים, שמירה על עלויות יציבות ותאימות עם המערכת האקולוגית שכבר פרוסה של Anthropic.

התאמת לינקדאין בינה מלאכותית
Artaculo relacionado:
לינקדאין מתאימה את הבינה המלאכותית שלה: שינויים בפרטיות, אזורים וכיצד להשבית אותה