Claude Sonnet 4.5: کوڈنگ، ایجنٹس، اور کمپیوٹر کے استعمال میں چھلانگ

آخری تازہ کاری: 02/10/2025

  • یہ OSWorld میں 61,4% کارکردگی کا مظاہرہ کرتا ہے اور SWE-bench Verified میں آگے ہے۔
  • 30 گھنٹے سے زیادہ پیچیدہ کاموں کو ہینڈل کرتا ہے اور 64.000 تک ٹوکن تیار کرتا ہے
  • کلاڈ کوڈ اور ایجنٹوں کے لیے نئے کلاڈ ایجنٹ SDK کی اپ ڈیٹس
  • بہتر سیکورٹی (ASL-3) اور وہی قیمت: $3/$15 فی ملین ٹوکن

کلاڈ سونیٹ 4.5 ماڈل کی تصویر

Anthropic نے Claude Sonnet 4.5 جاری کیا ہے، جو پروگرامنگ، ایجنٹوں، اور کمپیوٹر کنٹرول پر مرکوز ایک ارتقاء ہے جو پیشہ ورانہ ماحول میں پلیٹ فارم کو مستحکم کرنا چاہتا ہے۔ اعلی درجے کے حریفوں کے ساتھ زمین کی تزئین میں، کمپنی اس ریلیز کو اس کے طور پر بیان کرتی ہے۔ انجینئرنگ کے کاموں کے لیے زیادہ بہتر اور مفید ماڈل تاریخ تک

نیا ورژن سونیٹ فیملی کے ٹریک ریکارڈ پر بناتا ہے، جس نے پہلے ہی پچھلی تکرار میں استدلال اور کوڈنگ کو بہتر بنایا تھا۔ اس بنیاد پر تعمیر کرتے ہوئے، 4.5 کا مقصد ترقی کے ساتھ عملی دائرہ کار کو بڑھانا ہے۔ توجہ، آلے کا استعمال، اور پیداوری کی استقامتسیکورٹی اور صف بندی میں ایک ہوشیار حکمت عملی کو برقرار رکھنا۔

کلیدی صلاحیتیں اور کارکردگی میں بہتری

کلاڈ سونیٹ 4.5 کی عمومی تصویر

Anthropic کے مطابق، Claude Sonnet 4.5 پیچیدہ کاموں پر 30 گھنٹے سے زیادہ توجہ مرکوز رکھنے کی صلاحیت رکھتا ہے۔ اور ملٹی سٹیپ، جو طویل پراجیکٹس کی حمایت کرتا ہے جہاں سیاق و سباق کے تسلسل کی ضرورت ہوتی ہے۔ یہ تک کے آؤٹ پٹ کو بھی سپورٹ کرتا ہے۔ ایک ہی جواب میں 64.000 ٹوکن، اور جواب دینے سے پہلے "سوچنے کے وقت" کو ایڈجسٹ کرنے کے لیے کنٹرول پیش کرتا ہے، ضرورت کے مطابق رفتار اور تفصیل کو متوازن کرتا ہے۔

خصوصی مواد - یہاں کلک کریں۔  Riffusion استعمال کرنے کا طریقہ: AI جو حقیقی وقت میں متن کو موسیقی میں بدل دیتا ہے۔

کمپیوٹر کے سامنے حقیقی کاموں میں، کمپنی نے OSWorld میں 61,4% کی اطلاع دی ہے، جو کہ اسی ٹیسٹ میں اس کے پیشرو کے 42,2% سے ایک قابل ذکر چھلانگ ہے۔عملی منظرناموں میں، ماڈل کر سکتا ہے۔ ویب براؤز کریں، اسپریڈشیٹ مکمل کریں، اور اعمال انجام دیں۔ کروم ایکسٹینشن سے ڈیسک ٹاپ ایپلی کیشنز میں، مسلسل صارف کی نگرانی کو کم کرنا۔

کی سرزمین پروگرامنگ زیادہ تر بہتریوں پر مرکوز ہے۔. SWE- بنچ کی تصدیق شدہ تشخیص میں، جس نے حقیقی دنیا کے منصوبوں پر لاگو کوڈنگ پر توجہ مرکوز کی، سونیٹ 4.5 77,2% کے ساتھ آگے ہے (تعمیرات کے ساتھ جو متوازی کمپیوٹنگ کے تحت تعداد میں اضافہ کرتے ہیں)۔ انتھروپک تجویز کرتا ہے کہ ماڈل پورے ترقیاتی دور کا احاطہ کرتا ہے: بڑے کوڈ بیسز کی منصوبہ بندی، عمل درآمد، ری فیکٹرنگ اور دیکھ بھال.

خالص ترقی سے آگے، انتھروپک ان استعمالوں کی نشاندہی کرتا ہے جن کے لیے طویل بہاؤ اور اقدامات کی ہم آہنگی کی ضرورت ہوتی ہے۔سائبرسیکیوریٹی اور فنانس سے لے کر دفتری پیداواری صلاحیت اور اندرونی اور بیرونی ڈیٹا کا استعمال کرتے ہوئے تحقیق۔ ان سیاق و سباق میں، وعدہ زیادہ مستحکم ایجنٹوں میں ہے جو مستقل مزاجی کو کھوئے بغیر طویل مدتی کام کو برقرار رکھنے کے قابل ہیں۔

ڈویلپر ٹولز اور ایکو سسٹم

کلاڈ کوڈ

لانچ کے ساتھ آتا ہے کلاڈ کوڈ میں نیا کیا ہے۔: چوکیاں ترقی کو بچانے اور پچھلی ریاستوں میں واپس جانے کے لیے، جیسے ورژن کی تاریخ، ایک تجدید شدہ ٹرمینل انٹرفیس, بصری اسٹوڈیو کوڈ کے لیے مقامی توسیع اور طویل کاموں کو چلانے کے لیے API کے ذریعے سیاق و سباق اور میموری ایڈیٹنگ میں بہتری۔

خصوصی مواد - یہاں کلک کریں۔  Palantir AI: انٹرپرائز AI جو Microsoft کے ساتھ کھڑا ہے۔

انتھروپک کا پریمیئر بھی ہوتا ہے۔ کلاڈ ایجنٹ SDK, جو بنیادی ڈھانچے کو نقل کرتا ہے جو کمپنی اپنے ایجنٹوں کو بنانے کے لیے استعمال کرتی ہے۔یہ کٹ طویل مدتی میموری، پرمیشن سسٹم، اور سبجینٹ کوآرڈینیشن کے لیے ٹولز پیش کرتی ہے، جو خودکار حل کی تخلیق میں سہولت فراہم کرتی ہے جو مشترکہ اہداف کے لیے تعاون کرتے ہیں اور ٹولز کے ساتھ محفوظ کنیکٹیویٹی جیسے وائر گیئر.

ایک تکمیل کے طور پر، فرم عارضی طور پر "کلاڈ کے ساتھ تصور کریں" کو فعال کرتی ہے، ایک مظاہرہ جو ہمیں مشاہدہ کرنے کی اجازت دیتا ہے کہ ماڈل کس طرح ہے۔ حقیقی وقت میں سافٹ ویئر تیار کرتا ہے۔ کوئی پیش وضاحتی کوڈ نہیں۔ یہ پیش نظارہ، زیادہ سے زیادہ صارفین کے لیے محدود وقت کے لیے دستیاب ہے، ماڈل کی انٹرایکٹو تخلیق کی صلاحیت کو واضح کرتا ہے۔

سلامتی، صف بندی اور لچک

انتھروپک میں اس کے تحفظ کی سطح میں سونیٹ 4.5 شامل ہے۔ AI سیفٹی لیول 3 (ASL-3), خطرناک مواد کا پتہ لگانے کے لیے تربیت یافتہ فلٹرز کے ساتھ، خاص طور پر وہ جو CBRN کے خطرات سے متعلق ہیں۔ کمپنی کا دعویٰ ہے کہ کمی آئی ہے۔ دس کے فیکٹر سے غلط مثبت ان درجہ بندی کے ابتدائی ورژن، اور پیشکشوں کے مقابلے Sonnet 4 کے ساتھ بات چیت کا تسلسل اگر سیکیورٹی لاک آؤٹ ہوتا ہے۔.

متوازی طور پر، کمپنی اس بات کو یقینی بناتی ہے۔ ماڈل ناپسندیدہ طرز عمل کو کم کرتا ہے جیسے چاپلوسی یا فریب آمیز ردعمل اور کوششوں کے خلاف دفاع کو مضبوط کرتا ہے۔ فوری انجکشنیہ اقدامات استعمال کی طرف اشارہ کرتے ہیں۔ کارپوریٹ ماحول میں زیادہ قابل اعتماد، جہاں خودکار کارروائیوں کے نفاذ کے لیے کنٹرولز اور ٹریس ایبلٹی کی ضرورت ہوتی ہے۔

خصوصی مواد - یہاں کلک کریں۔  کمک سیکھنا کیا ہے؟

دستیابی، پلیٹ فارم اور قیمتیں۔

تصویر بذریعہ کلاڈ سونیٹ 4.5

Claude Sonnet 4.5 Claude.ai پر دستیاب ہے۔ (ویب، iOS اور Android) اور کلاڈ ڈیولپر پلیٹ فارم کے ذریعے ڈویلپرز کے لیے، Amazon Bedrock اور Google Cloud Vertex AI جیسی خدمات میں انضمام کے ساتھ۔ مفت منصوبہ ایک سیشن کی حد کے ساتھ کام کرتا ہے جو ہر پانچ گھنٹے بعد ری سیٹ ہوتا ہے اور ڈیمانڈ پر پیغامات کی متغیر تعداد۔ قیمتیں وہی رہیں۔: $3 فی ملین ان پٹ ٹوکن اور $15 فی ملین آؤٹ پٹ ٹوکن.

رسائی کی نئی خصوصیات میں، کلاڈ کی کروم ایکسٹینشن زیادہ سے زیادہ صارفین کے لیے آ رہی ہے۔ پہلے ویٹنگ لسٹ میں رجسٹرڈ۔ اگرچہ بینچ مارکس پچھلی تکرار کے مقابلے میں خاطر خواہ بہتری کی تجویز کرتے ہیں، اینتھروپک نوٹ کرتا ہے کہ اصل کارکردگی کا انحصار استعمال کے معاملے اور ہر کام کے لیے ترتیب شدہ استدلال بجٹ پر ہوتا ہے۔

کوڈنگ میں پیشرفت، ایجنٹوں کے لیے زیادہ خود مختاری، اور سیکیورٹی پر سخت توجہ کے ساتھ، Claude Sonnet 4.5 ایک ٹھوس آپشن کے طور پر پوزیشن میں ہے۔ تکنیکی ٹیموں کے لیے جنہیں طویل عمل میں تسلسل اور کنٹرول کی ضرورت ہوتی ہے، اینتھروپک کے پہلے سے تعینات ماحولیاتی نظام کے ساتھ مستحکم لاگت اور مطابقت کو برقرار رکھنا.

Linkedin ایڈجسٹمنٹ AI
متعلقہ آرٹیکل:
LinkedIn اپنے AI کو ایڈجسٹ کرتا ہے: رازداری کی تبدیلیاں، علاقے، اور اسے کیسے غیر فعال کیا جائے۔