کلود هوش مصنوعی Anthropic در توییچ پوکمون بازی می کند و با توانایی استدلال خود شگفت زده می شود.

اخرین بروزرسانی: 28/02/2025

  • غزل کلود 3.7 آنتروپیک با بازی پوکمون رد در توییچ آزمایش شده است.
  • مدل هوش مصنوعی پیشرفت قابل توجهی در استدلال و تصمیم گیری نشان داده است.
  • او موفق شد سه نفر اول Gym Leaders را در بازی شکست دهد، چیزی که نسخه های قبلی نتوانستند به آن دست یابند.
  • Anthropic استفاده از بازی های ویدیویی را به عنوان یک روش ارزیابی برای هوش مصنوعی برجسته می کند.
حساس ترین لحظه کلود آی در پوکمون

آنتروپیک دنیای هوش مصنوعی را شگفت زده کرده است با نشان دادن اینکه مدل جدید کلود 3.7 Sonnet تا چه حد می تواند در کارهای پیچیده پیش برود. به همین مناسبت و به عنوان بخشی از آزمون نوآورانه قابلیت ها، سیستم هوش مصنوعی برای بازی Pokémon Red در آن قرار داده شد انقباض، جایی که بینندگان می توانستند پیشرفت را به صورت زنده دنبال کنند.

این آزمایش به دنبال نشان دادن چگونگی توانایی هوش مصنوعی است تصمیمات استراتژیک بگیرید و یاد بگیرید که در یک محیط پویا بدون دخالت انسان حرکت کنید. این یک نقطه عطف در مقایسه با نسخه های قبلی این مدل است که نتوانسته بودند بر موانع اولیه بازی غلبه کنند.

محتوای اختصاصی - اینجا را کلیک کنید  راهنمای کامل استفاده از Google Veo 3: روش‌ها، الزامات و نکات 2025

غزل کلود 3.7 پیشرفت در استدلال را نشان می دهد

غزل کلود 3.7

برای ارزیابی بهبود مدل هوش مصنوعی، آنتروپیک ابزارهای کلیدی خاصی را در اختیار آن قرار داد: نمایش ورودی پیکسل، حافظه اصلی و کنترل دکمه. به لطف این عناصر، کلود توانست اتفاقات بازی را تفسیر کند و بر اساس منطق درونی آن تصمیم بگیرد.

در مدل های قبلی مانند غزل کلود 3.0، هوش مصنوعی او حتی موفق به ترک خانه شخصیت اصلی نشد.. با این حال، در این تکرار جدید، سیستم به طور قابل توجهی پیشرفت کرده است و توانسته است براک، میستی و ستوان سورج، سه رهبر Gym Leader اول بازی را شکست دهد.

سفری با 35.000 اقدام در دنیای پوکمون

کلود هوش مصنوعی پوکمون را بازی می کند

سفر کلود در پوکمون رد آسان نبود. بر اساس داده های ارائه شده توسط Anthropic، هوش مصنوعی اجرا شده است حدود 35.000 سهم تا زمانی که توانستیم بر مرحله سیوداد کارمین غلبه کنیم. زمان دقیق این فرآیند مشخص نشده است، اما توانایی مدل برای انجام این کار مشخص نشده است سازگاری با تغییرات و یادگیری الگوها در طول اجرای خود

محتوای اختصاصی - اینجا را کلیک کنید  آزمایشگاه‌های گوگل اسکالر: جستجوی آکادمیک جدید مبتنی بر هوش مصنوعی اینگونه کار می‌کند

استفاده از بازی های ویدئویی برای ارزیابی هوش مصنوعی چیز جدیدی نیست. با این حال، این آزمایش این ایده را تقویت می کند که این محیط ها می توانند به ابزارهای اساسی تبدیل شوند برای اندازه گیری پیشرفت در مدل های هوش مصنوعی که قادر به استدلال و تطبیق هستند.

فراتر از بازی: غزل کلود 3.7 و برنامه های کاربردی آن در دنیای واقعی

Anthropic کلود 3.7 Sonnet-2 را ارائه می کند

آنتروپیک علاوه بر نشان دادن مهارت ها در پوکمون رد، تاکید کرده است که مدل هوش مصنوعی آن قادر به حل مشکلات پیچیده در رشته هایی مانند ریاضیات، برنامه نویسی و کدنویسی. به عنوان بخشی از بهبودهای آن، قابلیتی به نام Claude Code اضافه شده است که به هوش مصنوعی امکان جستجو و ویرایش کد، اجرای آزمایش‌ها و حتی کار با ابزارهایی مانند GitHub را می‌دهد.

برای کسانی که علاقه مند به آزمایش قابلیت های این مدل هستند، Claude 3.7 Sonnet اکنون بر روی پلتفرم های مختلف از جمله در دسترس است. برنامه کلود، Anthropic API، Amazon Bedrock و Google Cloud، هزینه دسترسی مشابه نسخه قبلی خود را حفظ می کند.

غزل کلود 3.7
مقاله مرتبط:
Anthropic غزل کلود 3.7 را معرفی کرد: هوش مصنوعی ترکیبی با استدلال پیشرفته

این واقعیت که کلود 3.7 Sonnet موفق به غلبه بر مراحل کلیدی در Pokémon Red شده است، این ایده را تقویت می کند که هوش مصنوعی از نظر استدلال و یادگیری با جهش و مرزها در حال پیشرفت است. این نوع آزمایش در را به روی باز می کند برنامه های جدید دنیای واقعی، از خودکارسازی وظایف تا حل مشکلات پیچیده بدون دخالت انسان.

محتوای اختصاصی - اینجا را کلیک کنید  چگونه IQ خود را با تونتومتر بدانیم؟