- غزل کلود 3.7 آنتروپیک با بازی پوکمون رد در توییچ آزمایش شده است.
- مدل هوش مصنوعی پیشرفت قابل توجهی در استدلال و تصمیم گیری نشان داده است.
- او موفق شد سه نفر اول Gym Leaders را در بازی شکست دهد، چیزی که نسخه های قبلی نتوانستند به آن دست یابند.
- Anthropic استفاده از بازی های ویدیویی را به عنوان یک روش ارزیابی برای هوش مصنوعی برجسته می کند.
آنتروپیک دنیای هوش مصنوعی را شگفت زده کرده است با نشان دادن اینکه مدل جدید کلود 3.7 Sonnet تا چه حد می تواند در کارهای پیچیده پیش برود. به همین مناسبت و به عنوان بخشی از آزمون نوآورانه قابلیت ها، سیستم هوش مصنوعی برای بازی Pokémon Red در آن قرار داده شد انقباض، جایی که بینندگان می توانستند پیشرفت را به صورت زنده دنبال کنند.
این آزمایش به دنبال نشان دادن چگونگی توانایی هوش مصنوعی است تصمیمات استراتژیک بگیرید و یاد بگیرید که در یک محیط پویا بدون دخالت انسان حرکت کنید. این یک نقطه عطف در مقایسه با نسخه های قبلی این مدل است که نتوانسته بودند بر موانع اولیه بازی غلبه کنند.
غزل کلود 3.7 پیشرفت در استدلال را نشان می دهد

برای ارزیابی بهبود مدل هوش مصنوعی، آنتروپیک ابزارهای کلیدی خاصی را در اختیار آن قرار داد: نمایش ورودی پیکسل، حافظه اصلی و کنترل دکمه. به لطف این عناصر، کلود توانست اتفاقات بازی را تفسیر کند و بر اساس منطق درونی آن تصمیم بگیرد.
در مدل های قبلی مانند غزل کلود 3.0، هوش مصنوعی او حتی موفق به ترک خانه شخصیت اصلی نشد.. با این حال، در این تکرار جدید، سیستم به طور قابل توجهی پیشرفت کرده است و توانسته است براک، میستی و ستوان سورج، سه رهبر Gym Leader اول بازی را شکست دهد.
سفری با 35.000 اقدام در دنیای پوکمون

سفر کلود در پوکمون رد آسان نبود. بر اساس داده های ارائه شده توسط Anthropic، هوش مصنوعی اجرا شده است حدود 35.000 سهم تا زمانی که توانستیم بر مرحله سیوداد کارمین غلبه کنیم. زمان دقیق این فرآیند مشخص نشده است، اما توانایی مدل برای انجام این کار مشخص نشده است سازگاری با تغییرات و یادگیری الگوها در طول اجرای خود
استفاده از بازی های ویدئویی برای ارزیابی هوش مصنوعی چیز جدیدی نیست. با این حال، این آزمایش این ایده را تقویت می کند که این محیط ها می توانند به ابزارهای اساسی تبدیل شوند برای اندازه گیری پیشرفت در مدل های هوش مصنوعی که قادر به استدلال و تطبیق هستند.
فراتر از بازی: غزل کلود 3.7 و برنامه های کاربردی آن در دنیای واقعی

آنتروپیک علاوه بر نشان دادن مهارت ها در پوکمون رد، تاکید کرده است که مدل هوش مصنوعی آن قادر به حل مشکلات پیچیده در رشته هایی مانند ریاضیات، برنامه نویسی و کدنویسی. به عنوان بخشی از بهبودهای آن، قابلیتی به نام Claude Code اضافه شده است که به هوش مصنوعی امکان جستجو و ویرایش کد، اجرای آزمایشها و حتی کار با ابزارهایی مانند GitHub را میدهد.
برای کسانی که علاقه مند به آزمایش قابلیت های این مدل هستند، Claude 3.7 Sonnet اکنون بر روی پلتفرم های مختلف از جمله در دسترس است. برنامه کلود، Anthropic API، Amazon Bedrock و Google Cloud، هزینه دسترسی مشابه نسخه قبلی خود را حفظ می کند.
این واقعیت که کلود 3.7 Sonnet موفق به غلبه بر مراحل کلیدی در Pokémon Red شده است، این ایده را تقویت می کند که هوش مصنوعی از نظر استدلال و یادگیری با جهش و مرزها در حال پیشرفت است. این نوع آزمایش در را به روی باز می کند برنامه های جدید دنیای واقعی، از خودکارسازی وظایف تا حل مشکلات پیچیده بدون دخالت انسان.
من یک علاقه مند به فناوری هستم که علایق "گیک" خود را به یک حرفه تبدیل کرده ام. من بیش از 10 سال از زندگی خود را صرف استفاده از فناوری های پیشرفته و سرهم بندی کردن انواع برنامه ها از روی کنجکاوی کرده ام. اکنون در زمینه فناوری رایانه و بازی های ویدیویی تخصص دارم. این به این دلیل است که بیش از 5 سال است که برای وب سایت های مختلف در زمینه فناوری و بازی های ویدیویی می نویسم و مقالاتی را ایجاد می کنم که به دنبال ارائه اطلاعات مورد نیاز شما به زبانی قابل فهم برای همه هستند.
اگر سوالی دارید، دانش من از همه چیز مربوط به سیستم عامل ویندوز و همچنین اندروید برای تلفن های همراه است. و تعهد من به شماست، من همیشه حاضرم چند دقیقه وقت بگذارم و به شما کمک کنم تا هر سوالی را که ممکن است در این دنیای اینترنتی داشته باشید حل کنید.