نانو موز اکنون رسماً معرفی شد: Gemini 2.5 Flash Image، ویرایشگر-مولد گوگل که هنگام چت از آن استفاده می‌کنید

اخرین بروزرسانی: 28/08/2025

  • «نانو موز» اسم رمز Gemini 2.5 Flash Image است، مدل جدید گوگل برای تولید و ویرایش تصاویر.
  • این امکان ویرایش محاوره‌ای را فراهم می‌کند، هماهنگی بین افراد و اشیاء را حفظ می‌کند و تصاویر را با دستورالعمل‌های زبان طبیعی ترکیب می‌کند.
  • شامل SynthID به عنوان یک واترمارک نامرئی و فیلترهایی برای محتوای حساس و چهره‌های عمومی است.
  • شما می‌توانید آن را در برنامه Gemini و در Google AI Studio با استفاده از مدل gemini-2.5-flash-image-preview آزمایش کنید.

نانو موز

پس از هفته‌ها گمانه‌زنی، این لقب «نانو موز» دیگر یک راز نیست: مربوط به موتور تصویر جدید گوگل رسماً رونمایی شد جوزا 2.5 تصویر فلشاین شرکت در حال فعال‌سازی قابلیتی است که تولید و ویرایش را با رویکردی محاوره‌ای ترکیب می‌کند و به دنبال کاهش اصطکاک در جریان خلاقانه است.

این مدل برای رقابت با مولدهایی مانند Midjourney و ویرایشگرهای سنتی مانند فتوشاپ، با بهبودهایی در ... تقویت شده است. ثبات بین عکس‌ها، حفظ ویژگی‌ها، و سرعت پاسخی که گوگل آن را "سریع و برق‌آسا" توصیف می‌کند. علاوه بر این، این برنامه در برنامه Gemini ادغام شده و از طریق APIها و در Google AI Studio در دسترس است..

«نانو موز» چیست و چه چیزی ارائه می‌دهد؟

عملکردهای نانو موز

«نانو موز» نام داخلی این مدل است، تکاملی که بر ویرایش هدایت‌شده توسط متن و تولید بسیار کنترل‌شده متمرکز است. این سیستم دستورالعمل‌های طبیعی را درک می‌کند و تغییرات را بر روی همان تصویر اعمال می‌کند، بدون اینکه شما را مجبور کند هر بار از ابتدا شروع کنید.

محتوای اختصاصی - اینجا را کلیک کنید  چگونه مار گوگل را روی نقشه کوچک شکست دهیم

یکی از کلیدهای آن این است که سازگاری بصری: وقتی یک عکس را ویرایش می‌کنید، چهره، ژست یا نورپردازی سوژه بین نسخه‌ها ثابت می‌ماند. این اعوجاج‌ها یا پرش‌های پرسپکتیو را کاهش می‌دهد که هنوز در موتورهای دیگر در سناریوهای پیچیده ظاهر می‌شوند.

El فتورئالیسم با بافت‌ها و نورپردازی باورپذیرتر، گامی به جلو برمی‌داردو گوگل مدعی پیشرفت‌های ملموس در چهره‌ها و دست‌ها، دو حوزه‌ی حساس در هوش مصنوعی تصویر، است. این مدل همچنین از نظر سرعت متمایز استکه چرخه‌های آزمایش و بهبود کوتاه‌تری را تسهیل می‌کند.

در معیارهای سنجش جامعه، مانند معیار سنجش LM Arena، «نانو موز» در میان موارد زیر ظاهر می‌شود: بهترین امتیاز در ویرایش تجربه کاربری، که با تعادل کیفیت، کنترل و سرعت پاسخ‌دهی هدایت می‌شود.

ویژگی‌های کلیدی ویرایش و تولید

نانو موز در گوگل جمینی

  • ویرایش مکالمه‌ای: با تصویر گفتگو می‌کند و تنظیمات تکراری را درخواست می‌کند (مثلاً تشدید آسمان، تغییر رنگ ماشین یا اضافه کردن یک شیء).
  • انتخاب محلی و روتوش: قسمت‌های خاصی را برای پاک کردن عناصر، تغییر پس‌زمینه یا تنظیم نور و رنگ بدون تأثیر بر بقیه انتخاب کنید.
  • ترکیب و اختلاط: چندین عکس را در یک صحنه ترکیب می‌کند و سبک یک تصویر را به اشیاء تصویر دیگر اعمال می‌کند.
  • انسجام شخصیت: شباهت بین نسخه‌های یک شخص، حیوان خانگی یا شیء را در چندین ویرایش حفظ می‌کند.

علاوه بر انعطاف‌پذیری خلاقانه، گوگل یک لایه امنیتی اضافه می‌کندتمام تصاویر تولید شده یا ویرایش شده شامل SynthID هستند.یک واترمارک جاسازی‌شده‌ی نامحسوس که در برابر تغییر شکل مقاوم است و به شما امکان می‌دهد تأیید کنید که آیا محتوا توسط هوش مصنوعی ایجاد یا تغییر داده شده است یا خیر.

محتوای اختصاصی - اینجا را کلیک کنید  نحوه حذف عکس های تکراری در Google Photos

این سیستم شامل فیلترهایی برای جلوگیری از تولید یا دستکاری ... است. محتوای حساس (خشونت، برهنگی آشکار) و ویرایش افراد مشهور را مسدود می‌کند. اگر کاربر عکس واقعی را برای تغییر آپلود کند، سازوکارهای امنیتی تلاش می‌کنند از درخواست‌هایی که می‌توانند منجر به دیپ‌فیک شوند، جلوگیری کنند.

در عمل، این به معنای اتلاف وقت کمتر در آزمایش فنی و تمرکز بیشتر بر نتیجه خلاقانه است: دستورات زبان طبیعی به اقدامات عملی در صحنه تبدیل می‌شوند با دقت معنایی بیشتر و احترام به مقیاس، عمق و سبک.

نحوه استفاده از نانو موز در برنامه Gemini و AI Studio

نحوه استفاده از نانو موز

تجربه در رابط کاربری Gemini ادغام شده استبدون نیاز به نرم‌افزار اضافی. در بسیاری از موارد حتی در موارد زیر هم می‌توانید از آن بهره ببرید نسخه رایگانبسته به استقرار در منطقه و حساب شما.

  • در اپلیکیشن یا وب‌سایت جمینی: الحاق به gemini.google.com/app (o برنامه موبایل)، الگوی موجود را انتخاب کنید و به «ایجاد تصاویر» در زیر «ابزارها» بروید.
  • تولید یا ویرایش: برای ایجاد از ابتدا یا آپلود عکس برای ویرایش، یک دستور تایپ کنید. می‌توانید دستورالعمل‌های زنجیره‌ای را برای تنظیم دقیق نتیجه در چندین دور اضافه کنید.
  • سفارشات مفید«عکس را سیاه و سفید کنید»، «شیء را از پس‌زمینه حذف کنید»، «پس‌زمینه را به منظره شهری تغییر دهید» یا «سبک این تصویر را روی این لباس اعمال کنید».
محتوای اختصاصی - اینجا را کلیک کنید  نحوه چاپ در قالب کتاب در Google Docs

اگر ترجیح می‌دهید از محیط توسعه‌دهنده، صحت مدلی که استفاده می‌کنید را تأیید کنید، Google AI Studio یک جریان مستقیم برای آزمایش کنترل‌شده ارائه می‌دهد. پیش‌نمایش تصویر Gemini 2.5 flash.

  • وارد استودیوی هوش مصنوعی گوگل شوید.
  • مدل "gemini-2.5-flash-image-preview" را انتخاب کنید در انتخابگر.
  • متن‌های درخواستی را وارد کنید و/یا تصاویر را آپلود کنید تا ویرایش‌ها را به صورت زنده ببینید.، با پشتیبانی از ویرایش چند شیفتی.

اگرچه رفتار از نظر ثبات و واقع‌گرایی بهبود یافته است، اما لازم به یادآوری است که نمایش متن درون تصاویر یا برخی بازتاب‌های پیچیده ممکن است هنوز کامل نباشد.با این حال، ویرایش و واترمارک مبتنی بر زبان، تعادل جالبی بین کنترل خلاقانه و مسئولیت ایجاد می‌کند.

با ترکیبی از ویرایش محاوره‌ای، ثبات شخصیت، سرعت و ابزارهای حفاظتی مانند SynthID، «نانو موز» به عنوان یک گزینه همه‌کاره برای سازندگان، برندها و کاربرانی که می‌خواهند عکس‌ها را تنظیم کنند یا صحنه‌ها را بدون درگیر شدن با ماسک‌ها و لایه‌ها بسازند، مناسب است.: همه از خود Gemini و با جریانی که تکرار را تشویق می‌کند تا زمانی که نسخه‌ای پیدا شود که به بهترین وجه با ایده اصلی مطابقت داشته باشد.

نحوه ایجاد ویدیو با Gemini
مقاله مرتبط:
نحوه ساخت ویدیو با Gemini: ویژگی جدید گوگل برای تبدیل تصاویر به کلیپ‌های متحرک