- «نانو موز» اسم رمز Gemini 2.5 Flash Image است، مدل جدید گوگل برای تولید و ویرایش تصاویر.
- این امکان ویرایش محاورهای را فراهم میکند، هماهنگی بین افراد و اشیاء را حفظ میکند و تصاویر را با دستورالعملهای زبان طبیعی ترکیب میکند.
- شامل SynthID به عنوان یک واترمارک نامرئی و فیلترهایی برای محتوای حساس و چهرههای عمومی است.
- شما میتوانید آن را در برنامه Gemini و در Google AI Studio با استفاده از مدل gemini-2.5-flash-image-preview آزمایش کنید.

پس از هفتهها گمانهزنی، این لقب «نانو موز» دیگر یک راز نیست: مربوط به موتور تصویر جدید گوگل رسماً رونمایی شد جوزا 2.5 تصویر فلشاین شرکت در حال فعالسازی قابلیتی است که تولید و ویرایش را با رویکردی محاورهای ترکیب میکند و به دنبال کاهش اصطکاک در جریان خلاقانه است.
این مدل برای رقابت با مولدهایی مانند Midjourney و ویرایشگرهای سنتی مانند فتوشاپ، با بهبودهایی در ... تقویت شده است. ثبات بین عکسها، حفظ ویژگیها، و سرعت پاسخی که گوگل آن را "سریع و برقآسا" توصیف میکند. علاوه بر این، این برنامه در برنامه Gemini ادغام شده و از طریق APIها و در Google AI Studio در دسترس است..
«نانو موز» چیست و چه چیزی ارائه میدهد؟

«نانو موز» نام داخلی این مدل است، تکاملی که بر ویرایش هدایتشده توسط متن و تولید بسیار کنترلشده متمرکز است. این سیستم دستورالعملهای طبیعی را درک میکند و تغییرات را بر روی همان تصویر اعمال میکند، بدون اینکه شما را مجبور کند هر بار از ابتدا شروع کنید.
یکی از کلیدهای آن این است که سازگاری بصری: وقتی یک عکس را ویرایش میکنید، چهره، ژست یا نورپردازی سوژه بین نسخهها ثابت میماند. این اعوجاجها یا پرشهای پرسپکتیو را کاهش میدهد که هنوز در موتورهای دیگر در سناریوهای پیچیده ظاهر میشوند.
El فتورئالیسم با بافتها و نورپردازی باورپذیرتر، گامی به جلو برمیداردو گوگل مدعی پیشرفتهای ملموس در چهرهها و دستها، دو حوزهی حساس در هوش مصنوعی تصویر، است. این مدل همچنین از نظر سرعت متمایز استکه چرخههای آزمایش و بهبود کوتاهتری را تسهیل میکند.
در معیارهای سنجش جامعه، مانند معیار سنجش LM Arena، «نانو موز» در میان موارد زیر ظاهر میشود: بهترین امتیاز در ویرایش تجربه کاربری، که با تعادل کیفیت، کنترل و سرعت پاسخدهی هدایت میشود.
ویژگیهای کلیدی ویرایش و تولید
- ویرایش مکالمهای: با تصویر گفتگو میکند و تنظیمات تکراری را درخواست میکند (مثلاً تشدید آسمان، تغییر رنگ ماشین یا اضافه کردن یک شیء).
- انتخاب محلی و روتوش: قسمتهای خاصی را برای پاک کردن عناصر، تغییر پسزمینه یا تنظیم نور و رنگ بدون تأثیر بر بقیه انتخاب کنید.
- ترکیب و اختلاط: چندین عکس را در یک صحنه ترکیب میکند و سبک یک تصویر را به اشیاء تصویر دیگر اعمال میکند.
- انسجام شخصیت: شباهت بین نسخههای یک شخص، حیوان خانگی یا شیء را در چندین ویرایش حفظ میکند.
علاوه بر انعطافپذیری خلاقانه، گوگل یک لایه امنیتی اضافه میکندتمام تصاویر تولید شده یا ویرایش شده شامل SynthID هستند.یک واترمارک جاسازیشدهی نامحسوس که در برابر تغییر شکل مقاوم است و به شما امکان میدهد تأیید کنید که آیا محتوا توسط هوش مصنوعی ایجاد یا تغییر داده شده است یا خیر.
این سیستم شامل فیلترهایی برای جلوگیری از تولید یا دستکاری ... است. محتوای حساس (خشونت، برهنگی آشکار) و ویرایش افراد مشهور را مسدود میکند. اگر کاربر عکس واقعی را برای تغییر آپلود کند، سازوکارهای امنیتی تلاش میکنند از درخواستهایی که میتوانند منجر به دیپفیک شوند، جلوگیری کنند.
در عمل، این به معنای اتلاف وقت کمتر در آزمایش فنی و تمرکز بیشتر بر نتیجه خلاقانه است: دستورات زبان طبیعی به اقدامات عملی در صحنه تبدیل میشوند با دقت معنایی بیشتر و احترام به مقیاس، عمق و سبک.
نحوه استفاده از نانو موز در برنامه Gemini و AI Studio

تجربه در رابط کاربری Gemini ادغام شده استبدون نیاز به نرمافزار اضافی. در بسیاری از موارد حتی در موارد زیر هم میتوانید از آن بهره ببرید نسخه رایگانبسته به استقرار در منطقه و حساب شما.
- در اپلیکیشن یا وبسایت جمینی: الحاق به gemini.google.com/app (o برنامه موبایل)، الگوی موجود را انتخاب کنید و به «ایجاد تصاویر» در زیر «ابزارها» بروید.
- تولید یا ویرایش: برای ایجاد از ابتدا یا آپلود عکس برای ویرایش، یک دستور تایپ کنید. میتوانید دستورالعملهای زنجیرهای را برای تنظیم دقیق نتیجه در چندین دور اضافه کنید.
- سفارشات مفید«عکس را سیاه و سفید کنید»، «شیء را از پسزمینه حذف کنید»، «پسزمینه را به منظره شهری تغییر دهید» یا «سبک این تصویر را روی این لباس اعمال کنید».
اگر ترجیح میدهید از محیط توسعهدهنده، صحت مدلی که استفاده میکنید را تأیید کنید، Google AI Studio یک جریان مستقیم برای آزمایش کنترلشده ارائه میدهد. پیشنمایش تصویر Gemini 2.5 flash.
- وارد استودیوی هوش مصنوعی گوگل شوید.
- مدل "gemini-2.5-flash-image-preview" را انتخاب کنید در انتخابگر.
- متنهای درخواستی را وارد کنید و/یا تصاویر را آپلود کنید تا ویرایشها را به صورت زنده ببینید.، با پشتیبانی از ویرایش چند شیفتی.
اگرچه رفتار از نظر ثبات و واقعگرایی بهبود یافته است، اما لازم به یادآوری است که نمایش متن درون تصاویر یا برخی بازتابهای پیچیده ممکن است هنوز کامل نباشد.با این حال، ویرایش و واترمارک مبتنی بر زبان، تعادل جالبی بین کنترل خلاقانه و مسئولیت ایجاد میکند.
با ترکیبی از ویرایش محاورهای، ثبات شخصیت، سرعت و ابزارهای حفاظتی مانند SynthID، «نانو موز» به عنوان یک گزینه همهکاره برای سازندگان، برندها و کاربرانی که میخواهند عکسها را تنظیم کنند یا صحنهها را بدون درگیر شدن با ماسکها و لایهها بسازند، مناسب است.: همه از خود Gemini و با جریانی که تکرار را تشویق میکند تا زمانی که نسخهای پیدا شود که به بهترین وجه با ایده اصلی مطابقت داشته باشد.
من یک علاقه مند به فناوری هستم که علایق "گیک" خود را به یک حرفه تبدیل کرده ام. من بیش از 10 سال از زندگی خود را صرف استفاده از فناوری های پیشرفته و سرهم بندی کردن انواع برنامه ها از روی کنجکاوی کرده ام. اکنون در زمینه فناوری رایانه و بازی های ویدیویی تخصص دارم. این به این دلیل است که بیش از 5 سال است که برای وب سایت های مختلف در زمینه فناوری و بازی های ویدیویی می نویسم و مقالاتی را ایجاد می کنم که به دنبال ارائه اطلاعات مورد نیاز شما به زبانی قابل فهم برای همه هستند.
اگر سوالی دارید، دانش من از همه چیز مربوط به سیستم عامل ویندوز و همچنین اندروید برای تلفن های همراه است. و تعهد من به شماست، من همیشه حاضرم چند دقیقه وقت بگذارم و به شما کمک کنم تا هر سوالی را که ممکن است در این دنیای اینترنتی داشته باشید حل کنید.
