- "Nano Banana" هو الاسم الرمزي لـ Gemini 2.5 Flash Image، وهو نموذج Google الجديد لإنشاء الصور وتحريرها.
- إنه يسمح بالتحرير المحادثة، ويحافظ على الاتساق بين الأشخاص والأشياء، ويجمع الصور مع تعليمات اللغة الطبيعية.
- يتضمن SynthID كعلامة مائية غير مرئية ومرشحات للمحتوى الحساس والشخصيات العامة.
- يمكنك اختباره في تطبيق Gemini وفي Google AI Studio باستخدام نموذج gemini-2.5-flash-image-preview.

بعد أسابيع من التكهنات، تم تغيير اللقب «نانو الموز» لم يعد لغزا: يتوافق مع محرك الصور الجديد من جوجل، تم الكشف عنه رسميًا باسم الجوزاء 2.5 صورة فلاشوتعمل الشركة على تفعيل ميزة تجمع بين التوليد والتحرير مع نهج محادثة يهدف إلى تقليل الاحتكاك في التدفق الإبداعي.
يصل هذا النموذج للتنافس مع المولدات مثل Midjourney والمحررين التقليديين مثل Photoshop، مع تعزيزه بالتحسينات في الاتساق بين اللقطاتوالحفاظ على الميزات وسرعة الاستجابة التي تصفها جوجل بأنها "سريعة للغاية". بالإضافة إلى ذلك، تم دمجه في تطبيق Gemini ومتاح من خلال واجهات برمجة التطبيقات وفي Google AI Studio..
ما هو "نانو الموز" وماذا يقدم؟

"نانو بانانا" هو الاسم الداخلي للنموذج، وهو تطور يُركز على التحرير النصي والتوليد المُحكم. يفهم النظام التعليمات الطبيعية ويُطبّق التغييرات على الصورة نفسها، دون إجبارك على البدء من الصفر في كل مرة.
أحد مفاتيحها هو الاتساق البصري:عند تحرير صورة، يظل وجه الموضوع أو وضعيته أو إضاءته متسقًا بين الإصدارات. هذا يقلل التشوهات أو قفزات المنظور والتي لا تزال تظهر في محركات أخرى في سيناريوهات معقدة.
El الواقعية التصويرية تتخذ خطوة للأمام مع نسيج وإضاءة أكثر قابلية للتصديقوتزعم جوجل تحقيق تقدم ملموس في الوجوه والأيدي، وهما مجالان حساسان تقليديًا في مجال الذكاء الاصطناعي للصور. كما يتضمن النموذج تتميز بسرعتها، مما يسهل دورات الاختبار والتحسين الأقصر.
في معايير التقييم المجتمعية، مثل تلك الخاصة بـ LM Arena، يظهر "Nano Banana" بين أفضل تصنيف في تحرير تجربة المستخدم، بفضل توازنها بين الجودة والتحكم وسرعة الاستجابة.
ميزات تحرير وتوليد المفاتيح
- تحرير المحادثة:يقوم بالحوار مع الصورة ويطلب تعديلات متكررة (على سبيل المثال، تكثيف السماء، أو تغيير لون السيارة، أو إضافة كائن).
- التحديد المحلي والتنقيح:اختر مناطق محددة لمسح العناصر، أو تعديل الخلفية، أو ضبط الإضاءة واللون دون التأثير على الباقي.
- التكوين والمزج:يجمع صورًا متعددة في مشهد واحد ويطبق أسلوب صورة واحدة على الكائنات في صورة أخرى.
- تماسك الشخصية:يحافظ على التشابه بين إصدارات نفس الشخص أو الحيوان الأليف أو الكائن عبر عمليات التحرير المتعددة.
بالإضافة إلى المرونة الإبداعية، تضيف Google طبقة من الأمان:تتضمن جميع الصور المولدة أو المحررة SynthID، علامة مائية مدمجة غير محسوسة تقاوم التحويل وتسمح لك بالتحقق مما إذا كان المحتوى قد تم إنشاؤه أو تعديله بواسطة الذكاء الاصطناعي.
يتضمن النظام مرشحات لمنع توليد أو التلاعب محتوى حساس (عنف، عُري صريح) ويمنع تعديل صور المشاهير. إذا حمّل المستخدم صورة حقيقية لتعديلها، تعمل آليات الأمان على منع الطلبات التي قد تؤدي إلى التزييف العميق.
في الممارسة العملية، يعني هذا إهدار وقت أقل في الاختبارات الفنية وتركيز أكبر على النتيجة الإبداعية: تتحول أوامر اللغة الطبيعية إلى إجراءات على أرض الواقع مع مزيد من الدقة الدلالية واحترام الحجم والعمق والأسلوب.
كيفية استخدام Nano Banana في تطبيق Gemini وAI Studio

التجربة تم دمجه في واجهة Geminiدون الحاجة إلى برامج إضافية. في كثير من الحالات يمكنك الاستفادة منه حتى في نسخة مجانية، اعتمادًا على النشر في منطقتك وحسابك.
- على تطبيق أو موقع Gemini: الانضمام إلى gemini.google.com/app (o تطبيق الهاتف المحمول), حدد القالب المتاح وانتقل إلى "إنشاء صور" ضمن "أدوات".
- إنشاء أو تحريراكتب توجيهًا لإنشاء صورة من الصفر أو حمّل صورة لتحريرها. يمكنك إضافة تعليمات متسلسلة لضبط النتيجة على مدار عدة جولات.
- أوامر مفيدة: "اجعل الصورة بالأبيض والأسود"، "قم بإزالة الكائن من الخلفية"، "قم بتغيير الخلفية إلى منظر مدينة" أو "قم بتطبيق نمط هذه الصورة على هذا الفستان".
إذا كنت تفضل التحقق من استخدامك للنموذج الصحيح من بيئة المطور، فإن Google AI Studio يوفر تدفقًا مباشرًا للاختبار المُتحكم فيه معاينة صورة فلاش جيميني 2.5.
- تسجيل الدخول إلى Google AI Studio.
- اختر نموذج "gemini-2.5-flash-image-preview" في المحدد.
- أدخل مطالبات نصية و/أو قم بتحميل الصور لرؤية التعديلات في الوقت الفعلي.، مع دعم التحرير متعدد التحولات.
في حين أن السلوك قد تحسن من حيث الاتساق والواقعية التصويرية، فمن الجدير أن نتذكر أن قد لا يكون تمثيل النص داخل الصور أو بعض الانعكاسات المعقدة مثاليًا بعدومع ذلك، فإن التحرير القائم على اللغة والعلامات المائية يوفران توازناً مثيراً للاهتمام بين التحكم الإبداعي والمسؤولية.
بفضل مزيجها من التحرير المحادثة، وتناسق الأحرف، والسرعة، والضمانات مثل SynthID، يعد تطبيق "Nano Banana" خيارًا متعدد الاستخدامات للمبدعين والعلامات التجارية والمستخدمين الذين يرغبون في تعديل الصور أو إنشاء مشاهد دون تعقيد أنفسهم باستخدام الأقنعة والطبقات.:كل ذلك من الجوزاء نفسها وبتدفق يشجع التكرار حتى العثور على الإصدار الذي يناسب الفكرة الأصلية بشكل أفضل.
أنا من عشاق التكنولوجيا وقد حول اهتماماته "المهووسة" إلى مهنة. لقد أمضيت أكثر من 10 سنوات من حياتي في استخدام التكنولوجيا المتطورة والتعديل على جميع أنواع البرامج بدافع الفضول الخالص. الآن تخصصت في تكنولوجيا الكمبيوتر وألعاب الفيديو. وذلك لأنني منذ أكثر من 5 سنوات أكتب لمواقع مختلفة حول التكنولوجيا وألعاب الفيديو، وأقوم بإنشاء مقالات تسعى إلى تزويدك بالمعلومات التي تحتاجها بلغة مفهومة للجميع.
إذا كان لديك أي أسئلة، فإن معرفتي تتراوح بين كل ما يتعلق بنظام التشغيل Windows وكذلك Android للهواتف المحمولة. والتزامي تجاهك هو أنني على استعداد دائمًا لقضاء بضع دقائق ومساعدتك في حل أي أسئلة قد تكون لديكم في عالم الإنترنت هذا.
