Nano Banana เป็นทางการแล้ว: Gemini 2.5 Flash Image โปรแกรมสร้างตัวแก้ไขของ Google ที่คุณใช้ขณะแชท

การปรับปรุงครั้งล่าสุด: 28/08/2025
ผู้แต่ง: Alberto navarro

  • "Nano Banana" คือชื่อรหัสของ Gemini 2.5 Flash Image ซึ่งเป็นโมเดลใหม่ของ Google สำหรับการสร้างและแก้ไขรูปภาพ
  • ช่วยให้แก้ไขการสนทนาได้ รักษาความสอดคล้องระหว่างบุคคลและวัตถุ และรวมรูปภาพเข้ากับคำแนะนำภาษาธรรมชาติ
  • รวมถึง SynthID เป็นลายน้ำที่มองไม่เห็นและตัวกรองสำหรับเนื้อหาที่ละเอียดอ่อนและบุคคลสาธารณะ
  • คุณสามารถทดสอบได้ในแอป Gemini และใน Google AI Studio โดยใช้โมเดล gemini-2.5-flash-image-preview

กล้วยนาโน

หลังจากมีการคาดเดากันหลายสัปดาห์ ชื่อเล่นนี้ กล้วยนาโน หยุดเป็นปริศนา: สอดคล้องกับ เครื่องมือสร้างภาพใหม่ของ Google เปิดตัวอย่างเป็นทางการแล้ว ราศีเมถุน 2.5 ภาพแฟลชบริษัทกำลังเปิดใช้งานฟีเจอร์ที่ผสมผสานการสร้างและการแก้ไขเข้ากับแนวทางการสนทนาเพื่อลดแรงเสียดทานในกระบวนการสร้างสรรค์

โมเดลนี้มาเพื่อแข่งขันกับเครื่องสร้างภาพอย่าง Midjourney และโปรแกรมแก้ไขภาพแบบดั้งเดิมอย่าง Photoshop โดยได้รับการปรับปรุงเพิ่มเติม ความสม่ำเสมอระหว่างช็อตการรักษาคุณสมบัติ และความเร็วในการตอบสนองที่ Google อธิบายว่า "รวดเร็วปานสายฟ้าแลบ" นอกจากนี้ รวมเข้ากับแอป Gemini และพร้อมใช้งานผ่าน API และใน Google AI Studio.

“นาโนบานาน่า” คืออะไร และมีประโยชน์อะไรบ้าง?

ฟังก์ชั่นกล้วยนาโน

"Nano Banana" คือชื่อภายในของโมเดล ซึ่งเป็นวิวัฒนาการที่มุ่งเน้นไปที่การแก้ไขข้อความแบบควบคุมและสร้างแบบจำลองที่มีการควบคุมอย่างเข้มงวด ระบบจะเข้าใจคำสั่งตามธรรมชาติและนำการเปลี่ยนแปลงไปใช้กับภาพเดิม โดยไม่ต้องบังคับให้คุณเริ่มต้นใหม่ทุกครั้ง

เนื้อหาพิเศษ - คลิกที่นี่  วิธีเอาชนะ Google Snake บนแผนที่ขนาดเล็ก

หนึ่งในกุญแจสำคัญคือ ความสม่ำเสมอของภาพ:เมื่อคุณแก้ไขรูปภาพ ใบหน้า ท่าทาง หรือแสงของแบบจะยังคงสม่ำเสมอระหว่างเวอร์ชันต่างๆ ลดการบิดเบือนหรือการกระโดดของมุมมอง ซึ่งยังคงปรากฏในเครื่องยนต์อื่น ๆ ในสถานการณ์ที่ซับซ้อน

El ภาพสมจริงก้าวไปอีกขั้นด้วยพื้นผิวและแสงที่สมจริงยิ่งขึ้นและ Google อ้างว่ามีความก้าวหน้าอย่างเป็นรูปธรรมในด้านใบหน้าและมือ ซึ่งเป็นสองส่วนที่มักมีความละเอียดอ่อนใน AI ภาพ โมเดลนี้ยัง โดดเด่นเรื่องความเร็วซึ่งช่วยให้รอบการทดสอบและการปรับปรุงสั้นลง

ในการเปรียบเทียบประสิทธิภาพชุมชน เช่น LM Arena "Nano Banana" ปรากฏอยู่ในกลุ่ม เรทดีที่สุด ในการแก้ไขประสบการณ์ผู้ใช้ ขับเคลื่อนโดยความสมดุลระหว่างคุณภาพ การควบคุม และความเร็วในการตอบสนอง

คุณสมบัติการแก้ไขและการสร้างที่สำคัญ

Nano Banana บน Google Gemini

  • การแก้ไขบทสนทนา:สนทนากับภาพและขอการปรับแต่งซ้ำๆ (เช่น เพิ่มความเข้มของท้องฟ้า เปลี่ยนสีรถ หรือเพิ่มวัตถุ)
  • การเลือกและการตกแต่งในท้องถิ่น:เลือกพื้นที่เฉพาะเพื่อลบองค์ประกอบ แก้ไขพื้นหลัง หรือปรับแสงและสีโดยไม่กระทบต่อส่วนที่เหลือ
  • การแต่งและการผสม:รวมภาพถ่ายหลายภาพเข้าในฉากเดียวและนำรูปแบบของภาพหนึ่งไปใช้กับวัตถุในอีกภาพหนึ่ง
  • ความสอดคล้องของตัวละคร:รักษาความคล้ายคลึงกันระหว่างเวอร์ชันของบุคคล สัตว์เลี้ยง หรือวัตถุเดียวกันในการแก้ไขหลายครั้ง

นอกจากความยืดหยุ่นในการสร้างสรรค์แล้ว Google ยังเพิ่มชั้นความปลอดภัยอีกด้วย:รูปภาพที่สร้างหรือแก้ไขทั้งหมดจะรวม SynthID ไว้ด้วยลายน้ำฝังตัวที่มองไม่เห็นซึ่งต้านทานการแปลงและช่วยให้คุณตรวจสอบได้ว่าเนื้อหานั้นถูกสร้างหรือแก้ไขโดย AI หรือไม่

เนื้อหาพิเศษ - คลิกที่นี่  วิธีลบรูปภาพที่ซ้ำกันใน Google Photos

ระบบมีตัวกรองเพื่อป้องกันการสร้างหรือการจัดการ เนื้อหาที่ละเอียดอ่อน (ความรุนแรง ภาพเปลือยที่โจ่งแจ้ง) และบล็อกการตัดต่อภาพบุคคลที่มีชื่อเสียง หากผู้ใช้อัปโหลดรูปภาพจริงเพื่อแก้ไข กลไกความปลอดภัยจะพยายามป้องกันคำขอที่อาจนำไปสู่การทำดีปเฟก

ในทางปฏิบัติ หมายความว่าเสียเวลาน้อยลงในการทดสอบทางเทคนิค และมุ่งเน้นไปที่ผลลัพธ์เชิงสร้างสรรค์มากขึ้น: คำสั่งภาษาธรรมชาติกลายเป็นการกระทำบนฉาก ด้วยความแม่นยำทางความหมายที่มากขึ้นและเคารพต่อขนาด ความลึก และสไตล์

วิธีใช้ Nano Banana ในแอป Gemini และ AI Studio

วิธีใช้ นาโน บานาน่า

ประสบการณ์ มันถูกรวมเข้ากับอินเทอร์เฟซ Geminiโดยไม่จำเป็นต้องใช้ซอฟต์แวร์เพิ่มเติม ในหลายกรณี คุณสามารถใช้ประโยชน์จากมันได้แม้ใน รุ่นฟรีขึ้นอยู่กับการใช้งานในภูมิภาคและบัญชีของคุณ.

  • บนแอปหรือเว็บไซต์ Gemini: เข้าถึง gemini.google.com/app (o แอพมือถือ) เลือกเทมเพลตที่มีอยู่และไปที่ “สร้างรูปภาพ” ภายใต้ “เครื่องมือ”
  • สร้างหรือแก้ไข: พิมพ์คำสั่งเพื่อสร้างใหม่ตั้งแต่ต้น หรืออัปโหลดรูปภาพเพื่อแก้ไข คุณสามารถเพิ่มคำสั่งแบบต่อเนื่องเพื่อปรับแต่งผลลัพธ์ได้หลายรอบ
  • คำสั่งที่เป็นประโยชน์: “ถ่ายภาพเป็นขาวดำ”, “ลบวัตถุออกจากพื้นหลัง”, “เปลี่ยนพื้นหลังเป็นทิวทัศน์เมือง” หรือ “นำสไตล์ของภาพนี้ไปใช้กับชุดนี้”
เนื้อหาพิเศษ - คลิกที่นี่  วิธีพิมพ์ในรูปแบบหนังสือใน Google Docs

หากคุณต้องการตรวจสอบว่าคุณกำลังใช้โมเดลที่ถูกต้องจากสภาพแวดล้อมของนักพัฒนา Google AI Studio เสนอการไหลโดยตรงสำหรับการทดสอบแบบควบคุมด้วย ตัวอย่างภาพแฟลช-2.5-เจมินี่.

  • ลงชื่อเข้าใช้ Google AI Studio.
  • เลือกโมเดล "gemini-2.5-flash-image-preview" ในตัวเลือก
  • ป้อนข้อความแจ้งเตือนและ/หรืออัปโหลดรูปภาพเพื่อดูการแก้ไขแบบเรียลไทม์พร้อมรองรับการแก้ไขแบบหลายกะ

แม้ว่าพฤติกรรมจะปรับปรุงดีขึ้นทั้งในด้านความสม่ำเสมอและความสมจริง แต่ก็ควรจำไว้ว่า การแสดงข้อความภายในภาพหรือการสะท้อนที่ซับซ้อนบางอย่างอาจยังไม่สมบูรณ์แบบอย่างไรก็ตาม การแก้ไขและใส่ลายน้ำที่ขับเคลื่อนด้วยภาษาทำให้เกิดความสมดุลที่น่าสนใจระหว่างการควบคุมความคิดสร้างสรรค์และความรับผิดชอบ

ด้วยการผสมผสานระหว่างการแก้ไขการสนทนา ความสม่ำเสมอของตัวละคร ความเร็ว และการป้องกันเช่น SynthID "Nano Banana" เป็นตัวเลือกที่หลากหลายสำหรับผู้สร้าง แบรนด์ และผู้ใช้ที่ต้องการปรับแต่งรูปภาพหรือจัดฉากโดยไม่ต้องยุ่งยากกับการใช้มาสก์และเลเยอร์:ทั้งหมดมาจาก Gemini เองและมีกระแสที่สนับสนุนการวนซ้ำจนกว่าจะพบเวอร์ชันที่เหมาะสมที่สุดกับแนวคิดเดิม

วิธีการสร้างวิดีโอด้วย Gemini
บทความที่เกี่ยวข้อง:
วิธีสร้างวิดีโอด้วย Gemini: ฟีเจอร์ใหม่ของ Google สำหรับการเปลี่ยนรูปภาพเป็นคลิปแอนิเมชัน