- "Nano Banana" คือชื่อรหัสของ Gemini 2.5 Flash Image ซึ่งเป็นโมเดลใหม่ของ Google สำหรับการสร้างและแก้ไขรูปภาพ
- ช่วยให้แก้ไขการสนทนาได้ รักษาความสอดคล้องระหว่างบุคคลและวัตถุ และรวมรูปภาพเข้ากับคำแนะนำภาษาธรรมชาติ
- รวมถึง SynthID เป็นลายน้ำที่มองไม่เห็นและตัวกรองสำหรับเนื้อหาที่ละเอียดอ่อนและบุคคลสาธารณะ
- คุณสามารถทดสอบได้ในแอป Gemini และใน Google AI Studio โดยใช้โมเดล gemini-2.5-flash-image-preview

หลังจากมีการคาดเดากันหลายสัปดาห์ ชื่อเล่นนี้ กล้วยนาโน หยุดเป็นปริศนา: สอดคล้องกับ เครื่องมือสร้างภาพใหม่ของ Google เปิดตัวอย่างเป็นทางการแล้ว ราศีเมถุน 2.5 ภาพแฟลชบริษัทกำลังเปิดใช้งานฟีเจอร์ที่ผสมผสานการสร้างและการแก้ไขเข้ากับแนวทางการสนทนาเพื่อลดแรงเสียดทานในกระบวนการสร้างสรรค์
โมเดลนี้มาเพื่อแข่งขันกับเครื่องสร้างภาพอย่าง Midjourney และโปรแกรมแก้ไขภาพแบบดั้งเดิมอย่าง Photoshop โดยได้รับการปรับปรุงเพิ่มเติม ความสม่ำเสมอระหว่างช็อตการรักษาคุณสมบัติ และความเร็วในการตอบสนองที่ Google อธิบายว่า "รวดเร็วปานสายฟ้าแลบ" นอกจากนี้ รวมเข้ากับแอป Gemini และพร้อมใช้งานผ่าน API และใน Google AI Studio.
“นาโนบานาน่า” คืออะไร และมีประโยชน์อะไรบ้าง?

"Nano Banana" คือชื่อภายในของโมเดล ซึ่งเป็นวิวัฒนาการที่มุ่งเน้นไปที่การแก้ไขข้อความแบบควบคุมและสร้างแบบจำลองที่มีการควบคุมอย่างเข้มงวด ระบบจะเข้าใจคำสั่งตามธรรมชาติและนำการเปลี่ยนแปลงไปใช้กับภาพเดิม โดยไม่ต้องบังคับให้คุณเริ่มต้นใหม่ทุกครั้ง
หนึ่งในกุญแจสำคัญคือ ความสม่ำเสมอของภาพ:เมื่อคุณแก้ไขรูปภาพ ใบหน้า ท่าทาง หรือแสงของแบบจะยังคงสม่ำเสมอระหว่างเวอร์ชันต่างๆ ลดการบิดเบือนหรือการกระโดดของมุมมอง ซึ่งยังคงปรากฏในเครื่องยนต์อื่น ๆ ในสถานการณ์ที่ซับซ้อน
El ภาพสมจริงก้าวไปอีกขั้นด้วยพื้นผิวและแสงที่สมจริงยิ่งขึ้นและ Google อ้างว่ามีความก้าวหน้าอย่างเป็นรูปธรรมในด้านใบหน้าและมือ ซึ่งเป็นสองส่วนที่มักมีความละเอียดอ่อนใน AI ภาพ โมเดลนี้ยัง โดดเด่นเรื่องความเร็วซึ่งช่วยให้รอบการทดสอบและการปรับปรุงสั้นลง
ในการเปรียบเทียบประสิทธิภาพชุมชน เช่น LM Arena "Nano Banana" ปรากฏอยู่ในกลุ่ม เรทดีที่สุด ในการแก้ไขประสบการณ์ผู้ใช้ ขับเคลื่อนโดยความสมดุลระหว่างคุณภาพ การควบคุม และความเร็วในการตอบสนอง
คุณสมบัติการแก้ไขและการสร้างที่สำคัญ
- การแก้ไขบทสนทนา:สนทนากับภาพและขอการปรับแต่งซ้ำๆ (เช่น เพิ่มความเข้มของท้องฟ้า เปลี่ยนสีรถ หรือเพิ่มวัตถุ)
- การเลือกและการตกแต่งในท้องถิ่น:เลือกพื้นที่เฉพาะเพื่อลบองค์ประกอบ แก้ไขพื้นหลัง หรือปรับแสงและสีโดยไม่กระทบต่อส่วนที่เหลือ
- การแต่งและการผสม:รวมภาพถ่ายหลายภาพเข้าในฉากเดียวและนำรูปแบบของภาพหนึ่งไปใช้กับวัตถุในอีกภาพหนึ่ง
- ความสอดคล้องของตัวละคร:รักษาความคล้ายคลึงกันระหว่างเวอร์ชันของบุคคล สัตว์เลี้ยง หรือวัตถุเดียวกันในการแก้ไขหลายครั้ง
นอกจากความยืดหยุ่นในการสร้างสรรค์แล้ว Google ยังเพิ่มชั้นความปลอดภัยอีกด้วย:รูปภาพที่สร้างหรือแก้ไขทั้งหมดจะรวม SynthID ไว้ด้วยลายน้ำฝังตัวที่มองไม่เห็นซึ่งต้านทานการแปลงและช่วยให้คุณตรวจสอบได้ว่าเนื้อหานั้นถูกสร้างหรือแก้ไขโดย AI หรือไม่
ระบบมีตัวกรองเพื่อป้องกันการสร้างหรือการจัดการ เนื้อหาที่ละเอียดอ่อน (ความรุนแรง ภาพเปลือยที่โจ่งแจ้ง) และบล็อกการตัดต่อภาพบุคคลที่มีชื่อเสียง หากผู้ใช้อัปโหลดรูปภาพจริงเพื่อแก้ไข กลไกความปลอดภัยจะพยายามป้องกันคำขอที่อาจนำไปสู่การทำดีปเฟก
ในทางปฏิบัติ หมายความว่าเสียเวลาน้อยลงในการทดสอบทางเทคนิค และมุ่งเน้นไปที่ผลลัพธ์เชิงสร้างสรรค์มากขึ้น: คำสั่งภาษาธรรมชาติกลายเป็นการกระทำบนฉาก ด้วยความแม่นยำทางความหมายที่มากขึ้นและเคารพต่อขนาด ความลึก และสไตล์
วิธีใช้ Nano Banana ในแอป Gemini และ AI Studio

ประสบการณ์ มันถูกรวมเข้ากับอินเทอร์เฟซ Geminiโดยไม่จำเป็นต้องใช้ซอฟต์แวร์เพิ่มเติม ในหลายกรณี คุณสามารถใช้ประโยชน์จากมันได้แม้ใน รุ่นฟรีขึ้นอยู่กับการใช้งานในภูมิภาคและบัญชีของคุณ.
- บนแอปหรือเว็บไซต์ Gemini: เข้าถึง gemini.google.com/app (o แอพมือถือ) เลือกเทมเพลตที่มีอยู่และไปที่ “สร้างรูปภาพ” ภายใต้ “เครื่องมือ”
- สร้างหรือแก้ไข: พิมพ์คำสั่งเพื่อสร้างใหม่ตั้งแต่ต้น หรืออัปโหลดรูปภาพเพื่อแก้ไข คุณสามารถเพิ่มคำสั่งแบบต่อเนื่องเพื่อปรับแต่งผลลัพธ์ได้หลายรอบ
- คำสั่งที่เป็นประโยชน์: “ถ่ายภาพเป็นขาวดำ”, “ลบวัตถุออกจากพื้นหลัง”, “เปลี่ยนพื้นหลังเป็นทิวทัศน์เมือง” หรือ “นำสไตล์ของภาพนี้ไปใช้กับชุดนี้”
หากคุณต้องการตรวจสอบว่าคุณกำลังใช้โมเดลที่ถูกต้องจากสภาพแวดล้อมของนักพัฒนา Google AI Studio เสนอการไหลโดยตรงสำหรับการทดสอบแบบควบคุมด้วย ตัวอย่างภาพแฟลช-2.5-เจมินี่.
- ลงชื่อเข้าใช้ Google AI Studio.
- เลือกโมเดล "gemini-2.5-flash-image-preview" ในตัวเลือก
- ป้อนข้อความแจ้งเตือนและ/หรืออัปโหลดรูปภาพเพื่อดูการแก้ไขแบบเรียลไทม์พร้อมรองรับการแก้ไขแบบหลายกะ
แม้ว่าพฤติกรรมจะปรับปรุงดีขึ้นทั้งในด้านความสม่ำเสมอและความสมจริง แต่ก็ควรจำไว้ว่า การแสดงข้อความภายในภาพหรือการสะท้อนที่ซับซ้อนบางอย่างอาจยังไม่สมบูรณ์แบบอย่างไรก็ตาม การแก้ไขและใส่ลายน้ำที่ขับเคลื่อนด้วยภาษาทำให้เกิดความสมดุลที่น่าสนใจระหว่างการควบคุมความคิดสร้างสรรค์และความรับผิดชอบ
ด้วยการผสมผสานระหว่างการแก้ไขการสนทนา ความสม่ำเสมอของตัวละคร ความเร็ว และการป้องกันเช่น SynthID "Nano Banana" เป็นตัวเลือกที่หลากหลายสำหรับผู้สร้าง แบรนด์ และผู้ใช้ที่ต้องการปรับแต่งรูปภาพหรือจัดฉากโดยไม่ต้องยุ่งยากกับการใช้มาสก์และเลเยอร์:ทั้งหมดมาจาก Gemini เองและมีกระแสที่สนับสนุนการวนซ้ำจนกว่าจะพบเวอร์ชันที่เหมาะสมที่สุดกับแนวคิดเดิม
ฉันเป็นผู้ชื่นชอบเทคโนโลยีที่เปลี่ยนความสนใจ "เกินบรรยาย" ของเขาให้กลายเป็นอาชีพ ฉันใช้เวลามากกว่า 10 ปีในชีวิตไปกับเทคโนโลยีล้ำสมัยและปรับแต่งโปรแกรมทุกประเภทด้วยความอยากรู้อยากเห็น ตอนนี้ฉันมีความเชี่ยวชาญในด้านเทคโนโลยีคอมพิวเตอร์และวิดีโอเกม เนื่องจากเป็นเวลากว่า 5 ปีแล้วที่ฉันเขียนให้กับเว็บไซต์ต่างๆ เกี่ยวกับเทคโนโลยีและวิดีโอเกม โดยสร้างบทความที่พยายามให้ข้อมูลที่คุณต้องการในภาษาที่ทุกคนเข้าใจได้
หากคุณมีคำถามใดๆ ความรู้ของฉันมีตั้งแต่ทุกอย่างที่เกี่ยวข้องกับระบบปฏิบัติการ Windows รวมถึง Android สำหรับโทรศัพท์มือถือ และความมุ่งมั่นของฉันคือคุณ ฉันยินดีสละเวลาสักครู่เสมอและช่วยคุณแก้ไขคำถามใดๆ ที่คุณอาจมีในโลกอินเทอร์เน็ตนี้
