Nano Banana 2 — Gemini 3.1 Flash Image ขึ้นแท่นโมเดลสร้างภาพอันดับ 1 ในราคาครึ่งเดียว
Google เปิดตัว Gemini 3.1 Flash Image Preview — โมเดลสร้างภาพอันดับ 1 ที่ราคาถูกที่สุด
Google DeepMind เปิดตัว Nano Banana 2 — ชื่ออย่างเป็นทางการคือ Gemini 3.1 Flash Image Preview (gemini-3.1-flash-image-preview) — โมเดลสร้างภาพที่ขึ้นอันดับ 1 ใน Artificial Analysis Image Arena และ LMSys Arena ทันทีหลังเปิดตัว ทั้งที่มีราคาเพียง ครึ่งหนึ่ง ของคู่แข่ง ถือเป็นครั้งแรกที่โมเดลอันดับ 1 ของโลกกลับมีราคาถูกที่สุดในตลาดอีกด้วย
ราคาที่เปลี่ยนเกม — ถูกกว่า 37-63%
- Nano Banana 2 — $67 ต่อ 1,000 ภาพ (ภาพมาตรฐาน ~$0.05, ภาพ 4K ~$0.15)
- Nano Banana Pro — $134 ต่อ 1,000 ภาพ (แพงกว่า 2 เท่า)
- GPT Image 1.5 — $133 ต่อ 1,000 ภาพ
- FLUX — ราคาแข่งขันได้แต่คุณภาพต่ำกว่าตาม benchmark
การที่โมเดลอันดับ 1 ทั้งในด้านคุณภาพ (จาก blind human evaluation) มีราคาถูกกว่าคู่แข่งอย่างมีนัยสำคัญ ถือเป็นการเปลี่ยนเกมของตลาดสร้างภาพด้วย AI เพราะที่ผ่านมาคุณภาพสูงสุดมักมาพร้อมราคาสูงสุดเสมอ
ความสามารถสำคัญ 5 ประการ
- ภาพ 4K ระดับ Pro — สร้างภาพความละเอียดสูงด้วยสถาปัตยกรรม Flash ที่เร็วกว่า ทำในสิ่งที่หลายคนคิดว่าเป็นไปไม่ได้ — คุณภาพระดับ Pro ในราคา Flash
- Character Consistency — สร้างตัวละครที่มีลักษณะสอดคล้องกันข้ามภาพหลายภาพ สำคัญมากสำหรับการสร้างเนื้อหาแบบต่อเนื่อง เช่น การ์ตูน สตอรี่บอร์ด หรือสื่อการตลาด
- Search Grounding — ดึงข้อมูลจากเว็บเพื่อสร้างภาพที่ถูกต้องตามข้อเท็จจริง เช่น ถ้าขอภาพ "ตึก Empire State" โมเดลจะค้นหารูปจริงก่อนเพื่อให้ผลลัพธ์ถูกต้อง
- การเรนเดอร์ข้อความ — สร้างข้อความในภาพได้อย่างชัดเจนและถูกต้อง ซึ่งเป็นจุดอ่อนของโมเดลสร้างภาพส่วนใหญ่
- SynthID — ทุกภาพถูกฝังลายน้ำดิจิทัลเพื่อระบุว่าสร้างโดย AI ช่วยต่อสู้กับปัญหา deepfake
การเปิดให้ใช้งานในวงกว้าง
Google ทำให้ Nano Banana 2 เป็นเครื่องมือสร้างภาพเริ่มต้นในหลายบริการ:
- Gemini app — ผู้ใช้ทุกคนใช้ Nano Banana 2 เป็นค่าเริ่มต้น
- Google Search AI Mode — สร้างภาพประกอบคำตอบ
- Google Lens — แก้ไขและสร้างภาพจากกล้อง
- Google Ads — สร้างภาพโฆษณาอัตโนมัติ
- Flow — เครื่องมือสร้างวิดีโอ AI ของ Google
โมเดลพร้อมใช้งานผ่าน Gemini API และ Vertex AI สำหรับนักพัฒนา สิ่งที่ขาดไปคือ รายละเอียดงานวิจัยหรือเปเปอร์ — Google ไม่ได้เผยแพร่ข้อมูลเชิงเทคนิคเกี่ยวกับวิธีที่โมเดลทำงาน ทำให้ชุมชนวิจัยไม่สามารถวิเคราะห์เชิงลึกหรือสร้างโมเดลที่แข่งขันได้ นี่สะท้อนแนวโน้มที่บริษัทใหญ่เปิดตัวโมเดลแต่ไม่เปิดเผยวิธีการ
การที่ Gemini 3.1 Flash Image ขึ้นเป็นอันดับ 1 ในการสร้างภาพ สะท้อนว่า Google กำลังรุกตลาด AI สร้างภาพอย่างจริงจัง โมเดลนี้ใช้สถาปัตยกรรมแบบ native multimodal ที่สร้างทั้งข้อความและภาพในโมเดลเดียว แตกต่างจากแนวทางแบบ diffusion ที่ใช้โมเดลแยก การที่ชื่อ Nano Banana 2 กลายเป็นที่พูดถึงในชุมชน AI สะท้อนว่าเทรนด์การตั้งชื่อโมเดลที่แปลกใหม่ช่วยสร้างกระแสได้ดี
การแข่งขันในตลาดโมเดลสร้างภาพ AI กำลังเข้มข้นขึ้น โดย Google, OpenAI และ Stability AI ต่างเร่งพัฒนาเทคโนโลยีเพื่อแย่งชิงส่วนแบ่งตลาดที่เติบโตอย่างรวดเร็ว ผู้ใช้งานได้ประโยชน์จากการแข่งขันนี้ เพราะคุณภาพของภาพที่สร้างได้ดีขึ้นอย่างก้าวกระโดดในทุกรอบการเปิดตัวโมเดลใหม่
