ทันข่าวลงทุน

Nano Banana 2 — Gemini 3.1 Flash Image ขึ้นแท่นโมเดลสร้างภาพอันดับ 1 ในราคาครึ่งเดียว

Google เปิดตัว Gemini 3.1 Flash Image Preview — โมเดลสร้างภาพอันดับ 1 ที่ราคาถูกที่สุด

Google DeepMind เปิดตัว Nano Banana 2 — ชื่ออย่างเป็นทางการคือ Gemini 3.1 Flash Image Preview (gemini-3.1-flash-image-preview) — โมเดลสร้างภาพที่ขึ้นอันดับ 1 ใน Artificial Analysis Image Arena และ LMSys Arena ทันทีหลังเปิดตัว ทั้งที่มีราคาเพียง ครึ่งหนึ่ง ของคู่แข่ง ถือเป็นครั้งแรกที่โมเดลอันดับ 1 ของโลกกลับมีราคาถูกที่สุดในตลาดอีกด้วย

ราคาที่เปลี่ยนเกม — ถูกกว่า 37-63%

  • Nano Banana 2 — $67 ต่อ 1,000 ภาพ (ภาพมาตรฐาน ~$0.05, ภาพ 4K ~$0.15)
  • Nano Banana Pro — $134 ต่อ 1,000 ภาพ (แพงกว่า 2 เท่า)
  • GPT Image 1.5 — $133 ต่อ 1,000 ภาพ
  • FLUX — ราคาแข่งขันได้แต่คุณภาพต่ำกว่าตาม benchmark

การที่โมเดลอันดับ 1 ทั้งในด้านคุณภาพ (จาก blind human evaluation) มีราคาถูกกว่าคู่แข่งอย่างมีนัยสำคัญ ถือเป็นการเปลี่ยนเกมของตลาดสร้างภาพด้วย AI เพราะที่ผ่านมาคุณภาพสูงสุดมักมาพร้อมราคาสูงสุดเสมอ

ความสามารถสำคัญ 5 ประการ

  • ภาพ 4K ระดับ Pro — สร้างภาพความละเอียดสูงด้วยสถาปัตยกรรม Flash ที่เร็วกว่า ทำในสิ่งที่หลายคนคิดว่าเป็นไปไม่ได้ — คุณภาพระดับ Pro ในราคา Flash
  • Character Consistency — สร้างตัวละครที่มีลักษณะสอดคล้องกันข้ามภาพหลายภาพ สำคัญมากสำหรับการสร้างเนื้อหาแบบต่อเนื่อง เช่น การ์ตูน สตอรี่บอร์ด หรือสื่อการตลาด
  • Search Grounding — ดึงข้อมูลจากเว็บเพื่อสร้างภาพที่ถูกต้องตามข้อเท็จจริง เช่น ถ้าขอภาพ "ตึก Empire State" โมเดลจะค้นหารูปจริงก่อนเพื่อให้ผลลัพธ์ถูกต้อง
  • การเรนเดอร์ข้อความ — สร้างข้อความในภาพได้อย่างชัดเจนและถูกต้อง ซึ่งเป็นจุดอ่อนของโมเดลสร้างภาพส่วนใหญ่
  • SynthID — ทุกภาพถูกฝังลายน้ำดิจิทัลเพื่อระบุว่าสร้างโดย AI ช่วยต่อสู้กับปัญหา deepfake

การเปิดให้ใช้งานในวงกว้าง

Google ทำให้ Nano Banana 2 เป็นเครื่องมือสร้างภาพเริ่มต้นในหลายบริการ:

  • Gemini app — ผู้ใช้ทุกคนใช้ Nano Banana 2 เป็นค่าเริ่มต้น
  • Google Search AI Mode — สร้างภาพประกอบคำตอบ
  • Google Lens — แก้ไขและสร้างภาพจากกล้อง
  • Google Ads — สร้างภาพโฆษณาอัตโนมัติ
  • Flow — เครื่องมือสร้างวิดีโอ AI ของ Google

โมเดลพร้อมใช้งานผ่าน Gemini API และ Vertex AI สำหรับนักพัฒนา สิ่งที่ขาดไปคือ รายละเอียดงานวิจัยหรือเปเปอร์ — Google ไม่ได้เผยแพร่ข้อมูลเชิงเทคนิคเกี่ยวกับวิธีที่โมเดลทำงาน ทำให้ชุมชนวิจัยไม่สามารถวิเคราะห์เชิงลึกหรือสร้างโมเดลที่แข่งขันได้ นี่สะท้อนแนวโน้มที่บริษัทใหญ่เปิดตัวโมเดลแต่ไม่เปิดเผยวิธีการ

การที่ Gemini 3.1 Flash Image ขึ้นเป็นอันดับ 1 ในการสร้างภาพ สะท้อนว่า Google กำลังรุกตลาด AI สร้างภาพอย่างจริงจัง โมเดลนี้ใช้สถาปัตยกรรมแบบ native multimodal ที่สร้างทั้งข้อความและภาพในโมเดลเดียว แตกต่างจากแนวทางแบบ diffusion ที่ใช้โมเดลแยก การที่ชื่อ Nano Banana 2 กลายเป็นที่พูดถึงในชุมชน AI สะท้อนว่าเทรนด์การตั้งชื่อโมเดลที่แปลกใหม่ช่วยสร้างกระแสได้ดี

การแข่งขันในตลาดโมเดลสร้างภาพ AI กำลังเข้มข้นขึ้น โดย Google, OpenAI และ Stability AI ต่างเร่งพัฒนาเทคโนโลยีเพื่อแย่งชิงส่วนแบ่งตลาดที่เติบโตอย่างรวดเร็ว ผู้ใช้งานได้ประโยชน์จากการแข่งขันนี้ เพราะคุณภาพของภาพที่สร้างได้ดีขึ้นอย่างก้าวกระโดดในทุกรอบการเปิดตัวโมเดลใหม่

บทความที่เกี่ยวข้อง

ข่าว AI

Context Drought — หน้าต่างบริบท 1 ล้านโทเค็นยังติดคอขวด HBM และวงการ AI อาจต้อง "ปันส่วน" บริบทในอนาคต

Anthropic เปิดใช้งานหน้าต่างบริบท 1 ล้านโทเค็นอย่างเป็นทางการ — แต่มาช้ากว่า Gemini และ OpenAI Anthropic ได้รับเสียงชื่นชมจากการเปิดให้ใช้งานโมเดลที่รองรับหน้าต่างบริบท 1 ล้านโทเค็นแบบ GA (General Ava...

อ่านเพิ่มเติม →
ข่าว AI

โครงร่างควบคุม Agent สำคัญกว่าโมเดล — CursorBench เปิดตัว, Nemotron 3 Super เร็วกว่า GPT-OSS 2.2 เท่า

โครงร่างควบคุม Agent และ MCP กำลังกลายเป็นโครงสร้างพื้นฐานจริงของวงการ หลายโพสต์ในสัปดาห์นี้มาบรรจบกันที่มุมมองเดียวกัน — คุณภาพของโมเดลไม่ใช่คอขวดอีกต่อไปแล้ว สิ่งที่อยู่รอบตัวโมเดลต่างหากที่สำคัญกว่...

อ่านเพิ่มเติม →
ข่าว AI

Replit Agent 4 พลิกโฉม, Nemotron 3 Super แรงกว่าเดิม: AI Agent ขึ้นแท่นเทรนด์หลัก

Replit Agent 4: ยกระดับจากแพลตฟอร์มโค้ดดิ้ง สู่ AI Agent งานความรู้เต็มตัว Replit เพิ่งทำมูลค่าเพิ่มขึ้นสามเท่าเป็น $9B ในช่วง 6 เดือนที่ผ่านมา Amjad Masad และทีมมีเซนส์ที่ยอดเยี่ยมต่อ "กระแสหลักปัจจุ...

อ่านเพิ่มเติม →