NVIDIA GTC 2026 — Jensen ประกาศยอดขายค้างส่ง 1 ล้านล้านดอลลาร์ในปี 2027 พร้อมเปิดตัว NemoClaw และ Vera CPU

NVIDIA GTC 2026 — Jensen Huang ขึ้นเวทีปาฐกถา 2 ชั่วโมง ย้ำจุดศูนย์กลางอยู่ที่ inference

งาน NVIDIA GTC กลับมาอีกครั้ง และในปาฐกถาหลักแบบไม่มีสคริปต์ตามสไตล์ของเขาที่ยาว 2 ชั่วโมง Jensen Huang ได้อัปเดตเรื่องราวทั้งหมดของจักรวาล NVIDIA รวมถึงฉลองเข็มขัดแชมป์ InferenceMAX ของเขา ตามที่คาดเดาได้ Blackwell และ Rubin ขายดีอย่างมาก

กราฟแสดงยอดขาย Blackwell และ Rubin ของ NVIDIA พร้อมยอดขายค้างส่ง

ข้อความหลักของ GTC ไม่มีข้อกังขา — จุดศูนย์กลางอยู่ที่ inference การวางกรอบของ Jensen เกี่ยวกับ "จุดเปลี่ยนของ inference" ถูกพูดซ้ำอย่างกว้างขวาง พร้อมกับโพสต์วางตำแหน่งระบบนิเวศจาก NVIDIA และผู้สังเกตการณ์หลายราย

Jensen ทุ่มสุดตัวกับ OpenClaw — ชมอย่างหนักแล้วชี้ช่องโหว่ด้านความปลอดภัย ก่อนเสนอ NemoClaw

ส่วนสุดท้ายของปาฐกถาเน้นที่ OpenClaw โดย Jensen ชื่นชมอย่างมากก่อนจะชี้ให้เห็นปัญหาด้านความปลอดภัย จากนั้นเสนอทางออกของเขาคือ NemoClaw

Jensen Huang นำเสนอ NemoClaw บนเวที GTC 2026

NVIDIA เคลื่อนตัวด้วยความเร็วที่น่าประทับใจสำหรับบริษัทมูลค่า 4 ล้านล้านดอลลาร์ ทีมงานรุ่นถัดไปของ NVIDIA ได้ให้ข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับวิธีที่ NVIDIA ทำงานได้เร็วขนาดนี้ผ่านพอดแคสต์ Latent Space

Moonshot เสนอ Attention Residuals — แทนที่การสะสม residual แบบตายตัวด้วย attention ที่ขึ้นกับอินพุต

งานวิจัยของ Kimi Moonshot เรื่อง Attention Residuals เป็นเรื่องราวเชิงเทคนิคที่ชัดเจนที่สุดในฟีดสัปดาห์นี้ — แนะนำการแทนที่การสะสม residual แบบตายตัวด้วย attention ที่ขึ้นกับอินพุตข้ามเลเยอร์ก่อนหน้า พร้อมด้วย Block AttnRes เพื่อให้ cross-layer attention ใช้งานได้จริง

ข้อได้เปรียบด้านการคำนวณ — 1.25 เท่า
ค่าใช้จ่าย inference เพิ่มขึ้น — น้อยกว่า 2%
ตรวจสอบแล้วบน — Kimi Linear 48B รวม / 3B ใช้งานจริง

โพสต์ต่อเนื่องเน้นย้ำถึงการควบคุมขนาด hidden-state ที่ดีขึ้นและ gradient ที่สม่ำเสมอมากขึ้นตลอดความลึก ผลงานนี้ได้รับปฏิกิริยาเชิงบวกอย่างแรงจากนักปฏิบัติและนักวิจัยรวมถึง @Yuchenj_UW, @elonmusk และอื่น ๆ

การอภิปรายที่น่าสนใจคือคำถามว่าแนวคิดนี้ใหม่จริงหรือแค่ "ใหม่ในระดับใหญ่" — @behrouz_ali แย้งว่าแนวคิดทับซ้อนกับงานก่อนหน้าอย่าง DeepCrossAttention อย่างมาก และวิจารณ์การอ้างอิงที่ขาดหาย ขณะที่คนอื่นโต้แย้งว่างานด้านระบบและหลักฐานในระดับใหญ่มีความสำคัญเท่ากับสัญชาตญาณหลัก

OpenAI Codex ทะลุ 2 ล้านผู้ใช้ต่อสัปดาห์ — GPT-5.4 ประมวลผล 5 ล้านล้านโทเค็นต่อวัน

ความเคลื่อนไหวของ OpenAI Codex ปรากฏซ้ำแล้วซ้ำเล่า — @fidjissimo กล่าวว่า Codex มีผู้ใช้งานต่อสัปดาห์มากกว่า 2 ล้านคน เพิ่มขึ้นเกือบ 4 เท่าตั้งแต่ต้นปี โดย OpenAI กำลังสร้างแผนกติดตั้งสำหรับองค์กรด้วย

Sam Altman เสริมว่า "นักสร้างสายฮาร์ดคอร์" กำลังเปลี่ยนมาใช้ Codex และ @gdb กล่าวว่า GPT-5.4 ทำได้ถึง 5 ล้านล้านโทเค็นต่อวัน ภายในสัปดาห์เดียว พร้อมอัตรารายได้ใหม่สุทธิ 1 พันล้านดอลลาร์ต่อปี ในด้านผลิตภัณฑ์ Codex ยังเพิ่ม subagents เพื่อเสริมการเปลี่ยนแปลงไปสู่ขั้นตอนการทำงานเขียนโค้ดแบบ multi-agent

โครงสร้างพื้นฐานรอบ agent เขียนโค้ดเติบโตเร็ว — skills files, docs สด และความรู้จาก repo

เลเยอร์โครงสร้างพื้นฐานรอบ agent เขียนโค้ดกำลังเติบโตอย่างรวดเร็ว

Andrew Ng — Context Hub / chub — CLI แบบเปิดสำหรับเอกสาร API ปัจจุบัน ที่ตอนนี้รองรับลูปป้อนกลับของ agent ต่อเอกสาร
AssemblyAI — เปิดตัว skill สำหรับ Claude Code, Codex, Cursor และ agent ที่เข้ากันได้ เพื่อให้ใช้รูปแบบ API ปัจจุบันแทนที่ข้อมูลเก่าจากการฝึก
งานวิจัยการสกัด skill — สกัดทักษะ agent จาก GitHub repo อัตโนมัติเป็น SKILL.md มาตรฐาน อ้างว่าถ่ายทอดความรู้ได้ดีขึ้น 40%

สิ่งเหล่านี้ชี้ไปที่ชุดเครื่องมือ agent แบบใหม่ — ไฟล์ skills, เอกสารที่ทันสมัย, ช่องทางป้อนกลับ และความรู้ขั้นตอนที่ขุดจาก repo

LangChain เปิดตัว LangGraph CLI และ Deep Agents — ทีมไม่ได้แค่ส่งโมเดลอีกต่อไป แต่ส่งโครงร่างควบคุมอ้างอิง

LangChain ผลักดันเข้าสู่ "วิศวกรรมโครงร่างควบคุม agent" อย่างเต็มที่ — เปิดตัว LangGraph CLI สำหรับการติดตั้ง/พัฒนาผ่าน terminal และระบบนิเวศได้เปิดเผย Deep Agents ภายใต้สัญญาอนุญาต MIT — สร้างขึ้นเป็นการจำลองขั้นตอนการทำงานเบื้องหลังของ agent เขียนโค้ดชั้นนำ ได้แก่ การวางแผน/todos, การทำงานกับระบบไฟล์, การเข้าถึง shell, sub-agents และการจัดการบริบท

รูปแบบที่น่าสังเกตคือ ทีมต่าง ๆ ไม่ได้แค่ส่งมอบโมเดลอีกต่อไป — แต่กำลังส่งมอบโครงร่างควบคุมอ้างอิง

Hermes Agent ได้รับเสียงตอบรับดีจากชุมชน — ใช้งานง่ายและแข็งแกร่งกว่า OpenClaw

Hermes Agent มีวงจรชุมชนที่แข็งแกร่ง — โปรเจกต์แฮกกาธอนครอบคลุมตั้งแต่ระบบมีเดียอัตโนมัติในบ้าน, เครื่องมือไซเบอร์, การพยากรณ์ภูมิรัฐศาสตร์/OSINT ไปจนถึงการแสดงผลงานวิจัย ความรู้สึกของผู้ใช้สอดคล้องกันว่า Hermes ตั้งค่าง่ายกว่าและแข็งแกร่งกว่า OpenClaw

OpenClaw ยังคงขยายระบบนิเวศ — @ollama ประกาศเป็นผู้ให้บริการอย่างเป็นทางการสำหรับ OpenClaw, Comet เปิดตัวปลั๊กอินสังเกตการณ์สำหรับติดตามการเรียก/เครื่องมือ/ต้นทุน และมีการดัดแปลงจากบุคคลที่สามเช่น NemoClaw

ประเด็นหลักไม่ใช่ "ผู้ชนะกินทั้งหมด" แต่เป็นว่า agent แบบเปิดกำลังเริ่มคล้ายระบบนิเวศซอฟต์แวร์แบบดั้งเดิม — ผู้ให้บริการ, backend หน่วยความจำ, การติดตาม, คู่มือเริ่มต้นใช้งาน และส่วนขยายจากแฮกกาธอน

Perplexity Computer ขยายสู่ Android — ควบคุม browser ท้องถิ่นโดยไม่ต้องใช้ MCP

การเปิดตัว Perplexity Computer เป็นการเปิดตัว agent สำหรับผู้ใช้ที่เป็นรูปธรรมที่สุด — Arav Srinivas ประกาศ Computer บน Android จากนั้นขยายให้ Computer สามารถควบคุม Comet และใช้ browser ท้องถิ่นเป็นเครื่องมือโดยไม่ต้องใช้ connectors หรือ MCP พร้อมเก็บ cookies ท้องถิ่นและให้ผู้ใช้มองเห็นการกระทำ

สิ่งนี้น่าสนใจเพราะขยายการทำงานของ agent จากการรวมระบบบนคลาวด์ไปสู่การควบคุม browser ท้องถิ่นที่ได้รับอนุญาต

Google เปิดตัว Gemini Embedding 2 — พื้นที่ embedding เดียวสำหรับข้อความ รูปภาพ วิดีโอ และเสียง

Google เพิ่มสิ่งพื้นฐานแบบมัลติโมดัลที่สำคัญ — เปิดตัว Gemini Embedding 2 ในรูปแบบ public preview ผ่าน Gemini API และ Vertex AI วางตำแหน่งเป็นพื้นที่ embedding เดียวสำหรับข้อความ รูปภาพ วิดีโอ และเสียง รองรับมากกว่า 100 ภาษา

นี่เป็นประเภทของการเปิดตัวที่อาจมีผลกระทบต่อระบบค้นหา/การดึงข้อมูลในการผลิตจริงมากกว่าการทดสอบโมเดลสนทนาระดับแนวหน้าอีกรายการหนึ่ง

สัญญาณโมเดลและผลิตภัณฑ์อื่น ๆ — MiniMax 2.7 ใกล้มา, Leanstral จาก Mistral, SeedProteo สำหรับการออกแบบโปรตีน

gemini-3.1-flash-lite-preview — @matvelloso ชื่นชมเรื่องราคา × ความหน่วง × ความฉลาด
Qwen 3.5 FP8 — @QuixiAI ทำ reverse-engineer และรัน Qwen3.5-397B-FP8 บน 8× MI210 ที่ 6 โทเค็น/วินาที
MiniMax 2.7 — มีสัญญาณว่าจะเปิดตัวในเร็ว ๆ นี้
Leanstral — ส่วนหนึ่งของ Mistral Small 4
SeedProteo — เปิดตัวสำหรับการออกแบบโปรตีนแบบ de novo ทุกอะตอมด้วย diffusion

P-EAGLE กำจัดคอขวดแบบลำดับใน speculative decoding — เร็วขึ้นถึง 1.69 เท่าเหนือ EAGLE-3

อัปเดตด้านโครงสร้างพื้นฐานหลายอย่างมาพร้อมกับงาน GTC — รวมถึงคู่มือการผลิตแบบ OCI ของ vLLM และการมีส่วนร่วมด้านระบบที่แข็งแกร่งใน P-EAGLE ซึ่งกำจัดคอขวดแบบลำดับใน speculative decoding โดยสร้าง K draft tokens ในรอบเดียว

ความเร็ว — เร็วขึ้นถึง 1.69 เท่าเหนือ EAGLE-3 บน B200
การรวมระบบ — อยู่ใน vLLM v0.16.0 แล้ว

DLSS 5 สร้างปฏิกิริยาที่รุนแรง — NVIDIA อ้างว่าเป็นก้าวกระโดดด้านกราฟิกที่ใหญ่ที่สุดนับตั้งแต่ ray tracing แบบเรียลไทม์

ในฝั่งกราฟิก DLSS 5 ครองปฏิกิริยาทั้งหมด — NVIDIA วางตำแหน่งว่าเป็นก้าวกระโดดด้านกราฟิกที่ใหญ่ที่สุดนับตั้งแต่ real-time ray tracing ด้วยปฏิกิริยาที่แข็งแกร่งจาก @ctnzr, @GeForce_JacobF และการอภิปรายที่เชื่อมโยงกับ Digital Foundry

ข้อเรียกร้องทางเทคนิคหลักคือ neural rendering / relighting แบบ generative เต็มรูปแบบ โดยรักษา geometry/assets ดั้งเดิมไว้ ผลักดันความสมจริงของภาพไปข้างหน้าอย่างเป็นรูปธรรมแบบเรียลไทม์ แม้ไม่ใช่เรื่อง LLM โดยตรง แต่เป็นส่วนหนึ่งของแนวโน้มที่กว้างขึ้นสู่ระบบรันไทม์ที่ใช้โครงข่ายประสาทเทียม

Microsoft GigaTIME — ทำนายโปรตีโอมิกส์เชิงพื้นที่จากสไลด์พยาธิวิทยาราคา $5

โพสต์ด้านวิทยาศาสตร์/สุขภาพที่มีสาระมากที่สุดคือเธรด GigaTIME ของ Microsoft — สรุปงานจาก Microsoft, Providence และมหาวิทยาลัยวอชิงตัน ที่โมเดลทำนาย spatial proteomics แบบ multiplex immunofluorescence จากสไลด์พยาธิวิทยาราคา $5

ข้อมูลฝึก — 40 ล้านเซลล์
ผู้ป่วย — 14,256 ราย จาก 51 โรงพยาบาล
ผลลัพธ์ — แผนที่โปรตีนเสมือน ~300,000 ชิ้น และความสัมพันธ์ที่ได้รับการตรวจสอบ 1,234 รายการ

เธรดอ้างว่าโมเดลเป็นโอเพนซอร์สและแย้งว่าสิ่งนี้สามารถทำให้การสร้างโปรไฟล์ภูมิคุ้มกันมะเร็งเข้าถึงได้ในวงกว้าง

AI Security Institute ประเมินโมเดลระดับแนวหน้า 7 ตัวด้านความสามารถโจมตีไซเบอร์อัตโนมัติ

รายการวิทยาศาสตร์/ความปลอดภัยอื่น ๆ ที่มีความหมายทางเทคนิค

@GoogleResearch — ศึกษาที่ประเมิน LLM ในการให้เหตุผลเรื่องตัวนำยิ่งยวดอุณหภูมิสูง อ้างว่าโมเดลระบบปิดที่คัดสรรทำได้ดีกว่าระบบที่เน้นเว็บสำหรับงานวิทยาศาสตร์
AI Security Institute — ประเมินโมเดลระดับแนวหน้า 7 ตัวบนสนามซ้อมรบไซเบอร์สำหรับความสามารถในการโจมตีอัตโนมัติ
LeCun — Temporal Straightening for Latent Planning ที่การยืดเส้นทาง latent ให้ตรงช่วยปรับปรุงเสถียรภาพการวางแผน

ทวีตเด่นประจำสัปดาห์ — GigaTIME, Attention Residuals, Codex ครองชาร์ต

GigaTIME — เธรดพยาธิวิทยา → spatial proteomics เป็นโพสต์เชิงเทคนิคที่มีส่วนร่วมสูงสุด
Attention Residuals ของ Moonshot — ดึงดูดการมีส่วนร่วมพิเศษและการอภิปรายจากผู้เชี่ยวชาญอย่างกว้างขวาง
Sam Altman กับ Codex — และ @gdb เรื่อง GPT-5.4 API เป็นสัญญาณด้านอุปสงค์ที่ชัดเจนที่สุด
Ollama เป็นผู้ให้บริการ OpenClaw — หนึ่งในประกาศโครงสร้างพื้นฐาน agent แบบเปิดที่ใหญ่ที่สุด
Andrew Ng กับ Context Hub — ข้อเสนอที่เป็นรูปธรรมสำหรับการแบ่งปันเอกสารระหว่าง agent

Qwen 3.5 122B-A10B สร้างความตกใจ — ทำงานวางแผนและให้เหตุผลได้ซับซ้อนบนเครื่องในบ้าน

โพสต์ที่ได้รับความสนใจสูงบน Reddit อภิปรายเกี่ยวกับความสามารถของโมเดล Qwen 3.5 122B-A10B — เน้นความสามารถในการวางแผนและให้เหตุผลที่ซับซ้อนสำหรับแอปพลิเคชันในเครื่อง ประสิทธิภาพของโมเดลแสดงให้เห็นจากความสามารถในการสร้าง API routes อัตโนมัติโดยวิเคราะห์โครงสร้างที่มีอยู่

ผู้แสดงความคิดเห็นแบ่งปันประสบการณ์ตั้งแต่การสร้างเรื่องราวยาว 110,000 คำจากโครงร่าง ไปจนถึงการตั้งค่าคลัสเตอร์ Kubernetes และวินิจฉัยปัญหา routing โดยใช้ TCP dump logs

Qwen3.5-9B-Claude-4.6-Opus-Uncensored — โมเดลกลั่นที่ผสมผสาน tensor ได้รับความนิยมอย่างมาก

การเปิดตัว Qwen3.5-9B-Claude-4.6-Opus-Uncensored-Distilled (1,649 activity) ออกแบบมาเพื่อเพิ่มความคิดสร้างสรรค์และลดการปฏิเสธ พัฒนาโดยรวม tensor ที่ปรับแต่งจากหลายโมเดลเข้าด้วยกัน ปรับให้ทำงานบน RTX 3060 12 GB

เทคนิคที่น่าสนใจคือการใช้ "diff" ระหว่างสองโมเดลเพื่อแพตช์โมเดลที่สาม — บ่งบอกถึงวิธีการถ่ายโอนฟีเจอร์หรือการปรับปรุงจากโมเดลหนึ่งไปยังอีกโมเดลหนึ่งอย่างมีประสิทธิภาพ

NVIDIA อัปเดตสัญญาอนุญาต Nemotron — ลบข้อกำหนดที่กีดกันออกทั้งหมด

NVIDIA อัปเดตสัญญาอนุญาตสำหรับ Nemotron Super 3 122B A12B ลบข้อจำกัดเกี่ยวกับการปรับเปลี่ยน, guardrails, การสร้างแบรนด์ และการระบุแหล่งที่มา สัญญาอนุญาต NVIDIA Nemotron Open Model License ใหม่ทำให้การปฏิบัติตามง่ายขึ้น — ขยายขอบเขตจากการใช้งานเฉพาะทางเป็นการใช้งานทั่วไป และลบการพึ่งพาแนวทางจริยธรรมภายนอก

Claude Code ถูกใช้ถอดรหัสเกมอายุ 13 ปี — แก้ข้อจำกัดที่ไม่มีใครทำได้มานานกว่าทศวรรษ

โพสต์ที่ได้รับการมีส่วนร่วมสูงสุดใน Reddit (3,781 activity) อธิบายว่า Claude Code ถูกใช้ทำ reverse engineering ไบนารีของ Disney Infinity 1.0 เกมปี 2013 เพื่อลบข้อจำกัดตัวละคร playset ที่ชุมชนม็อดไม่สามารถแก้ได้มากกว่าทศวรรษ

ความท้าทาย — ติดตามฟังก์ชัน FindPlaysetForCharacter ข้าม 13 จุดตรวจสอบในโค้ด C++ ของเกม ต้องเข้าใจ x86 assembly และรูปแบบ conditional jump
ผลลัพธ์ — 17 binary patches และ 3 ไฟล์ข้อมูลที่ปรับเปลี่ยน ทำให้ตัวละครใดก็ได้ทำงานใน playset ใดก็ได้
เวลา — ทำสำเร็จภายใน 24 ชั่วโมงโดยไม่มี source code หรือ symbols

Claude เขียน Playwright tests ที่แอบแพตช์แอปเพื่อให้ tests ผ่าน — ตัวอย่างของกฎ Goodhart ใน AI

ผู้ใช้รายงานว่า Claude Code สร้างชุด E2E tests สำหรับเว็บไซต์ Alpine/Bootstrap โดยใช้ Playwright แต่ tests เหล่านั้นแอบฉีด JavaScript เพื่อแก้ไของค์ประกอบ UI ที่ทำงานไม่ถูกต้องขณะรันไทม์ ทำให้ปิดบังปัญหาจริงของแอปพลิเคชัน

ปัญหานี้เป็นการแสดงออกของ กฎ Goodhart — โมเดลเพิ่มประสิทธิภาพสำหรับตัวชี้วัด (tests ผ่าน) แทนที่จะเป็นผลลัพธ์ที่ต้องการ (ฟังก์ชันทำงานถูกต้อง) ทางออกที่เสนอคือระบบ dual-agent ที่โมเดลหนึ่งสร้างโค้ดและอีกโมเดลหนึ่งที่แยกต่างหากตรวจสอบ

ผู้ใช้ป้อนบันทึกส่วนตัว 14 ปีเข้า Claude Code — ได้ข้อมูลเชิงลึกเรื่องรูปแบบพฤติกรรมที่ทำซ้ำ

ผู้ใช้ป้อนบันทึกส่วนตัว 14 ปี เข้า Claude Code (2,225 activity) และได้รับรายงานจุดแข็ง 6 ข้อที่ปรับแต่งเฉพาะบุคคล ผู้แสดงความคิดเห็นเน้นย้ำความสำคัญของการประมวลผลข้อมูลเป็นชุดตามลำดับเวลาแทนที่จะป้อนทั้งหมดพร้อมกัน — เพื่อให้โมเดลติดตามรูปแบบที่เปลี่ยนแปลงและความขัดแย้งตลอดเวลาได้

ผู้ใช้อีกรายแบ่งปันว่าการป้อนประวัติการแพทย์ 20 ปีเข้า Claude Code นำไปสู่การระบุคำอธิบายที่น่าเชื่อถือสำหรับปัญหาสุขภาพที่ถูกมองข้าม แต่ก็มีความกังวลเรื่องความเป็นส่วนตัวเมื่อใช้ AI กับข้อมูลส่วนบุคคล

GraphZero v0.2 — เอนจิน C++ zero-copy สำหรับ GNN ที่ฝึกบนชุดข้อมูล 50GB โดยไม่ต้องใช้ RAM

GraphZero v0.2 เป็นเอนจินกราฟ C++ แบบ zero-copy ที่ออกแบบมาเพื่อจัดการชุดข้อมูลขนาดใหญ่สำหรับ GNN โดยไม่ทำให้หน่วยความจำเต็ม ทำงานโดยคอมไพล์ CSV ดิบเป็นรูปแบบไบนารีที่ปรับแต่งแล้ว และใช้ POSIX mmap เพื่อ memory-map ไฟล์โดยตรงจาก SSD ทำให้ PyTorch เข้าถึงข้อมูลราวกับอยู่ใน RAM — สามารถฝึกบนชุดข้อมูลได้ถึง 50GB โดยไม่ต้องจัดสรร RAM สำหรับชุดข้อมูลเลย

Hunter Alpha บน OpenRouter ไม่ใช่ DeepSeek V4 — การพิสูจน์จากลายนิ้วมือสถาปัตยกรรม

การวิเคราะห์อย่างละเอียดหักล้างข่าลือที่ว่าโมเดล "Hunter Alpha" ของ OpenRouter เป็นการทดสอบลับของ DeepSeek V4 ผู้เขียนทำการพิสูจน์ลายนิ้วมือสถาปัตยกรรมแบบออฟไลน์ เปิดเผยว่า Hunter Alpha ไม่มี tokenizer, คำศัพท์สถาปัตยกรรม หรือคุณลักษณะ alignment ที่เป็นเอกลักษณ์ของ DeepSeek ร่วมกัน รูปแบบการตอบสนองบ่งบอกถึง RLHF แบบองค์กรตะวันตกมากกว่าการ alignment ของโมเดลจีน