1. 新聞重點
Gemma 4 12B 被定位在 E4B 與 26B MoE 之間,目標是把 agentic multimodal intelligence 帶到一般筆電。官方說法強調 16GB RAM / VRAM 或 unified memory 即可本機運行。
Google 在 2026-06-03 發布 Gemma 4 12B。它不是 Gemma 3 12B 的小修,而是 Gemma 4 家族裡補上的筆電級中型多模態模型,主打 encoder-free 架構、原生音訊輸入,以及 16GB 級本機推論。
Gemma 4 12B 被定位在 E4B 與 26B MoE 之間,目標是把 agentic multimodal intelligence 帶到一般筆電。官方說法強調 16GB RAM / VRAM 或 unified memory 即可本機運行。
Gemma 3 12B 是 image-text-to-text 的成熟模型;Gemma 4 12B 則採用 gemma4_unified 架構,移除傳統多模態 encoder 的重負擔,讓影像與音訊更直接進入 LLM backbone。
E2B / E4B 偏邊緣裝置,26B MoE / 31B Dense 偏高推理能力與工作站,Gemma 3n 偏行動多模態與 ASR/translation,TranslateGemma 是翻譯專用分支。12B 補的是「筆電級多模態 agent」這個中間層。
最直接的落地場景不是聊天,而是本機資料分析、圖表生成、程式執行、語音轉寫/口述編輯、OCR、chart understanding,以及隱私敏感的離線 local agent workflow。