Gemma 4 12B Brief

四張圖看懂 Gemma 4 12B

Google 在 2026-06-03 發布 Gemma 4 12B。它不是 Gemma 3 12B 的小修，而是 Gemma 4 家族裡補上的筆電級中型多模態模型，主打 encoder-free 架構、原生音訊輸入，以及 16GB 級本機推論。

4 slides 40 seconds MP4 1503 KB 繁體中文重點版

1. 新聞重點

Gemma 4 12B 被定位在 E4B 與 26B MoE 之間，目標是把 agentic multimodal intelligence 帶到一般筆電。官方說法強調 16GB RAM / VRAM 或 unified memory 即可本機運行。

Gemma 3 12B 是 image-text-to-text 的成熟模型；Gemma 4 12B 則採用 gemma4_unified 架構，移除傳統多模態 encoder 的重負擔，讓影像與音訊更直接進入 LLM backbone。

E2B / E4B 偏邊緣裝置，26B MoE / 31B Dense 偏高推理能力與工作站，Gemma 3n 偏行動多模態與 ASR/translation，TranslateGemma 是翻譯專用分支。12B 補的是「筆電級多模態 agent」這個中間層。

最直接的落地場景不是聊天，而是本機資料分析、圖表生成、程式執行、語音轉寫/口述編輯、OCR、chart understanding，以及隱私敏感的離線 local agent workflow。