Gemma 4 MTP の GB10 実機ベンチ — 推論を 26B で 1.83 倍、31B Dense で 3.52 倍に高速化
Google の Gemma 4 MTP drafter を NVIDIA GB10 (GX10) で実機計測。26B-A4B で 1.83 倍、31B Dense で 3.52 倍の高速化を確認しました。31B + 1 GPU での独立ベンチマークは公開資料に見当たらず、本検証が最初の事例となります。Google 公式の『最大 3 倍』を実環境で再現可能と確認しました。
読む →