「大きいモデルほど賢いが、遅い」──そう信じて使ってきた。でも2026年5月、GoogleがGemma 4の推論速度を最大3倍に引き上げたというニュースが流れた瞬間、その前提が崩れた。 なぜ、大きなモデルが「速く」なれるのか。AIエンジニアの間でいま最も熱く ...