(出所:エヌビディア)今後より重要性の高まるAI(人工知能)推論の領域において、前回は前提となりつつある「プレフィル・デコード分離」の考え方について触れた。第4回は、プレフィル・デコード分離を前提に、AI推論専用半導体の開発競争をメモリーのアーキテクチャーから読み解く。メモリー設計によって、今後の推論市場の戦い方に大きな違いが出てくる。AIエージェントなどの推論用途が中心になると、AI半導体に求め ...
(出所:エヌビディア)第2回では、エージェンティック推論時代の重要指標を示した。競争力を高める代表的なアプローチが、AI(人工知能)推論処理の性質を踏まえてアクセラレーターの使い方を再設計する「プレフィル・デコード分離」である。本稿では、推論効率化の多様な手法の中から、チップ設計にも直接影響を与える本手法に焦点を当て、3つのパターンと主要プレーヤーの戦略の違いを整理する。AIエージェントなどの推論 ...