18カ月前、AIエージェントは実世界のコンピュータタスクの88%で失敗していた。 2026年3月時点では、最高性能のモデルがそれらのタスクを66%の確率で完了し、人間の性能との差はわずか6ポイントにまで縮まった。 スタンフォード大学の「2026 ...
米Anthropicは10月22日(現地時間)、大規模言語モデル「Claude 3.5 Sonnet」のアップグレードと、新モデル「Claude 3.5 Haiku」を発表した。Claude 3.5 Sonnetは全面的に改良され、特にコーディング分野で大きな進歩を遂げている。Claude 3.5 Haikuは、前世代のHaikuと同じ ...
情報検索・抽出などのオンラインタスク、さらにはエクセルへのデータ入力などパソコン操作タスクを自動化できる未来が生成AIの進化によって現実となりつつある。 直近の動きとしてまず注目されるのは、マイクロソフトのAIアシスタント「Copilot」への新 ...