Anthropicが10月に Claude の「Computer Use」機能をリリースして以来、AI エージェントが人間の操作を模倣できる能力について大きな期待が寄せられている。シンガポール国立大学の Show Labによる新しい研究では、現世代の GUI エージェントに何が期待できるかの ...
2025年10月7日、Googleがウェブブラウザの操作に特化したAIエージェント「Gemini 2.5 Computer Use」を発表しました。Gemini 2.5 Computer Useはフォームへの入力、ドロップダウンやフィルターなどのインタラクティブな要素の操作、そしてログインの背後での操作を ...
米Anthropicは10月22日(現地時間)、6月にリリースした「Claude 3.5 Sonnet」を更新し、「Computer Use」という新機能をβ版として追加したと発表した。 この機能により、ClaudeはPCの画面を“見て”、カーソルを移動したり、ボタンをクリックしたり、テキストを入力 ...
Computer useは、ClaudeがPCの画面を確認しながら、カーソルを動かし、ボタンをクリックし、テキストを入力するなど、人と同じ方法でClaude (AI)にコンピューターを使用させるもの。 パブリックベータとして22日からAPIで提供される。
Anthropicは2024年10月23日、同社の生成AIモデルClaude 3. 5 Sonnetのアップグレードと、高速なAIモデルの新バージョンとなるClaude 3. 5 Haikuのリリースを発表した。 Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3. 5 Haiku /AnthropicDeveloping ...
Googleは2025年10月7日、UI操作に最適化された新しいモデル 「Gemini 2. 5 Computer Use」 を公開プレビューで提供開始した。 これまでのAIモデルはソフトウェアと構造化APIを介して連携してソフトウェアを操作できるが、多くのデジタルタスクではフォームへの入力 ...
米OpenAIが新モデル「GPT-5.4」を発表した。実務タスクへの最適化を掲げ、推論やコーディング、ツール連携を一体的に強化。コンピュータ操作機能もネイティブ統合され、デスクトップ操作能力を測るベンチマーク「OSWorld-Verified」では人 ...
Google DeepMindは米国時間10月7日、人間のようにウェブブラウザーを操作できる新しいAIモデルを一般公開プレビューとして発表した。 このモデルは「Gemini 2.5 Pro」を基盤に構築されており、「Computer Use」と呼ばれる新機能を通じて、ウェブページ上でクリック ...
Microsoft has announced a feature called ' computer use ' that allows AI agents to click buttons, select menus, and type text into input fields on websites and apps. Copilot Studio, a tool for ...
米Microsoftは10月31日(現地時間)、「Researcher with Computer Use」を発表した。まずはMicrosoftの最新AI機能を先行体験できる「Frontier」プログラムへ参加している「Microsoft 365 Copilot」ユーザーに提供される。 「Researcher」は、専門家のような徹底した調査を行って ...