AIコードエディターのCursorが、コーディングエージェントを自律的に稼働させ、ウェブブラウザを構築するという実験を行ないました。 長時間稼働する自律型コーディングをスケールさせる · Cursor 既存のエージェントは狭い範囲のタスクは上手く処理でき ...
近年はソフトウェア開発にコーディングAIを使用する開発者が一般的になっており、コーディングAIの性能を測るさまざまなベンチマークが存在します。そんなコーディングAI向けベンチマークの欠点を改善したという新たなベンチマーク「DeepSWE」が登場し ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する