株式会社LegalOn Technologies(本社:東京都渋谷区代表取締役 執行役員・CEO:角田望、以下LegalOn Technologies)は、日本の企業法務実務における大規模言語モデル(LLM)の性能を評価するベンチマークデータセット「Legal Rikai: Open Benchmark」を公開しました。「Legal ...
~主要LLMであるGPT-5、Gemini-2.5-pro、Claude Opus 4.1の分析結果も発表。抽象的な指示への対応力でモデル間に大きな差を検出~ 株式会社LegalOn Technologies(本社:東京都渋谷区代表取締役 執行役員・CEO:角田望、以下LegalOn Technologies)は、日本の企業法務実務における大規模言語モデル(LLM)の性能を評価するベンチマークデー ...
AIスタートアップのRecursive、RAG技術の評価向けに、オープンソース型のベンチマーク用ツールを公開 〜「Flow Benchmark Tools」でRAGの評価基準を標準化、多様多種な業界におけるRAGの効果的な導入を促進〜 Recursiveは、日本語の性能に焦点を当て、あらゆるRAG ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する