グラフや表、SVGなどの画像をコードやMarkdownに変換する「Vision-to-Code」タスクにおいて、強化学習(RL)を使う際の最大の課題が「報酬設計」です。上海人工知能研究所らのチームが提案した Visual-ERM(Visual Equivalence Reward Model)は、この問題を「視覚空間での ...
A Reinforcement Learning-based orchestrator for a multi-agent code generation system, enhanced with Retrieval-Augmented Generation (RAG) for improved code quality. The RL agent learns to optimally ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する