グラフや表、SVGなどの画像をコードやMarkdownに変換する「Vision-to-Code」タスクにおいて、強化学習(RL)を使う際の最大の課題が「報酬設計」です。上海人工知能研究所らのチームが提案した Visual-ERM(Visual Equivalence Reward Model)は、この問題を「視覚空間での ...
A Reinforcement Learning-based orchestrator for a multi-agent code generation system, enhanced with Retrieval-Augmented Generation (RAG) for improved code quality. The RL agent learns to optimally ...