グラフや表、SVGなどの画像をコードやMarkdownに変換する「Vision-to-Code」タスクにおいて、強化学習(RL)を使う際の最大の課題が「報酬設計」です。上海人工知能研究所らのチームが提案した Visual-ERM(Visual Equivalence Reward Model)は、この問題を「視覚空間での ...