simmediumoffline-rlmetric · varies

LPO: Towards Accurate GUI Agent Interaction via Location Preference Optimization

Description

The advent of autonomous agents is transforming interactions with Graphical User Interfaces (GUIs) by employing natural language as a powerful intermediary. Despite the predominance of Supervised Fine-Tuning (SFT) methods in current GUI agents for achieving spatial localization, these methods face substantial challenges due to their limited capacity to accurately perceive positional data. Existing strategies, such as reinforcement learning, often fail to assess positional accuracy effectively, t

Source

http://arxiv.org/abs/2506.09373v2