simmediumnavigationmetric · varies

Probing Prompt Design for Socially Compliant Robot Navigation with Vision Language Models

Description

Language models are increasingly used for social robot navigation, yet existing benchmarks largely overlook principled prompt design for socially compliant behavior. This limitation is particularly relevant in practice, as many systems rely on small vision language models (VLMs) for efficiency. Compared to large language models, small VLMs exhibit weaker decision-making capabilities, making effective prompt design critical for accurate navigation. Inspired by cognitive theories of human learning

Source

http://arxiv.org/abs/2601.14622v1