simmediumnavigationmetric · varies

STRIDER: Navigation via Instruction-Aligned Structural Decision Space Optimization

Description

The Zero-shot Vision-and-Language Navigation in Continuous Environments (VLN-CE) task requires agents to navigate previously unseen 3D environments using natural language instructions, without any scene-specific training. A critical challenge in this setting lies in ensuring agents' actions align with both spatial structure and task intent over long-horizon execution. Existing methods often fail to achieve robust navigation due to a lack of structured decision-making and insufficient integration

Source

http://arxiv.org/abs/2511.00033v1