simmediumroboticsmetric · varies

Shifting Uncertainty to Critical Moments: Towards Reliable Uncertainty Quantification for VLA Model

Description

Vision-Language-Action (VLA) models enable general-purpose robotic policies by mapping visual observations and language instructions to low-level actions, but they often lack reliable introspection. A common practice is to compute a token-level uncertainty signal and take its mean over a rollout. However, mean aggregation can dilute short-lived but safety-critical uncertainty spikes in continuous control. In particular, successful rollouts may contain localized high-entropy segments due to benig

Source

http://arxiv.org/abs/2603.18342v1