simmediummanipulationmetric · varies

STEP: Warm-Started Visuomotor Policies with Spatiotemporal Consistency Prediction

Description

Diffusion policies have recently emerged as a powerful paradigm for visuomotor control in robotic manipulation due to their ability to model the distribution of action sequences and capture multimodality. However, iterative denoising leads to substantial inference latency, limiting control frequency in real-time closed-loop systems. Existing acceleration methods either reduce sampling steps, bypass diffusion through direct prediction, or reuse past actions, but often struggle to jointly preserve

Source

http://arxiv.org/abs/2602.08245v1