simmediumrlmetric · varies

Contextual Latent World Models for Offline Meta Reinforcement Learning

Description

Offline meta-reinforcement learning seeks to learn policies that generalize across related tasks from fixed datasets. Context-based methods infer a task representation from transition histories, but learning effective task representations without supervision remains a challenge. In parallel, latent world models have demonstrated strong self-supervised representation learning through temporal consistency. We introduce contextual latent world models, which condition latent world models on inferred

Source

http://arxiv.org/abs/2603.02935v1