simmediumoffline-rlmetric · varies

MOORL: A Framework for Integrating Offline-Online Reinforcement Learning

Description

Sample efficiency and exploration remain critical challenges in Deep Reinforcement Learning (DRL), particularly in complex domains. Offline RL, which enables agents to learn optimal policies from static, pre-collected datasets, has emerged as a promising alternative. However, offline RL is constrained by issues such as out-of-distribution (OOD) actions that limit policy performance and generalization. To overcome these limitations, we propose Meta Offline-Online Reinforcement Learning (MOORL), a

Source

http://arxiv.org/abs/2506.09574v2