dataset

weibo_robert_llm

ChenChiShui

or hover any field below to flag it

Overview

Name
weibo_robert_llm
Source
ChenChiShui
Episodes
0
Robot count
0
Format
other
Description
Weibo Robert LLM 基于 Qwen3-4B 和 CommentR Interaction Dataset 的微博评论机器人训练项目,通过多阶段训练(SFT → Reward Model → RL)学习生成符合人类偏好的高质量评论回复。
Robots used
null

Links

HuggingFace dataset
null