dataset
weibo_robert_llm
ChenChiShui
or hover any field below to flag it
Overview
Name
weibo_robert_llm
Source
ChenChiShui
Episodes
0
Robot count
0
Format
other
Description
Weibo Robert LLM 基于 Qwen3-4B 和 CommentR Interaction Dataset 的微博评论机器人训练项目,通过多阶段训练(SFT → Reward Model → RL)学习生成符合人类偏好的高质量评论回复。
Robots used
null
Links
HuggingFace dataset
null