Posted 2026-01-27Updated 2026-01-27Artificial Intelligence32 minutes read (About 4728 words)AI Post Traning: DanceGRPO 导言 DanceGRPO是25年5月发表的论文,把GRPO的方法引入到了生成领域。(类似的有flowGRPO)。字节客户基于此魔改,故学习。 Read more