Posted 2026-05-19Updated 2026-07-03Artificial Intelligence4 minutes read (About 648 words)VeRL Checkpoint 导言 RL checkpoint 比普通 SFT checkpoint 更复杂,因为它不仅要保存模型参数,还要保存 optimizer、scheduler、global step、采样状态,以及在异步模式下可能存在的队列和策略版本状态。 Read more
导言 RL checkpoint 比普通 SFT checkpoint 更复杂,因为它不仅要保存模型参数,还要保存 optimizer、scheduler、global step、采样状态,以及在异步模式下可能存在的队列和策略版本状态。
2027-03-15Building Large-Scale AI Systems on Ascend: Training, Inference, and Multimodal OptimizationOverview