Posted 2026-05-19Updated 2026-07-03Artificial Intelligence15 minutes read (About 2269 words)VeRL Performance Optimization 导言 MFU / SMA 低不一定说明 kernel 慢,也可能是 rollout、reward、checkpoint、通信、异步队列或 token 分布造成的等待。性能优化的第一步不是开特性,而是建立 E2E 性能模型。 Read more
导言 MFU / SMA 低不一定说明 kernel 慢,也可能是 rollout、reward、checkpoint、通信、异步队列或 token 分布造成的等待。性能优化的第一步不是开特性,而是建立 E2E 性能模型。
2027-03-15Building Large-Scale AI Systems on Ascend: Training, Inference, and Multimodal OptimizationOverview