SHAOJIE'S BOOK

Posted 2026-07-03Updated 2026-07-03Artificial Intelligence23 minutes read (About 3458 words)

导言

模型训练建模不是先问“MFU 有多高”，而是先把模型结构、硬件账本、并行切分、调度路径和实测校准放到同一个估算器里。MFU 是其中最干净的计算口径：它把模型理论必需 FLOPs、设备峰值和实测步时连在一起；但显存能不能放下、通信会不会卡住、padding 是否浪费、EP/TP/SP 是否合适，必须另算。

Categories

Subscribe for updates

follow.it

Links

Recents

Archives

Tags