Posted 2025-12-10Updated 2025-12-13AI5 minutes read (About 781 words)

DiffSynth & ms-swift

导言

DiffSynth-Studio 是由魔搭社区（ModelScope, 阿里2022年11月开源的模型社区）算法工程师段忠杰主导开发的开源扩散模型引擎，致力于构建统一的 Diffusion 模型生态。该项目支持多种主流文生图/文生视频模型（如 Stable Diffusion、可图、CogVideoX），并兼容 ControlNet、LoRA、IP-Adapter 等生态模型，显著提升中文场景下的生成能力。[^1]

ms-swift[^3]是魔搭社区提供的大模型与多模态大模型微调部署框架，现已支持600+纯文本大模型与300+多模态大模型的训练（预训练、微调、人类对齐）、推理、评测、量化与部署。

其中大模型包括：Qwen3、Qwen3-Next、InternLM3、GLM4.5、Mistral、DeepSeek-R1、Llama4等模型，
多模态大模型包括：Qwen3-VL、Qwen3-Omni、Llava、InternVL3.5、MiniCPM-V-4、Ovis2.5、GLM4.5-V、DeepSeek-VL2等模型。

除此之外，ms-swift汇集了最新的训练技术，包括集成

Megatron并行技术，包括TP、PP、CP、EP等为训练提供加速，
以及众多GRPO算法族强化学习的算法，包括：GRPO、DAPO、GSPO、SAPO、CISPO、RLOO、Reinforce++等提升模型智能。
DPO、KTO、RM、CPO、SimPO、ORPO等偏好学习算法，
以及Embedding、Reranker、序列分类任务。

ms-swift提供了大模型训练全链路的支持，包括使用

vLLM、SGLang和LMDeploy对推理、评测、部署模块提供加速，
以及使用GPTQ、AWQ、BNB、FP8技术对大模型进行量化。

NPU支持

原生支持, 说实话感觉像transformer这种底层仓，只要是基于pytorch，而不是GPU独有的库(DeepEP这种)就都原生支持^2

参考文献

DiffSynth & ms-swift

http://icarus.shaojiemike.top/2025/12/10/Work/Artificial Intelligence/framework/DiffSynth/

Author

Shaojie Tan

Posted on

2025-12-10

Updated on

2025-12-13

Licensed under

#omni

Afdian.net Alipay

Buy me a coffee Patreon Wechat

DiffSynth & ms-swift

NPU支持

参考文献

Author

Posted on

Updated on

Licensed under

Like this article? Support the author with

Catalogue

Categories

Subscribe for updates

follow.it

Links

Recents

Archives

Tags