Business Trip: 2601-2602 verl + DanceGRPO
Business Trip: 2601-2602 verl + DanceGRPO
导言
ZJ内部出差,从0到1完成verl + MindSpeed MM + DanceGRPO算法的 t2v RL,达成reward快速持续上升。
My Digital Worker : New Coding Way
导言
AI浪潮下,一开始是代码补全,之后是Vibe Coding,现在是Agent(规范驱动开发(Spec-driven Development)),后续趋势是Agent Team/Swarm。作为一个程序员,应当以什么姿势拥抱AI时代的代码编程,是需要持续关注的问题。
导言
导言
Agent 概念与 OpenClaw 的爆火,本质上反映了人们对个人数字员工(Digital Worker)能力的期待:它不只是一个对话式 AI,而是一个可以在真实工作流中长期运行、承担任务、放大个人生产力的“虚拟员工”。
我真正关心的问题是:如何为自己的具体工作场景配置合适的数字员工,使其在时间与认知两个维度上对个人效率形成倍增效应。
Pytorch 7 :Memory Optimization(Freeing GPU/NPU Memory Early)
导言
导言
learning rate、clip_norm、梯度累计、micro bs 这些通用超参,应该如何调整。
Pytorch 2.5 :Dataset & Dataloader
导言
导言
作为一个AI初学者,总是遇到以下场景:
设计期望:
大致思路:
chrome://tracing格式,来设计类似PyPrinter的工具。VizTracer代替。导言
Practice is the best teacher in learning.