导言
论文中提及的数据训练,分数上涨和饱和的描述总结
导言
全模态大模型(Omnimodal Large Models, OLMs),以下简称Omni模型,有时也称之为“端到端多模态大模型”。 它主要解决的文本、图片、语音多模态理解与实时交互的协同问题(图片修改),最新的研究也会涉及统一推理和图像生成。
当前多模态设计中AR和DiT的组合关系,单独学习一下
导言
vllm专门为了多模态单独推出了推理框架vllm-omni,调研一下
导言
VeRL 作为RL领域趋势最火的开源仓,值得学习。
Pytorch 7 :Memory Optimization(Freeing GPU/NPU Memory Early)
导言
RL Algorithms: PPO-RLHF & GRPO-family
导言
[^1]
必看好文[^2]
Bridging the Gap: Challenges and Trends in Multimodal RL.
导言
快速调研多模态强化学习及其ai infra(verl类似)的下一步方向、技术点和与LLM RL的差异点:
导言
Pytorch 2.5 :Dataset & Dataloader
导言
Why Choose Quantitative Finance
导言
为什么之前认为金融只是调配资源,并不产生生产价值的我。也会想搞量化。