Multimodel RL

导言

粗浅调研多模态强化学习及其ai infra(verl类似)的下一步方向、技术点和与LLM RL的差异点

Read more