GitCC AI驱动开源 项目查询 开源项目分类 机器人 人工智能 大模型排行 企业应用 科学研究 孵化优质开源项目 GCC API 海外版AI Coding

字节-强化学习大模型-critic-rl

香港大学和字节发表论文:通过强化学习教授语言模型进行批判