1、深入理解业务需求,利用SFT、RLVR、Agent RL等多种后训练技术,优化智能质检、智能运维等场景下信息抽取、意图分类、工具调用等多种模型的效果,提升业务效果天花板; 2、结合对大模型系统框架及模型能力边界的理解,设计...对业务场景的充分理解,寻找最佳解决方案。 职位要求: 1、具有优秀的编程基础,熟练使用Python/C++等至少一种编程语言; 2、熟悉NLP、CV、ML等相关的技术,深入理解大模型相关技术栈(如Reward Model、GRPO/PPO/DPO、SFT...