蚂蚁消费金融-模型基准和评测工程师
毕业时间:2026-11-01~2027-10-31
工作地点:北京,上海,杭州,重庆,成都
职位描述:
1. 评测基准与数据建设:参与构建覆盖多模态、推理、RAG、代码等场景的评测基准,并负责相关评测数据集的策划、构建与质量校验。
2. 自动化评测流程:设计并维护包括准确性、效率、成本在内的评测指标体系,搭建支持持续集成的自动化评测流程。
3. 评测平台与工具研发:参与评测工具与平台的开发,并探索利用AI智能体(Agent)等技术提升数据生产和评测的自动化效率。
4. 性能优化与前沿探索:结合评测任务特点,优化大模型推理框架(如Sglang),提升评测效率;同时跟踪业界前沿评测方法,并应用于实践。
职位要求:
1. 计算机、人工智能、自动化等相关专业;
2. 动手和编程能力优异,精通Python,深入理解机器学习算法与数据结构,熟悉LLM核心算法;
3. 具有良好的学习和沟通能力,有好奇心和责任心,具有钻研精神和团队协作能力;
4. 具有大模型评测、语言大模型、多模态大模型、自然语言处理、AIGC等相关经验优先;
5. 了解主流的大模型评测榜单、评测框架和评测方法优先。
简历投递:nicky.ly@antgroup.com
工作地点:北京,上海,杭州,重庆,成都
职位描述:
1. 评测基准与数据建设:参与构建覆盖多模态、推理、RAG、代码等场景的评测基准,并负责相关评测数据集的策划、构建与质量校验。
2. 自动化评测流程:设计并维护包括准确性、效率、成本在内的评测指标体系,搭建支持持续集成的自动化评测流程。
3. 评测平台与工具研发:参与评测工具与平台的开发,并探索利用AI智能体(Agent)等技术提升数据生产和评测的自动化效率。
4. 性能优化与前沿探索:结合评测任务特点,优化大模型推理框架(如Sglang),提升评测效率;同时跟踪业界前沿评测方法,并应用于实践。
职位要求:
1. 计算机、人工智能、自动化等相关专业;
2. 动手和编程能力优异,精通Python,深入理解机器学习算法与数据结构,熟悉LLM核心算法;
3. 具有良好的学习和沟通能力,有好奇心和责任心,具有钻研精神和团队协作能力;
4. 具有大模型评测、语言大模型、多模态大模型、自然语言处理、AIGC等相关经验优先;
5. 了解主流的大模型评测榜单、评测框架和评测方法优先。
简历投递:nicky.ly@antgroup.com
全部评论
相关推荐
点赞 评论 收藏
分享
查看6道真题和解析