高德强化学习实习一面分享

发一下问题给大家参考,攒攒人品!有面试过同岗的朋友欢迎评论区交流
1. 深挖实习内容
2. 场景题:给你一个通用的大模型,如何让他具备agent能力。
3. 场景题:挖掘高德场景下的agent应用,从数据到训练,设计整个流程。
4. 对比介绍ppo、grpo。
5. PPO loss函数口述、以及clip的作用,如果不clip公式是否成立
6. 深挖对 DAPO 的理解
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 03-28 07:34 广东
考虑我司么 可以见我主页
点赞 回复 分享
发布于 03-28 20:56 上海

相关推荐

岗位职责 1. 统招本科及以上学历在校生,要求2028届;2. 拥有但不限于计算机、信息工程、模式识别、人工智能、自动化、软件工程、数学等相关专业学习背景,熟悉常用机器学习算法,尤其在大模型及相关领域有一定基础;3. 至少熟悉Java、C/C++、python中的一门语言,有较强的编程能力,了解常用机器学习/深度学习框架,如:TensorFlow、Pytorch、Caffe等;4. 拥有良好的逻辑思维能力,良好的沟通能力、团队合作精神和学习能力,充满技术热情与理想;5. 符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。岗位要求京东零售广告部门 大模型推荐算法工程师岗位职责1. 统招本科及以上学历在校生,要求2028届;2. 拥有但不限于计算机、信息工程、模式识别、人工智能、自动化、软件工程、数学等相关专业学习背景,熟悉常用机器学习算法,尤其在大模型及相关领域有一定基础;3. 至少熟悉Java、C/C++、python中的一门语言,有较强的编程能力,了解常用机器学习/深度学习框架,如:TensorFlow、Pytorch、Caffe等;4. 拥有良好的逻辑思维能力,良好的沟通能力、团队合作精神和学习能力,充满技术热情与理想;5. 符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。岗位要求1. 与各业务、产品、工程团队配合,在京东亿量级的数据与丰富的广告业务应用场景中不断进行深入的算法研究和模型构建,提升广告核心业务指标;2. 对京东已有的算法和模型进行不断的优化及创新,不断丰富算法库内容,结合未来应用场景,为京东多元技术领域和业务提供全面的支持与解决方案;3. 与京东的技术团队及科学家们一同参与人工智能、机器学习、LLM算法及应用的研究、实现、落地。包括不限于用户兴趣建模,用户意图推理,商品关系建模,提升推荐的准确性和多样性。岗位属京东零售核心营收岗位,有大模型和强化学习经验及发表CCF-A论文者优先,训练资源和工业数据充足,欢迎各位来投!实习工资每天500元,要求实习至少6个月以上,住宿补贴:有1500元/月 房补或京东人才公寓住宿。
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
正在热议
更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务