京东搜索推荐算法一面-日常实习

1.PPO、GRPO、DPO 的损失函数
2.给你看 DPO的公式,从数学关系上推一下刚开始的 loss 是多少-这里是In2
3.这里为什么使用 RL,而不是用 RAG去幻觉-RAG 针对于知识缺失去幻觉,RL针对的是行为推理层面去幻觉
4.奖励函数是如何设计的
5.如果一个句子中确定性的词汇比较多,这样导致会不会导致整体句子的熵比较低,如何解决
6.GNN里边你觉得最重要的知识点是什么
7.手撕:合并 K个升序链表
全部评论
如果一个句子中确定性的词汇比较多,这样导致会不会导致整体句子的熵比较低,如何解决咋回答的
点赞 回复 分享
发布于 01-22 20:24 云南

相关推荐

03-18 13:48
淘天集团_开发
该岗位适合希望从事以下工作的候选人投递:● 希望从事AI应用构建与模型优化工作的候选人● 希望从事AI应用数据构建与自动化评测工作的候选人● 希望从事多模态AI应用构建与算法优化工作的候选人围绕真实业务核心场景,参与AI应用的系统化构建与优化,把AI变为业务增长引擎,具体职责包括以下相关方向的一项或多项:1、AI应用全生命周期演进:深度参与业务问题建模、应用架构设计、上下文工程、训练数据构建、自动化评估体系、模型后训练优化等;2、数据飞轮构建:打造高质量数据生产链路,探索合成数据(Synthetic Data)与高效蒸馏技术方案,跑通“业务-模型-反馈”迭代闭环;3、评测体系构建:面向业务目标,设计完备的AI应用效果评估体系,构建自动化评估框架,建立离线评估与在线业务指标联动的量化评估能力;4、强化学习与奖励机制设计:构建可工程化的Reward体系与RL训练环境,提升模型在垂直业务场景中的可控性与泛化能力;5、AI外部能力体系搭建:实现AI应用所需的知识库(RAG)、长短期记忆系统(Memory)、工具调用、多Agent协作框架等;6、多模态AI应用开发:构建AI应用的多模态感知与推理能力,解决在UI自动化、视觉理解与审核、多模态会话等场景的落地应用问题。可转正,有问题可私聊
点赞 评论 收藏
分享
评论
2
6
分享

创作者周榜

更多
正在热议
更多
# AI面会问哪些问题? #
24396次浏览 478人参与
# 中国电信笔试 #
30969次浏览 283人参与
# 开放七大实习专项,百度暑期实习值得冲吗 #
14020次浏览 209人参与
# 你的实习产出是真实的还是包装的? #
18542次浏览 329人参与
# 如果秋招能重来,我会____ #
96464次浏览 499人参与
# 春招至今,你的战绩如何? #
59336次浏览 535人参与
# 米连集团26产品管培生项目 #
12914次浏览 285人参与
# i人适合做什么工作 #
36662次浏览 123人参与
# 我是面试官,请用一句话让我破防 #
79296次浏览 219人参与
# 哪些公司真双非友好? #
69143次浏览 287人参与
# 找AI工作可以去哪些公司? #
7515次浏览 177人参与
# 从事AI岗需要掌握哪些技术栈? #
7501次浏览 236人参与
# 五一之后,实习真的很难找吗? #
102791次浏览 584人参与
# 投递几十家公司,到现在0offer,大家都一样吗 #
339750次浏览 2163人参与
# 你做过最难的笔试是哪家公司 #
29614次浏览 179人参与
# 你小时候最想从事什么职业 #
159827次浏览 2072人参与
# 阿里笔试 #
176066次浏览 1300人参与
# 金三银四,你的春招进行到哪个阶段了? #
21445次浏览 274人参与
# 一张图晒出你司的标语 #
3781次浏览 71人参与
# 面试被问期望薪资时该如何回答 #
382436次浏览 2163人参与
# 晶盛机电求职进展汇总 #
35211次浏览 318人参与
# 应届生第一份工资要多少合适 #
20455次浏览 84人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务