睡前刷手机两小时起步

03-24 08:50 门头沟学院人工智能

关注

腾讯大模型算法面试分享

发一下问题给大家参考，攒攒人品！
1.实习拷打
2.项目拷打
3.在模型选择方面我已经了解了。总体来说，这是一个纯文本任务。虽然有图表参与其中，但你的整体评估体系是“规则打分 + 模型打分”混在一起用的进行混合评估的，也就是打分加加权。最终得分的这个逻辑吗？还是说是一个准确率的一个逻辑
4.那接下来我觉得是你们这边来进行评测的，主要是通过一些固定规则，或者说通过RUBASE，或者是code coding的评分器吧，它是一个没有大模型参与打分的机制，可以这么理解吧，它是一个固定的评测器。那我这边的还有一个问题，对，然后你这边是说你在收集云和千问的SSD以及DPo数据。o那么您能否介绍一下，您是如何分别通过千问来处理SFT和DPO数据的
5.你提到是规则和模型混合评估，那具体每一部分是怎么分工的？哪些是规则，哪些是模型？
6.收集 Claude 和 Qwen 的 SFT 和 DPO 数据，具体是怎么构造这些数据的
7.在大量模型生成数据中，如何筛选出用于训练的数据？
8.SFT 和 DPO 数据在构造过程中，分别的筛选标准是什么？

全部评论

推荐最新楼层

上海交通大学算法工程师

强烈推荐！这个笔记写得很清晰 http://github.com/AccumulateMore/CV

1 回复分享

发布于昨天 09:24 广东

03-20 12:29

北京算能科技有限公司_算法实习生(实习员工)

这也要踩测试一脚

985柜员：开发还敢还叫，全部让自测就老实了

点赞评论收藏

分享

03-24 13:31

Stanford University 算法工程师

阿里达摩院发布CPU玄铁C950，AI 算力自主可控再突破

2026 年 3 月 24 日，数码科技圈迎来重磅国产利好消息，阿里达摩院主办的 2026 玄铁 RISC-V 生态大会正式召开，会上发布了面向 AI 智能体的新一代玄铁 RISC-V 芯片，直接瞄准 AI 算力核心需求，降低高性能算力成本，强化国产芯片自主可控，消息瞬间登上微博科技热搜、微信公众号头条，业内人士纷纷评价：国产芯片终于迎来主流算力赛道的突破口。一直以来，芯片领域都是我国科技行业的短板，尤其是高端算力芯片，长期被海外架构垄断，不管是手机芯片、电脑芯片还是服务器芯片，都面临着技术卡脖子的风险。RISC-V 作为开源精简指令集架构，凭借开源、低功耗、灵活可定制的优势，成为国产芯片突破...

点赞评论收藏

分享

03-24 10:25

门头沟学院人工智能

百度文策大模型二面面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你的知识库数据是如何清洗和构造的？如果数据质量参差不齐会对 RAG 系统产生哪些影响？3.文档切分策略是如何设计的？chunk size 和 overlap 会如何影响召回质量和生成效果？4.如果用户的问题在知识库中确实存在，但系统经常没有召回正确文档，你会如何排查？5.如果检索到的文档是正确的，但模型最终生成的答案仍然是错误的，你会如何定位问题？6.实际系统中，如果召回结果经常语义相似但事实不相关，你会如何优化检索模块？7.如果一个问题需要跨多个文档的信息才能回答，你的 RAG 系统如何处理这种情况？8.在 RAG 系统中如何判断问题出在检索模块还是生成模块？9.请详细说明 Transformer 从输入 token 到输出 logits 的完整计算流程。10.FFN 层为什么采用“先升维再降维”的结构，这种设计对模型表达能力有什么作用？11.MHA、MQA、GQA 在推理阶段的 KV Cache 占用和计算效率上有什么差异？12.为什么推理阶段 KV Cache 只缓存 K 和 V，而不缓存 Q？13.RoPE 的核心原理是什么，它在长上下文场景下会遇到什么问题？14.instruction tuning 中多轮对话数据训练时，loss mask 应该如何设计？15.如果 SFT 之后模型在特定任务上能力增强，但通用能力明显下降，你会如何解决？16.LoRA 的低秩分解为什么能够逼近全参数微调的效果？17.如果 LoRA 的 rank 设置不合理，在模型表现上会出现什么现象？18.DPO 训练后模型输出明显变长，在实际系统中你会如何处理？19.如果对齐之后模型变得过于保守，经常拒绝回答，你会如何调整训练策略？20.大模型出现复读机现象通常由哪些因素导致？

点赞评论收藏

分享

昨天 17:49

新疆大学 Java

为什么 AI 模型接口调用，必须使用“独立线程池”？

在开发大模型（LLM）相关应用时，我们经常会遇到一个棘手的问题：随着流量的增加，原本响应迅速的 Web 服务，突然变得极其缓慢，甚至出现大面积的 502/504 超时。 很多开发者第一时间会去检查 Redis、数据库或模型推理接口，却忽略了一个架构上的隐患：你是否将 AI 接口调用直接塞进了公共的业务线程池中？ 一、 致命的“资源枯竭”：一个真实的事故现场 假设你正在使用 Spring Boot (Tomcat) 开发一个 AI 聊天机器人。你的系统接收请求并执行以下两步：  业务操作：查询用户配置（耗时 10ms）。 AI 调用：请求 GPT-4 API（耗时 5s）。  Tomcat 默认...

点赞评论收藏

分享

03-19 16:59

腾讯_wxg_前端开发(实习员工)

游历小半年，终重回广东(wxg)

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

阿里笔试考AI

热聊中

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

10173次浏览 150人参与

# 第一份工作应该只看薪资吗 #

252293次浏览 1916人参与

# 米连集团26产品管培生项目 #

10700次浏览 267人参与

# 春招至今，你的战绩如何？ #

32696次浏览 295人参与

# 什么专业适合考公 #

57186次浏览 290人参与

# 长得好看会提高面试通过率吗？ #

14867次浏览 152人参与

# AI面会问哪些问题？ #

6092次浏览 170人参与

# 蚂蚁求职进展汇总 #

157030次浏览 1253人参与

# 找实习记录 #

241206次浏览 1471人参与

# 春招你拿到offer了吗 #

814739次浏览 9891人参与

# 哪些公司校招卡第一学历 #

251030次浏览 861人参与

# 你做过最难的笔试是哪家公司 #

8565次浏览 69人参与

# 从事AI岗需要掌握哪些技术栈？ #

2308次浏览 64人参与

# 找AI工作可以去哪些公司？ #

2055次浏览 40人参与

# HR最不可信的一句话是__ #

2956次浏览 61人参与

# 一张图晒出你司的标语 #

1788次浏览 27人参与

# 沪漂/北漂你觉得哪个更苦？ #

5042次浏览 90人参与

# 毕业论文怎么查AI率 #

79678次浏览 1959人参与

# AI时代，哪个岗位还有“活路” #

5881次浏览 148人参与

# 简历第一个项目做什么 #

34468次浏览 548人参与

# 通信和硬件还有转码的必要吗 #

99054次浏览 633人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务