网络社牛现实社恐分裂症

03-11 10:35 门头沟学院人工智能

关注

阿里淘天大模型校招一面 1h

给我面没招了，感觉自己好菜、面试很难，还是要多多练习，感觉自己说不明白业务逻辑

1.在 Agent 多轮对话任务中，你觉得 Attention 的局限性体现在哪些方面？

2.简要介绍一下 SFT 的核心流程以及数据集的构建策略。

3.SFT 之后常见的 Post-Training 还有哪些？它们之间的目的有何区别？

4.什么是 RAG？它是怎么提升生成质量的？

5.与传统的检索 + 模型生成的流程有什么不同？

6.如何评估一个 RAG 系统是否有效？

7.PPO 和 DPO 在大模型对齐中的主要区别是什么？

8.DPO 训练通常有哪些注意事项？

9.项目里的 Modular Agent，你能讲讲它是如何实现多步规划的吗？

10.项目提到了多个工具调用链路，调度策略是如何设计的？

11.是否设计过异常 fallback 策略？

12.Agent 的评估体系通常包括哪些维度？

13.项目中微调 Qwen 时，选择的训练阶段是如何确定的？

14.Prompt 自动推荐模块用了哪些优化策略？

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

问了这么多东西啊

点赞回复分享

发布于 03-12 22:15 北京

03-13 11:12

吉林农业大学算法工程师

上海极豆科技有限公司 AI-Agent 一面

1、简单讲一下，MCP 是什么？它和 function call 有什么区别？MCP，一般指 Model Context Protocol，本质上可以把它理解成一种让大模型和外部工具、外部数据源、外部能力进行标准化连接的协议。它不是单纯某一个函数调用接口，而是想解决“大模型怎么以统一方式发现工具、读取资源、调用能力、获取上下文”这个问题。如果只说直白一点，MCP 更像是给大模型接外部世界时定义了一套“通用插口”。比如一个 Agent 想访问数据库、文件系统、知识库、内部服务，如果每接一个系统都单独写一套协议，维护成本会很高。MCP 的思路就是把这些能力抽象成统一的协议层，让模型或 Agent ...

AI-Agent面试实战...

点赞评论收藏

分享

03-13 01:35

门头沟学院推荐算法

字节大模型Agent算法实习被拷打

被横向挂了，希望发出来对大家有帮助！1. 请介绍 Transformer 的结构组成及各部分作用2. 如何降低 Transformer 的计算复杂度？常见的稀疏注意力变体有哪些？3. LoRA 微调的原理是什么？秩 r 的选择会对模型表现产生什么影响？4. KV Cache 是什么？为什么能极大地提升推理速度？5. RAG 完整流程，构建向量检索库时如何处理时间衰减对召回的影响？6. 微调时的训练数据是怎么构建的？如何保证样本多样性和质量？7. 在 RAG+知识图谱的 Agent 系统中，知识图谱更新的机制是怎样的？如何保证实时性？8. 训练 LoRA 模型时，你是如何选择冻结层的？依据是什么？9. 在高并发查询 Agent 系统中，你会如何优化召回和生成阶段的延迟？10. 大规模 Agent 系统在多线程/多进程场景下的资源调度策略如何设计？11. 如果在 GPU 资源有限的条件下同时提供推理和微调服务，如何做资源分配和任务调度以保证时延和吞吐？代码题12. LeetCode 15 三数之和

查看12道真题和解析

点赞评论收藏

分享

03-14 09:54

吉林农业大学算法工程师

科大讯飞 AI Agent开发一面

1、自我介绍2、实习介绍, 遇到过什么困难,有什么提升3、如果现在就是开发的话，一般用什么 IDEPython 开发我一般用 PyCharm 或者 VS Code。如果项目偏工程化、代码量比较大、需要比较强的调试和项目管理能力，我更倾向用 PyCharm，因为它对 Python 项目结构、虚拟环境、断点调试、调用链查看支持比较完整。如果项目需要同时处理前后端、脚本、配置和容器文件，我会用 VS Code，因为插件生态更灵活，远程开发也比较方便。如果涉及服务部署和 Linux 环境排查，我也会结合终端、vim、tmux 一起用。4、项目介绍5、上线后出现 bug，一般怎么处理线上出现 bug 时...

AI-Agent面试实战...

点赞评论收藏

分享

03-09 22:29

已编辑

四平职业大学研发工程师

秋招的尾巴是字节跳动

秋招没有大满败，最终收到节子的offer。

大好人诶：举报了

点赞评论收藏

分享

今天 09:48

吉林农业大学算法工程师

顺丰大模型开发一面

1、LoRA 微调的原理LoRA 的核心思想是不直接更新预训练模型里的原始大权重，而是在某些线性层旁边增加一个低秩更新分支，用低秩矩阵去近似权重增量。假设原始权重是 W∈Rd×k，全量微调时直接学习ΔW，LoRA 则把它写成：ΔW=BA其中A∈Rr×k，B∈Rd×r ,，(r) 是远小于 (d) 和 (k) 的秩。这样前向计算就变成：h=Wx+ΔWx=Wx+BAx实际里通常还会加缩放项：这样做的本质是认为很多下游任务对大模型权重的更新其实存在低秩结构，不需要真的去学习一个完整的大矩阵。LoRA 的优点是可训练参数少、显存占用低、训练快，而且原模型参数冻结，方便多任务切换和权重管理。2、LoRA...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

4

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我的实习日记 #

3693356次浏览 31902人参与

# 你认为小厂实习有用吗？ #

126154次浏览 692人参与

# 你收到了哪些公司的笔试？ #

2347次浏览 12人参与

# 滴滴笔试 #

37165次浏览 212人参与

# 你现在的工作，是“成长”还是“消耗”？ #

1697次浏览 46人参与

# 在国企工作的人，躺平了吗？ #

405292次浏览 3969人参与

# 实习进度记录 #

1217054次浏览 11827人参与

# 你上一次加班是什么时候？ #

139395次浏览 778人参与

# 金三银四，你的春招进行到哪个阶段了？ #

19271次浏览 263人参与

# 字节跳动笔试 #

79395次浏览 367人参与

# 小米编程考试 #

32759次浏览 156人参与

# 2025，我想...... #

91935次浏览 675人参与

# 秋招报数：你投了多少家公司？ #

157326次浏览 960人参与

# 金融银行面经 #

101390次浏览 551人参与

# 美团笔试 #

707229次浏览 4687人参与

# AI岗位暴涨12倍，你会转AI赛道吗？ #

7267次浏览 142人参与

# 你听到的“最没用”的秋招建议 #

53978次浏览 326人参与

# 职场上哪些行为很加分？ #

338436次浏览 3759人参与

# 拼多多集团-PDD笔试 #

11615次浏览 139人参与

# 27届实习投递记录 #

1465次浏览 29人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务