阿里大模型算法校招面经 攒人品版

攒人品中,祝大家都能拿到满意的Offer!
1.Transformer中Attention的本质是什么?你能从数学角度简要解释一下吗?
2.在Agent多轮对话任务中,你觉得Attention的局限性体现在哪些方面?
3.简要介绍一下SFT的核心流程,以及数据集的构建策略,SFT之后常见的Post-Training还有哪些?它们之间的目的有何区别?
4.什么是RAG,它是怎么提升生成质量的?与传统检索+模型生成的流程有何不同?如何评估一个RAG系统是否work的?
5.PPO和DPO在大模型对齐中的主要区别是什么?DPO训练通常有哪些注意事项?用过GRPO么?
6.项目里的Modular Agent,你能讲讲它是如何实现多步规划的吗?
7.项目提到了多个工具调用链路,调度策略是如何设计的?是否有异常fallback策略?
8.Agent评估体系包括哪些维度?如何衡量planning能力 vs hallucination rate?
9.项目里微调Qwen,选择的训练阶段和Loss函数是如何决定的?
10.Prompt自动推荐模块用了哪些优化策略?有没有尝试过Prompt压缩或embedding表示的方式?
11.场景题:假如一个Agent 推理链路包含3个工具+高频请求,系统整体延迟较高,你会如何优化?
12.代码:岛屿数量
全部评论

相关推荐

点赞 评论 收藏
分享
给我面没招了,感觉自己好菜、面试很难,还是要多多练习1.为什么在 RAG 流程中引入父子索引(Parent-Document Retrieval)?2.为什么引入 BM25?向量检索和 BM25 的融合比例是怎样的?3.检索融合的具体流程是什么?召回后有没有做 Rerank?4.Rerank 后返回几个块(Chunk)?有没有针对这个返回数量做过验证?5.Rerank 后的 TopK 截断是怎么做的?为什么是这个值?有没有其他截断方案?6.讲一下上下文工程(Context Engineering),Agent 的记忆(Memory)是怎么做的?7.请详细讲解分布式令牌桶限流的实现。8.漏桶算法(Leaky Bucket)的原理讲一下。9。滑动窗口算法限流讲一下。如果用代码实现,滑动窗口的结构体会包含哪些字段?10.滑动窗口和令牌桶相比有什么缺点?11.在 Redis 中,你会用什么数据结构来实现滑动窗口限流?12.LRU 缓存的实现原理讲一下。13.布隆过滤器(Bloom Filter)的底层原理和适用场景讲一下。14.MySQL 索引会在哪些情况下失效?15.在使用 LIKE 进行模糊查询时,索引什么情况下会失效?16.MySQL 的事务隔离级别有哪些?如何保证一致性?17.详细说说 MVCC 的实现,ReadView 的生成时机是怎样的?18.在不同的隔离级别下,一个事务分别会创造几个 ReadView?19.MySQL 都有哪些锁?它们的作用分别是什么?20.为什么选择 Python 和 Go 作为技术栈?在处理并发时有什么区别?21.手撕代码:实现反转链表
被普调的95后很想居...:主播真是传奇耐面王
查看21道真题和解析
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务