04-30 05:20 门头沟学院 Java

关注

暑期阿里淘天AI应用研发一面夯爆了版

继续来分享下最近的面经~欢迎友好讨论，信息共享
1. 实习拷打

2. 在RAG系统中，它一般的召回阶段的排序策略通常有哪些？如果一个用户在召回的时候，他的查询是一些长尾或者是语义模糊的关键词，你怎么去提升这个召回的准确率？

3. 召回排序的过程有几个阶段或几个层次？

4. 有哪些方式可以改写Query，为什么能够提升这个召回精准度？

5. RRF融合中，它的K参数一般取值是多少？大一点、小一点对结果有什么影响？

6. 在你的项目里面，实际召回中有遇到不准的情况吗？在你们这个提升准确率的过程中，你们去做了哪些事情去提升，怎么做？

7. 如果在查询中间，输入的一些极其模糊的表达，在实际工程中间要怎么去做呢？

8. 那如果要做这么一个AI，你具体怎么去提示他，怎么去做？遇到这种一次性说不清楚话的用户，那你这个agent怎么去解决这一类的问题？

9. 怎么去降低整个项目的一个幻觉？从数据、检索和生成这三个方面去阐述一下

10. Agent项目如何设计评测方案

11. 后端压测性能优化，如何定位问题

之后是两个场景题：
1. 假如需要你去设计一个电商客服agent的评测方案。这个agent主要有三类任务：商品咨询、售后咨询、还有投诉安抚。你需要去设计一个完整的评价系统，主要包括测评的维度指标，以及数据集的构成构建方案。然后如何区分这个agent到底是好还是坏，你怎么去设计？比如说我们就开发了一个这样的客服系统跑在线上，你总得有一些衡量的指标，你怎么去建这个衡量指标，怎么得出来这个agent是比较好的、比较提效的？比如说在安抚这个场景，用户的满意度是很难去衡量的，那你需要假如说让你设计一些指标，或选取一些指标去衡量用户是否满意，你觉得怎么去提取或者是设计这个指标？

2. 假如让你负责一个文本转SQL的模型训练集的构建，你只有500条真实标注样本，需要你去覆盖200多个查询模式（单表查询、多表连接、聚合查询等等），需要你设计一个完整的数据生产流，包括合成策略、怎么控制质量，以及怎么去迭代优化，你怎么去设计？

再之后是两道ai coding

全部评论

推荐最新楼层

04-25 16:08

广西大学算法工程师

阿里 AI 应用开发暑期一面秒挂

1. 自我介绍2. 项目里怎么做意图识别，如何理解用户真正要解决的问题意图识别不是简单做文本分类，而是把用户输入转换成系统能执行的任务。比如用户问“这个供应商最近还能不能继续合作”，表面上是一个问答，实际上可能需要查询供应商资质、历史履约、黑名单、逾期付款、合同违约记录和采购金额变化。这里要识别的不只是意图标签，还包括业务对象、时间范围、风险类型和是否需要调用工具。工程上我会分成三层。第一层是规则和实体识别，先提取合同编号、供应商名称、采购单号、金额、日期这类强结构化槽位。第二层是模型意图分类，判断是合同审查、条款解释、供应商风险、付款异常还是流程咨询。第三层是置信度和兜底，如果置信度低，就让...

AI-Agent面试实战...

点赞评论收藏

分享

04-24 16:15

门头沟学院 Java

阿里 AI Agent应用开发二面 1h

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1.实习拷打2.拷打第一个项目：项目里如何解决图文模态对齐问题？如果图纸在文本中没有描述，模型如何通过视觉特征召回？Milvus中使用了哪种索引算法？针对术语的语义偏移，除了混合检索，有没有试过对Embedding模型进行微调或使用Adapter？3.拷打第二个项目：如果外部测评工具返回的原始数据格式与LLM预期不符，如何实现自动化映射？当向量库检索出的长期画像与当前会话状态有冲突时，你的系统如何应对？如何防止模型回复过度依赖检索内容而变得生硬，影响共情？4.相比于CoT，ReAct在模型与外部环境交互时解决了什么问题？5.讲一下大模型进行Function Call的具体流程？如何将语义转化为结构化参数的？6.在开发中，你怎么判断任务该用Workflow还是自主决策的Agent？7.讲一下Agent的长短期记忆，在长对话中如何实现上下文的动态压缩和遗忘？8.在Agent系统中，RAG检索到的外部知识是如何喂给模型并防止干扰的？9.什么是Rerank？在检索链路中它对Agent的决策准确性有什么影响？10.当单Agent面对长任务时，引入Multi Agent的优势是什么？11.Multi Agent中，Router节点是如何决定任务该分发给哪个子Agent的？12.什么是Human-in-the-loop？在Agent系统中如何设计人工审批断点？13.如何量化评估一个Agent系统的好坏？14.除了生成质量，还应该关注哪些维度的指标？15.对于Agent多步推理带来的延迟问题，有哪些优化方法？16.随着大模型上下文窗口的扩大，你认为RAG会被完全取代吗？

查看21道真题和解析

点赞评论收藏

分享

04-12 12:21

广西大学算法工程师

淘天 AI应用开发二面

1. Agent 和传统 workflow 的本质区别是什么，什么时候该选 Agent，什么时候不该选传统 workflow 的核心是路径预定义，系统知道每一步做什么、怎么流转、失败后怎么回退，所以它更适合规则清晰、链路稳定、审计要求高的场景。Agent 的核心则是把部分决策权交给模型，让它在运行时决定下一步查什么、调什么工具、如何分解任务，因此更适合任务开放、输入噪声大、解法不唯一的场景。真正的分界线不在“有没有模型”，而在“是否允许运行时规划”。如果目标是工单分类、审批流转、固定字段抽取，workflow 往往更稳；如果目标是复杂排障、代码仓库理解、跨工具探索式分析，Agent 才更有价值...

AI-Agent面试实战...

点赞评论收藏

分享

05-01 20:33

中南大学后端工程师

27 0实习暑期实习总结

bg末9本，0实习，纯java，无agent，共投递13家，约面2家，全部官网投递。3.23投递：京东简历挂，腾讯wxg 二面挂，csig 二面挂，wxg一面拒了3.27投递：携程offer，美团a0挂4.7投递：拼多多a3挂，滴滴，网易互娱简历挂4.12投递：华为测评挂，虾皮简历挂4.17投递：小米，vivo，影石360，全简历挂4.22投递：快手简历挂

点赞评论收藏

分享

04-09 22:35

西南石油大学数据分析师

招银网络面试

实习经历拷打这个功能（单点登录）具体是做什么的？“Ticket”是什么？里面包含了哪些信息？Token存储在哪里？后端如何进行身份认证和校验？Token是明文传输的吗？系统是否会记录用户的登录状态（如登录时间、超时）到数据库？如果没有，如何判断Token是否过期？在拦截器中使用ThreadLocal存储用户信息，目的是什么？ThreadLocal是线程内共享的。如果一个用户连续发起两个请求，它们能被同一个ThreadLocal处理吗？为什么？一个请求处理结束后，是否需要手动删除ThreadLocal中的数据？为什么？八股HashMap是线程安全的吗？请举例说明一个HashMap线程不安全的场景...

查看11道真题和解析

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

19163次浏览 170人参与

# 字节开奖 #

148981次浏览 665人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

47346次浏览 513人参与

# 如果春招能重来，我会___ #

19913次浏览 213人参与

# 薪资爆料 #

421705次浏览 2223人参与

# 除了线上，还能去哪些地方投简历 #

10968次浏览 112人参与

# 刚工作的你，踩过哪些坑？ #

46487次浏览 295人参与

# HR问：你期望的薪资是多少？如何回答 #

99154次浏览 830人参与

# 大学四年该怎么过，才不算浪费时间？ #

23703次浏览 104人参与

# 一份好的简历长什么样？ #

41805次浏览 505人参与

# 你面试被问到过哪些不会的问题？ #

122275次浏览 1944人参与

# 今年形式下双非本找得到工作吗 #

328617次浏览 1774人参与

# 诺瓦星云求职进展汇总 #

258843次浏览 1743人参与

# 双非本科求职如何逆袭 #

1645942次浏览 13060人参与

# 你觉得实习能学到东西吗 #

154015次浏览 1493人参与

# 职场破防瞬间 #

381638次浏览 2847人参与

# 你被哪些公司挂了？ #

193096次浏览 1043人参与

# 实习最晚的一次下班是几点 #

35856次浏览 171人参与

# 字节求职进展汇总 #

1845453次浏览 15385人参与

# 26届校招投递进展 #

670121次浏览 3953人参与

# 双非应该如何逆袭？ #

584237次浏览 6376人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务