暑期阿里淘天AI应用研发一面 夯爆了版

继续来分享下最近的面经~欢迎友好讨论,信息共享
1. 实习拷打

2. 在RAG系统中,它一般的召回阶段的排序策略通常有哪些?如果一个用户在召回的时候,他的查询是一些长尾或者是语义模糊的关键词,你怎么去提升这个召回的准确率?

3. 召回排序的过程有几个阶段或几个层次?

4. 有哪些方式可以改写Query,为什么能够提升这个召回精准度?

5. RRF融合中,它的K参数一般取值是多少?大一点、小一点对结果有什么影响?

6. 在你的项目里面,实际召回中有遇到不准的情况吗?在你们这个提升准确率的过程中,你们去做了哪些事情去提升,怎么做?

7. 如果在查询中间,输入的一些极其模糊的表达,在实际工程中间要怎么去做呢?

8. 那如果要做这么一个AI,你具体怎么去提示他,怎么去做?遇到这种一次性说不清楚话的用户,那你这个agent怎么去解决这一类的问题?

9. 怎么去降低整个项目的一个幻觉?从数据、检索和生成这三个方面去阐述一下

10. Agent项目如何设计评测方案

11. 后端压测性能优化,如何定位问题

之后是两个场景题:
1. 假如需要你去设计一个电商客服agent的评测方案。这个agent主要有三类任务:商品咨询、售后咨询、还有投诉安抚。你需要去设计一个完整的评价系统,主要包括测评的维度指标,以及数据集的构成构建方案。然后如何区分这个agent到底是好还是坏,你怎么去设计?比如说我们就开发了一个这样的客服系统跑在线上,你总得有一些衡量的指标,你怎么去建这个衡量指标,怎么得出来这个agent是比较好的、比较提效的?比如说在安抚这个场景,用户的满意度是很难去衡量的,那你需要假如说让你设计一些指标,或选取一些指标去衡量用户是否满意,你觉得怎么去提取或者是设计这个指标?

2. 假如让你负责一个文本转SQL的模型训练集的构建,你只有500条真实标注样本,需要你去覆盖200多个查询模式(单表查询、多表连接、聚合查询等等),需要你设计一个完整的数据生产流,包括合成策略、怎么控制质量,以及怎么去迭代优化,你怎么去设计?

再之后是两道ai coding
全部评论

相关推荐

一、自我介绍二、项目深度拷问一(多模态相关项目)1. 项目中针对图文模态对齐问题,具体采用了哪些技术方案解决?2. 若图纸类视觉内容在文本中无任何对应描述,模型如何依托视觉特征实现精准内容召回?3. 项目向量数据库Milvus中,选用了哪类索引算法,选择该算法的核心依据是什么?4. 针对专业术语出现语义偏移的问题,除了混合检索方案,是否尝试过Embedding模型微调、Adapter适配等优化方式?具体落地思路是怎样的?三、项目深度拷问二(Agent对话/画像项目)1. 当外部测评工具返回的原始数据格式,与大模型输入预期格式不匹配时,如何实现数据格式的自动化映射?2. 向量库检索出的用户长期画像数据,与当前实时会话状态产生冲突时,整套系统的处理逻辑和解决方案是什么?3. 如何避免模型回复过度依赖检索到的外部知识,导致回答生硬、缺乏共情能力,提升对话自然度?四、AI Agent核心技术原理1. 对比思维链(CoT),ReAct范式在模型与外部环境交互过程中,核心解决了哪些痛点问题?2. 详细阐述大模型实现函数调用(Function Call)的完整流程,模型是如何将自然语言语义转化为标准化结构化参数的?3. 实际开发过程中,如何判断一个任务适合采用固定Workflow流程,还是自主决策型Agent来实现?五、Agent记忆与检索优化1. 详细讲解Agent系统中长短期记忆的设计逻辑,在长时对话场景下,如何实现上下文信息的动态压缩与选择性遗忘?2. 在Agent系统架构中,RAG检索获取的外部知识,是如何精准输入给模型,同时避免无关知识对模型输出产生干扰的?3. 解释重排序(Rerank)技术的定义,它在Agent检索链路中,对提升模型最终决策准确性起到哪些关键作用?六、多Agent与人机协作1. 单Agent处理复杂长周期任务时,引入多智能体(Multi Agent)架构的核心优势有哪些?2. Multi Agent系统中的路由(Router)节点,依据哪些规则和逻辑,将任务分发给对应的子Agent?3. 什么是人在回路(Human-in-the-loop)机制?在Agent系统开发中,如何合理设计人工审批断点,保障系统运行可靠性?七、系统评估与性能优化1. 有哪些量化评估方式,可以衡量一套Agent系统的优劣?2. 除模型生成质量外,Agent系统还需要重点关注哪些维度的评估指标?3. 针对Agent多步推理过程中产生的响应延迟问题,可落地的优化方法有哪些?4. 随着大模型上下文窗口持续扩容,传统RAG技术是否会被完全替代?阐述你的核心观点及理由。
查看20道真题和解析
点赞 评论 收藏
分享
评论
点赞
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务