暑期阿里淘天AI应用研发一面 夯爆了版

继续来分享下最近的面经~欢迎友好讨论,信息共享
1. 实习拷打

2. 在RAG系统中,它一般的召回阶段的排序策略通常有哪些?如果一个用户在召回的时候,他的查询是一些长尾或者是语义模糊的关键词,你怎么去提升这个召回的准确率?

3. 召回排序的过程有几个阶段或几个层次?

4. 有哪些方式可以改写Query,为什么能够提升这个召回精准度?

5. RRF融合中,它的K参数一般取值是多少?大一点、小一点对结果有什么影响?

6. 在你的项目里面,实际召回中有遇到不准的情况吗?在你们这个提升准确率的过程中,你们去做了哪些事情去提升,怎么做?

7. 如果在查询中间,输入的一些极其模糊的表达,在实际工程中间要怎么去做呢?

8. 那如果要做这么一个AI,你具体怎么去提示他,怎么去做?遇到这种一次性说不清楚话的用户,那你这个agent怎么去解决这一类的问题?

9. 怎么去降低整个项目的一个幻觉?从数据、检索和生成这三个方面去阐述一下

10. Agent项目如何设计评测方案

11. 后端压测性能优化,如何定位问题

之后是两个场景题:
1. 假如需要你去设计一个电商客服agent的评测方案。这个agent主要有三类任务:商品咨询、售后咨询、还有投诉安抚。你需要去设计一个完整的评价系统,主要包括测评的维度指标,以及数据集的构成构建方案。然后如何区分这个agent到底是好还是坏,你怎么去设计?比如说我们就开发了一个这样的客服系统跑在线上,你总得有一些衡量的指标,你怎么去建这个衡量指标,怎么得出来这个agent是比较好的、比较提效的?比如说在安抚这个场景,用户的满意度是很难去衡量的,那你需要假如说让你设计一些指标,或选取一些指标去衡量用户是否满意,你觉得怎么去提取或者是设计这个指标?

2. 假如让你负责一个文本转SQL的模型训练集的构建,你只有500条真实标注样本,需要你去覆盖200多个查询模式(单表查询、多表连接、聚合查询等等),需要你设计一个完整的数据生产流,包括合成策略、怎么控制质量,以及怎么去迭代优化,你怎么去设计?

再之后是两道ai coding
全部评论

相关推荐

04-24 16:15
门头沟学院 Java
整体面试还是不错的,但是没后续了,不知道是哪里出了问题1.实习拷打2.拷打第一个项目:项目里如何解决图文模态对齐问题?如果图纸在文本中没有描述,模型如何通过视觉特征召回?Milvus中使用了哪种索引算法?针对术语的语义偏移,除了混合检索,有没有试过对Embedding模型进行微调或使用Adapter?3.拷打第二个项目:如果外部测评工具返回的原始数据格式与LLM预期不符,如何实现自动化映射?当向量库检索出的长期画像与当前会话状态有冲突时,你的系统如何应对?如何防止模型回复过度依赖检索内容而变得生硬,影响共情?4.相比于CoT,ReAct在模型与外部环境交互时解决了什么问题?5.讲一下大模型进行Function Call的具体流程?如何将语义转化为结构化参数的?6.在开发中,你怎么判断任务该用Workflow还是自主决策的Agent?7.讲一下Agent的长短期记忆,在长对话中如何实现上下文的动态压缩和遗忘?8.在Agent系统中,RAG检索到的外部知识是如何喂给模型并防止干扰的?9.什么是Rerank?在检索链路中它对Agent的决策准确性有什么影响?10.当单Agent面对长任务时,引入Multi Agent的优势是什么?11.Multi Agent中,Router节点是如何决定任务该分发给哪个子Agent的?12.什么是Human-in-the-loop?在Agent系统中如何设计人工审批断点?13.如何量化评估一个Agent系统的好坏?14.除了生成质量,还应该关注哪些维度的指标?15.对于Agent多步推理带来的延迟问题,有哪些优化方法?16.随着大模型上下文窗口的扩大,你认为RAG会被完全取代吗?
查看21道真题和解析
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务