Ai agent开发二面 快手面经

面试很难,还是要多多练习,攒人品中!
1、做RAG项目的时候,是怎么评测效果的?有哪些评测维度,具体用到了哪些指标?
2、项目里的数据集包含什么内容,数据来源、数据格式是怎样的?
3、如果让对RAG的相关度和回答效果做优化,有什么思路?有没有更体系化的优化方案?
4、有一千条数据,需要做求和处理,这种数据处理场景怎么设计实现?
5、RAG的性能怎么提升,有没有实际的优化思路(工程层面或算法层面)?
6、项目里的上下文是怎么处理的?上下文过长、冗余等问题有什么优化方向?
7、Agent的长记忆和短记忆之间,怎么做到协同工作的?两者的衔接逻辑是什么?
8、有什么思路能让自己做的Agent更智能?
手撕代码
全排列
全部评论
一千条数据做求和处理是啥意思
1 回复 分享
发布于 03-24 12:11 福建
接好运
点赞 回复 分享
发布于 03-25 00:04 陕西
感谢分享面经,立马补了一波知识。看哥们之前帖子还在秋招,今年开始找实习了哈哈
点赞 回复 分享
发布于 03-24 15:34 江苏

相关推荐

攒攒人品!有面试过同岗的朋友欢迎评论区交流1.项目拷打2.实习拷打3.OCR 结果有噪声或错误时,你是怎么做纠错或提升解析质量的?4.多模态检索中,图像和文本向量不在同一空间时,如何实现对齐?5.Agent 中长短期记忆如何设计?各自存什么,怎么触发读取?6.多轮对话中,如果不同轮次的记忆发生冲突,你如何处理?7.用户情绪异常(投诉、愤怒)时,Agent 如何在不中断主流程的情况下进行干预?8.长文档为什么一定要切 chunk 再做向量化?不切会有什么问题?9.chunk切分时为什么要有重叠区域?比例一般怎么确定?10.稠密向量和稀疏向量的区别是什么?各自适合什么场景?11.是否做过关键词召回和向量召回的融合?具体怎么做的?12.向量检索中 Top-K 设置过大或过小分别会带来什么问题?13.余弦相似度和欧氏距离在高维空间中的差异是什么?实际怎么选?14.为什么需要 rerank 模型?它解决了向量召回的哪些问题?15.rerank之后的截断策略是怎么设计的?为什么选这个 K 值?16.文档发生局部更新时,如何做增量索引而不是全量重建?17.RAG 中如果没有召回到相关知识,如何约束模型避免胡编?18.HyDE 在 query 模糊时是如何提升召回效果的?19.超长上下文模型出现后,RAG 架构的必要性是否会下降?20.大模型高并发调用时,如何做限流、降级和成本控制?
点赞 评论 收藏
分享
查看20道真题和解析
点赞 评论 收藏
分享
评论
9
49
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务