算法打工人阿旺

09-23 22:44 中山大学算法工程师发布于山东

关注

大模型RAG常见面试问题（附答案）

1️⃣RAG 有哪几个步骤？
Step1:将文本分割成块;Step2:使用编码模型将这些块嵌入到向量中，将所有这些向量放入索引中;Step3:LLM 创建一个提示，告诉模型根据我们在搜索步骤中找到的上下文来回答用户的查询。
2️⃣实际项目中RAG有哪些优化技巧？
首先召回源会考虑多路召回，在召回后面增加一个重排序的阶段，提升召回的质量。另外，重排序模型以及生成模型会根据系统问答的指标情况，进一步微调。
3️⃣RAG 中为什么会出现幻觉？
出现幻觉问题主要分为两大类，一是生成结果与数据源不一致，训练数据和源数据不一致、数据没对齐或者编码器理解能力的缺陷导致；二是用户问题超出了大模型的认知，用户的问题不在语言模型认知范围内导致。
4️⃣RAG 一般怎么做效果评估？
RAG 做效果评估主要是针对检索和生成两个环节。对检索环节，我们可以采用 MRR 即平均倒排率，前 k 项的 Hits Rate 命中率， NDCG 排序指标等。生成环节首先是量化指标，再评估生成答案的多样性，看看模型是否能够生成多种合理且相关的答案。还需要引入人类评估，考虑资源效率。
5️⃣针对幻觉的问题，有什么解决思路？
加入一些纠偏规则，比如采用 ReAct 的思想，让大模型对输出的结果进行反思。还有一种思路是集成知识图谱，即不再局限于向量数据库匹配，做召回时不仅考虑文档块，同时还考虑图谱的三元组。将知识图谱( KGs ）集成到 RAG 中，通过利用知识图谱中结构化且相互关联的数据，可以显著增强当前 RAG 系统的推理能力。
6️⃣在实际做项目中，经常遇到各种边界的 case ，一般怎么解决？
这个需要分情况来看，首先是无效问题：如果对于知识库中没有的问题，我们需要做一个准入的判别，判断是否需要回答。一般是一个二分类模型，或者直接用大模型+ prompt 来做，使模型在这种情况下输出一个预设的兜底话术。第二个是减少幻觉，在推理模块中添加规则和提示工程技术。还有一种是格式错误：模型可能会生成无法解析的答案，这种可以设计一个备份的代理大模型，当解析失败时，可以基于代理大模型直接生成简洁准确的总结。
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

10-23 19:53

成都体育学院 Java

用友 java开发 26秋招笔试

10.16笔试四道编程题没错，只有四道编程题。1.n个球从100米高度同时丢下（1<n<6）,第i个球碰到地面会回弹（8-i）/8的距离，求离地6-19米距离内，第几米有至少两个球回弹到最高高度，以及当前的回弹次数。（15分） 输入为一个整数n 输出为 第6米：（第1个球第22次）（第2个球第10次） ...2.给定一个长度为n的整型数组，和一个长度为m的整型数组，求能否把长度为m的数组分配给长度为n的数组？（可以理解为m个工作分配给n个人，总和不超出的情况下，一个人可处理多个工作）。（15分） 数据规模（1<n,m<10） 输出格式 “YES” or “NO”3.（3...

投递用友等公司10个岗位

点赞评论收藏

分享

10-17 02:54

已编辑

广东海洋大学 Java

分享一下个人收集的一点零散后端RAG八股

一切都还要丛哥们那天偶然在b站看到一个美女视频，视频封面是位小姐姐，标题是说模拟面试讲解自己的RAG项目，怀着一颗求学的❤，哥们毫不犹豫地点了进去批判性地好好欣赏小姐姐的项目。不出意外，在CS这种性压抑的领域，评论区里面没有对异性的渴望，只有对其技术水平无限的攻击，评论区直接炸出各路大佬，哥们就偷师记录了一些觉得有用的内容，整理到了博客上。https://www.blog.aeside.top/post/22最近也写了点其他AI概念扫盲的短文，佬们可以过来指点一下。也可以关注一下我的公众号Java Time有空了我就会往上面同步点写得像人样的文章

点赞评论收藏

分享

11-01 15:19

北京邮电大学 Java

滴滴后端开发一面

九月初面的，二进宫，这次顺利通过一面。自我介绍实习系统采用异步架构，如何保证数据的实时性流量暴增导致消息堆积，如何保证数据的实时性日志是用来做什么的项目黑马点评共同关注是如何用 Redis 实现的；Redis Set 求交集的命令，复杂度；关注用户比较多时，如何优化性能点赞排序是如何做的统计签到天数是如何做的为什么用 HyperLogLog 做 UV 统计，而不是 Set讲一下秒杀中使用的 Lua 脚本的逻辑数据库和缓存的一致性是如何保证的；先改数据库，再删缓存有什么问题吗；可能出现缓存击穿，如何处理为什么要做库存预占为什么不用 MySQL 做模糊查询说一下数据同步的链路；既然是异步的，如何避...

查看29道真题和解析

点赞评论收藏

分享

10-22 19:40

西安交通大学新材料/环保技术

29化学女大家有推荐的公司吗

从8月底就开始陆陆续续投递了，到现在已经投递了100多家企业。本来准备去长存的，结果前几天发感谢信二面结束泡了一个月。现在也没OFFER、没面试，不知道有啥投的了。从留西安到现在全国可飞，我觉得自己已经是一点心气都没了，也提不起劲去干啥，今年都是这么难吗,还是我运气真的太烂了

校招求职吐槽

点赞评论收藏

分享

10-31 10:36

重庆大学研发工程师

别在误会低代码了，真正的低代码不仅仅是简单的拖拉拽和表单流程搭建

在和客户交流的时候，发现很多客户觉得低代码或者零代码的平台只能做一些简单的业务系统，其实这点 产品本身做得不够的，可能就是这样。但是JVS 其实远远不止仅仅做一些简单的表单和流程，还可以做得更多，它是软件开发级别的低代码开发平台。JVS内包含了多种能力配置，包括多个能力配置引擎，通过设计数据与配置引擎可以直接渲染生成功能，无需再生成代码（生成代码的模式大概率是一次性的低代码），包括：列表页的配置器，可以配置各种列表页，列表页上的数据字段、展示内容、交互操作表单的配置器，构建用户信息查询录入的操作界面逻辑的配置器，构建自动化处理的业务功能流程的配置器，实现人工审批的功能图表的配置器，配置用于嵌入...

点赞评论收藏

分享

评论

2

27

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 2025秋招体验点评 #

22985次浏览 238人参与

# 第一次找实习，我建议__ #

1553次浏览 23人参与

# 360集团校招 #

29346次浏览 188人参与

# 你听到的“最没用”的秋招建议 #

5584次浏览 69人参与

# 从mentor身上学到了__ #

3350次浏览 44人参与

# 秋招暂停，我将对以下公司做出处罚__ #

4784次浏览 18人参与

# 联影求职进展汇总 #

92061次浏览 428人参与

# 工作以后，你父母对你啥态度 #

3108次浏览 46人参与

# 薪资要看总包还是月薪？ #

7450次浏览 85人参与

# 什么样的公司千万别去 #

5710次浏览 43人参与

# 你在职场上见过哪些“水货”同事 #

8911次浏览 73人参与

# 联影医疗求职进展汇总 #

47271次浏览 126人参与

# 小红书取消大小周 #

76199次浏览 175人参与

# 实习心态崩了 #

89119次浏览 475人参与

# 如果公司给你放一天假，你会怎么度过？ #

26526次浏览 148人参与

# 军工所铁饭碗 vs 互联网高薪资，你会选谁 #

1057次浏览 16人参与

# 简历无回复，你会继续海投还是优化再投？ #

109332次浏览 832人参与

# 双11，我的offer购物车开箱啦 #

3777次浏览 34人参与

# 快手工作体验 #

249703次浏览 2630人参与

# 哪些公司真双非友好？ #

45827次浏览 209人参与

# 外包能不能当跳板？ #

51549次浏览 250人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务