08-21 21:19 门头沟学院人工智能发布于山东

关注

因为摸鱼太久导致被美团二面暴打，我痛定思痛决定好好学一下。

现在准备秋招了，上个星期面了字节和奇绩创坛，前两天面了美团，很快，上午投的，晚上就面了，

然后面完发现确实玩了太久了，这博客也好久没更新了，赶紧加班加点学一下噻。

那么不说废话了。

先讲讲RAG是什么？

这个RAG我讲过很多次了，（现在看到这里基本上是3.0版本了，现在的东西就不算速成的内容了，我说过我要写教程，写大众通识的内容，所以要深入浅出完整的讲。）

这个东西本质上算外置大脑，在模型进行给出内容之前先检索再生成。

那么RAG 解决了什么问题或者有什么用？

幻觉

知识过时（现在一般通过联网解决问题）

无法访问私有/特定领域数据

那么RAG的核心工作流程是什么？

第一阶段：检索

在你知识库准备好之后，我们需要对数据集进行分块处理，

太大不行（大了加了还不如不加），太小也不行（太少容易丢东西）。

然后进行向量化：

使用嵌入模型（Embedding Model）将每个文本块转换为一个高维向量（即一组数字），这个向量可以表征文本的语义。

讲一下嵌入层和嵌入模型的区别：

这里就用人家的了，至于神经网络有什么东西请移步机器学习的部分。

总结一：关系与区别

特性	Embedding层	嵌入模型 (Embedding Model)
本质	神经网络中的一个组件/层	一个完整的、独立的模型
输入	单个单词/物品的索引（ID）	一段文本（句子、段落等）
输出	一个静态的、与上下文无关的向量	一个动态的、包含上下文信息的语义向量
核心机制	查表（Look-up Table）	Transformer编码器 + 自注意力机制 + 汇聚
类比	字典：给你一个词，返回它的定义。	语言专家：给你一句话，他理解后告诉你这句话的核心意思

那么高维向量是矩阵集合吗？

不是，这个就是向量，带方向的数字罢了，不过一堆batch组成的算矩阵集合。

存储：将这些向量及其对应的原始文本存储到向量数据库里。

在线检索（用户提问）：

当用户问问题时，将问题也转换为一个向量。

将这个“问题向量”送入向量数据库，进行相似性搜索，快速找出与问题向量最相似的几个文本块。

那么怎么筛选最相似的文本块？

然后我就要给你讲搜广推的东西了：

1：给他设置一个分数，如果低于90分的就不要。

2：重排序模型：

先粗排-过滤-精排，

分别有top-k（第一次排序的数量，先筛多点，k一般是50到200）需要高召回率；

然后是top-n（再筛选完送回LLM的文本数量，n一般是1到5）

然后拿到top-n上传LLM。

3：元数据模型：

就是给出标注让他自己搜。

第二阶段：增强生成

构建增强提示（Prompt）：

这里大伙就熟悉了，就是提示词问什么，

这个提示通常类似于：

“请严格根据以下提供的信息来回答问题。如果信息中不包含答案，请直接说'根据已知信息无法回答'。

【信息开始】

{这里插入从向量数据库检索到的相关文本}

【信息结束】

问题：{用户的问题}”

模型生成答案：

大语言模型（LLM）的上下文窗口现在不仅包含了用户的问题，更重要的是包含了解决问题所需的确切知识。

或者是这样：

你是一个法律专家，你需要按照。。。。。。

你会用百度，基本上用ai基本没问题。

RAG怎么优化？

那么根据上面怎么来的，就怎么优化，

1：数据优化：

这个数据要出重，降噪，还有文本分割。

1.1：这个文本分割怎么做？

常规都是按照章节，段落句子去分，然后设置一点固定tokens，

同时有一级标题和二级标题，或者子类。

这会就加上关键字（元数据）作者，时间之类的。

2：检索优化：

2.1：选择对应的模型和数据同时进行嵌入增强（就是扩展/压缩语义让他听得懂）

2.2：加上上下文召回之类的，还有上述的粗排＋精排。

2.3：换向量数据库和修改索引对应参数。

3：其他的方面优化：

3.1给他整个缓存记录回答，

3.2更新迭代

3.3加个监控核心指标之类的。

#聊聊我眼中的AI##面试问题记录##创作激励计划##牛客创作赏金赛#

全部评论

推荐最新楼层

08-22 21:42

门头沟学院 golang

实习出线上事故咋办

主包躺床上打游戏来着，mt一个电话call进来，说干的活没处理好。出线上事故了，他在加班整…😖有点儿手足无措，怎么办

周lyy：跟他说你加油整我先睡了

正在实习的你，几点下班

点赞评论收藏

分享

08-22 19:10

门头沟学院 Java

面试被问Synchornized和Volatile？听到我的回答后，面试官端着瑞幸的手颤抖了.

 面试被问Synchornized和Volatile？当我回答这些以后，面试官端着瑞幸的手颤抖了......不想被拷打？带你速通 Synchronized 和Volatile核心考点    彦祖亦菲们面试的时候经常被问到 “Synchronized 和Volatile有啥区别”、“Volatile为啥不保证原子性” 等等，是不是总卡壳？别慌！这俩 Java 并发里的 “基础王”，看似简单却藏着高频考点，今天用几分钟帮你捋清核心，下次再被问直接 “反拷打”！首先我们要先弄清楚：Java为啥需要这俩关键字？在Java多线程中，影响线程安全的三大"刺客"就是：原子性、可见性和有...

点赞评论收藏

分享

08-21 20:31

暨南大学 Java

快手主站平台消费实习二面已过还会被刷吗

hr说还要把简历给业务老师那边讨论一下腾子倒在了三面😭只能寄希望于老铁厂了许愿一个hr面并快快oc已经面不动了

投了多少份简历才上岸

点赞评论收藏

分享

08-20 19:48

门头沟学院 Java

面试一紧张就脑袋空白？新手期该如何缓解？

“请你做一个自我介绍。” 我站在那儿，大脑一片空白，连自己叫什么都差点说不出来。   你面试时紧张吗？ 我是那种“听到要面试就开始焦虑，前一天晚上失眠，面试当天手心出汗，结束后还在回放‘刚刚说错了什么’的人”。 说实话，我因为紧张犯过很多“社死”错误：  自我介绍嘴瓢，把自己名字说错； 回答问题时脑袋一热，说了跟职位无关的话； 面完想起来：刚才那个问题，其实我会！  我曾经很羡慕那些在镜头前侃侃而谈、思路清晰的人，毕竟我只是一个小小的 I 人程序员罢了！ 💡解决方案 提前“剧透”面试流程，降低未知感 面试紧张，80%是因为不确定性。 建议提前做这些准备：  去公司官网看岗位信息和企业文化； ...

面试太紧张了怎么办？

点赞评论收藏

分享

08-23 19:29

东北大学 Java

八股战士应声倒地（）1. 什么时候到岗...4. 自我介绍5. 对于性能优化，有哪些通用的方法说一下--我分了jvm层，代码层，架构层来说了6. 说一下代码层优化，具体到有一个接口让你去进行优化，你会怎么做--索引、改SQL、多模块化解耦合、异步、缓存7. 说一下怎么保证缓存和数据库之间的数据一致性--这个不记得了8. 数据库索引有哪些数据结构--hash，二叉树，平衡树，B树，B+树9. 一般使用哪个--B+树10. hash表和B+树区别11. 聚簇索引和非聚簇索引12. 给一个联合索引<abc>，select ... b=？ and a=？ and c=？走不走索引13. 如果where条件是a=？ or b=？，走不走索引14. 设计一个学生成绩表15. 这个表中有什么问题，重新设计16. 学生只有所有科目的成绩在80分以上才被认为优秀，写一个SQL查询出来所有优秀的学生id无寿司没过，团子依旧高不可攀

投递美团等公司10个岗位

点赞评论收藏

分享

评论

7

7

招聘动态

哔哩哔哩

2026届秋季校园招聘

vivo2026届

全球校园招聘

蚂蚁集团

2025年秋季校园招聘

平安产险科技中心

2026届校园招聘

去哪儿旅行

2026届校园招聘

莉莉丝游戏

2026届秋季校园招聘

网易游戏雷火

2026届校园招聘开启！

恒生电子

2026届校园招聘

红杉中国

2026届联合校招

字节跳动火山引擎

2026校园招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 秋招投递记录 #

83809次浏览 993人参与

# 机械制造公司评价 #

131729次浏览 318人参与

# 2022毕业即失业取暖地 #

106569次浏览 685人参与

# 比亚迪精密制造工作体验 #

24222次浏览 45人参与

# 你觉得机械有必要实习吗？ #

13104次浏览 90人参与

# 远景求职进展汇总 #

56604次浏览 305人参与

# 互联网行业现在还值得去吗 #

24664次浏览 132人参与

# 芯原求职进展汇总 #

15908次浏览 73人参与

# 机械人还在等华为开奖吗？ #

231373次浏览 1117人参与

# 你喜欢工作还是上学 #

61129次浏览 710人参与

# 哪些公司真双非友好？ #

18784次浏览 92人参与

# 大厂面试问八股多还是项目多？ #

41864次浏览 634人参与

# 求职遇到的搞笑事件 #

128032次浏览 822人参与

# 平台or薪资，你更看重哪个 #

461276次浏览 2891人参与

# 百度工作体验 #

252440次浏览 2064人参与

# 秋招拿一个offer可以躺平吗 #

152636次浏览 1035人参与

# 面试吐槽bot #

122746次浏览 682人参与

# 转正答辩报告怎么写 #

14988次浏览 230人参与

# 面试太紧张了怎么办？ #

49692次浏览 665人参与

# 哪一瞬间觉得自己长大了 #

30854次浏览 467人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务