bolt*0209 level
获赞
22
粉丝
5
关注
0
看过 TA
129
哈尔滨工业大学
2025
VB
IP属地:黑龙江
暂未填写个人简介
私信
关注
1. 什么是 RAG?请画出其典型架构图并解释其核心流程。RAG(Retrieval-Augmented Generation,检索增强生成)是一种将外部知识库与大型语言模型(LLM)相结合的技术框架,旨在解决 LLM 自身知识陈旧、容易产生幻觉以及无法接触私有知识等问题。其核心思想是:当用户提出问题时,不直接让 LLM 回答,而是先从一个外部知识库(如文档、数据库、网页等)中检索出与问题最相关的信息片段,然后将这些信息片段连同原始问题一起作为上下文,提供给 LLM,让其基于给定的信息进行回答。工程动因:RAG 框架通过“先查后说”,有效地将 LLM 的强大语言能力与外部知识库的准确性和实时性结合起来,是企业级 AI 应用落地最主流、最可靠的架构之一。2. 在 RAG 中,文本切分(Chunking)有哪些常用策略?选择不同策略时需要考虑什么?文本切分(Chunking)是 RAG 流程中至关重要的一步,它直接影响到后续检索的精准度和生成的效果。好的切分策略应该在保证语义完整性和控制块大小之间取得平衡。常用切分策略:固定长度切分(Fixed-size Chunking)、递归字符切分(Recursive Character Text Splitter)、语义切分(Semantic Chunking)、基于文档结构切分(e.g., Markdown, HTML)。选择策略时的考量因素:文档类型、检索任务的性质、Embedding 模型的能力、计算成本与性能。工程实践:没有一种“万能”的切分策略。通常从递归字符切分开始,并根据实际的检索效果进行调整。一个常见的优化是“小-大”结合策略:使用较小的 Chunk 进行检索以提高精度,但在检索到这些小 Chunk 后,将它们在原始文档中前后扩展,以包含更完整的上下文信息再送给 LLM。
面试官最爱问的 AI 问...
0 点赞 评论 收藏
分享
内容已删除
0 点赞 评论 收藏
分享
原内容仅作者可见
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务