实战篇
RAG 中如何选择分块大小和策略?
对于代码文档和叙事性文本,分块策略有何不同?(代码文档适合按函数或类块切分,叙事文本适合按段落或自然语义边界)
什么是查询改写?为什么它在RAG中重要?
在多轮对话中,如何利用历史信息改写当前问题?(通常需要维护对话状态,将当前问题与之前的对话拼接成独立、完整的问题)
如何处理RAG中的多跳问题?
你如何判断一个问题是否是多跳问题?(可以通过问题中是否有多个实体、关系词,或依赖常识判断)
在RAG系统中,如何实现混合检索(Hybrid Search)?
什么时候密集检索会失效?(当问题包含精确数字、罕见实体,或者语义上难以区分时,密集检索可能不如BM25)
如何评估RAG的忠实性(Faithfulness)?
如果忠实性低,可能的原因有哪些?(检索到的文档本身与问题不相关、模型无视文档自由发挥、温度过高导致随机性太强等)
什么是Agent?它与RAG有什么区别和联系?
你会在什么场景下选择Agent而不是纯RAG?(需要执行动作、多步推理、动态决策的场景,如个人助理、自动化操作)
如何评估RAG系统的整体效果?(不仅是检索)
如果检索召回率很高但生成得分低,可能是什么问题?(检索到的文档噪声多、排序不佳、模型没有正确使用文档)
在RAG中,如何处理表格和结构化数据?
如果你要做一个财报分析助手,如何让RAG理解财务报表中的数字关系?
#面试官最爱问的 AI 问题是......#
对于代码文档和叙事性文本,分块策略有何不同?(代码文档适合按函数或类块切分,叙事文本适合按段落或自然语义边界)
什么是查询改写?为什么它在RAG中重要?
在多轮对话中,如何利用历史信息改写当前问题?(通常需要维护对话状态,将当前问题与之前的对话拼接成独立、完整的问题)
如何处理RAG中的多跳问题?
你如何判断一个问题是否是多跳问题?(可以通过问题中是否有多个实体、关系词,或依赖常识判断)
在RAG系统中,如何实现混合检索(Hybrid Search)?
什么时候密集检索会失效?(当问题包含精确数字、罕见实体,或者语义上难以区分时,密集检索可能不如BM25)
如何评估RAG的忠实性(Faithfulness)?
如果忠实性低,可能的原因有哪些?(检索到的文档本身与问题不相关、模型无视文档自由发挥、温度过高导致随机性太强等)
什么是Agent?它与RAG有什么区别和联系?
你会在什么场景下选择Agent而不是纯RAG?(需要执行动作、多步推理、动态决策的场景,如个人助理、自动化操作)
如何评估RAG系统的整体效果?(不仅是检索)
如果检索召回率很高但生成得分低,可能是什么问题?(检索到的文档噪声多、排序不佳、模型没有正确使用文档)
在RAG中,如何处理表格和结构化数据?
如果你要做一个财报分析助手,如何让RAG理解财务报表中的数字关系?
#面试官最爱问的 AI 问题是......#
全部评论
相关推荐
查看14道真题和解析 点赞 评论 收藏
分享