03-15 10:30 广西大学算法工程师发布于河北

关注

超聚变数字技术大模型开发一面

1、自我介绍

2、简单聊下实习干了什么 ,解决了什么问题

3、讲讲什么是 RAG，结合你做过的企业知识库问答系统讲一下 RAG 调用的全流程

RAG 是 Retrieval-Augmented Generation，也就是检索增强生成。它的核心思想是先从外部知识库中检索相关内容，再把检索结果作为上下文交给大模型生成答案，这样可以降低模型只依赖参数知识带来的时效性和幻觉问题。以企业知识库问答系统为例，完整流程一般是用户输入问题之后，系统先做 query 预处理，比如纠错、改写、意图识别和关键词提取，然后进入召回阶段，从向量库、全文检索或者混合检索系统里找出候选文档；候选文档出来后再做 rerank 重排，把最相关的结果排前面；接着做上下文构造，把文档去重、截断、压缩并按顺序拼接进 prompt；然后把 system prompt、用户问题和检索证据一起送给 LLM；模型生成后再做结果解析、引用补充、敏感信息过滤和日志埋点。离线侧还包括知识库清洗、chunk 切分、embedding 生成和索引构建。

4、rerank 重排具体使用的是算法还是模型

实际项目里 rerank 更多是模型，不是单纯规则算法。常见做法是第一阶段先用 embedding 做粗召回，把候选范围缩小；第二阶段再用 cross-encoder 或专门的 rerank 模型对 query 和 document 成对打分，然后按分数排序。embedding 适合大规模检索，速度快但精度有限；rerank 适合精排，能够更准确判断语义相关性，但成本更高。所以工程上通常是“召回 + 重排”两段式，不会直接靠一个简单排序规则完成全部相关度优化。

5、讲讲你做过的智能客服助手里的 LLM 调用全流程

LLM 调用全流程一般是用户请求先到应用服务层，先做鉴权、参数校验、限流和会话信息读取，然后根据业务场景构造 prompt，把 system prompt、用户输入、历史对话、检索结果和工具输出拼成模型输入。如果是知识问答场景，会先走 RAG 检索链路再拼上下文；如果是结构化生成场景，会提前约束输出格式，比如 JSON。之后通过模型网关调用底层模型，支持同步返回或者流式返回。模型输出后再做解析和后处理，比如格式修复、敏感信息过滤、引用标注、结果入库和 token 统计。如果是多轮对话，还会更新会话上下文和长期记忆，同时记录调用日志、耗时、失败原因和评测样本。

6、在你做过的智能客服助手里，token 策略执行和长对话管理是怎么做的

token 策略的核心目标是控制成本、降低时延，同时保证有效信息尽量不丢失。长对话里不会把所有历史消息原样传给模型，而是保留最近几轮原始对话，把更早内容做摘要，摘要作为记忆继续参与后续生成。对于检索结果也会做长度控制，不会整篇文档直接塞进去，而是只保留和当前问题最相关的 chunk 或关键句。实际执行时，一般会先估算当前请求总 token，如果超过阈值，就按优先级裁剪上下文，比如先裁剪低相关检索片段，再裁剪较早轮次对话，最后必要时只保留摘要。这样做既能控制窗口长度，也能减少无效噪声。

def build_context(query, history, docs, max_tokens=4000):
    recent_history = history[-4:]
    summary = summarize(history[:-4])

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.

全部评论

推荐最新楼层

04-02 21:58

北京市石景山区业余大学 Java

快手日常面经~二面已挂

发面经攒后面的人品，我攒我攒一面：1.组内业务介绍2.自我介绍3.上下文压缩怎么做的4.压缩的时候信息丢失怎么做5.这样上下文工程还有什么，比如引入长期记忆，讲了讲mem06.openclaw的记忆系统怎么设计的7.openclaw的多智能体协作是怎么做的反转链表---二面：自我介绍说一下最深的点，感觉有点为了表现自己说错了，是自己做的最深的点，我说的是最近比较关注的深入研究的点(hhh查询的接口，问我数据量到底有多少?我不知道啊！确实是扣分点Agent范式是怎么做的？混合查询怎么做的？组合总数---感觉还是自己太菜了

查看12道真题和解析

点赞评论收藏

04-27 21:34

哈尔滨工业大学（威海）嵌入式软件开发

自动化本科生就业方向

宁德时代 储能系统开发电气方向新凯来 嵌入式开发哪个发展前景会更好

点赞评论收藏

03-31 11:45

门头沟学院 Java

实习转正歧视

有些公司常年挂着实习岗，疯狂招实习生干活，但转正名额少得可怜，他们不是想培养人，就是想用廉价劳动力，等实习生干满三个月，随便找个理由打发走，下一批又来了。我们现在招实习生都会明确说明，这个岗位没有转正机会，如果介意是可以不用来的

你见过哪些招聘隐形歧视？

点赞评论收藏

昨天 13:47

门头沟学院 Java

招银网络开奖

投票

招银线下南京站面试的有没有开奖的啊看别人都开了自己还在资料审批，虽然知道可能性不大了但是还是不大甘心

点赞评论收藏

04-28 15:35

中南大学 Java

天塌了家人们，入职小厂第一天，两个大厂约面

早上刚入职，下午半个小时之内两个hr发电话过来约面，掌上先机和字节

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

# 实习想申请秋招offer，能不能argue薪资 #

# 你和你的mentor相处模式是__ #

6958次浏览 62人参与

超聚变数字技术 大模型开发 一面

1、自我介绍

2、简单聊下实习干了什么 ,解决了什么问题

3、讲讲什么是 RAG，结合你做过的企业知识库问答系统讲一下 RAG 调用的全流程

4、rerank 重排具体使用的是算法还是模型

5、讲讲你做过的智能客服助手里的 LLM 调用全流程

6、在你做过的智能客服助手里，token 策略执行和长对话管理是怎么做的

全站热榜

创作者周榜

超聚变数字技术大模型开发一面