03-12 10:48 广西大学算法工程师发布于河北

关注

带得科技大模型应用开发二面

1. 你们线上大模型应用的整体架构是怎样的？

常见架构就是这几层：

用户请求先进入 API 网关，再到业务服务层。业务服务层负责鉴权、限流、Prompt 拼装、会话管理、工具编排。如果有知识库，就先走检索链路；如果要调外部能力，就走工具调用；最后把上下文交给大模型生成结果。生成结果出来后，再做内容过滤、格式化、日志落库、监控上报。

核心链路一般是：

用户请求 -> 业务编排 -> 检索/工具 -> 模型推理 -> 后处理 -> 返回结果

2. 你们怎么做 Prompt 工程？

Prompt 不是简单写一句提示词，而是模板化管理。

常见做法是把 Prompt 拆成几部分：

system prompt
业务指令
上下文
few-shot 示例
输出格式约束
安全约束

线上一般不会把 Prompt 写死在代码里，而是做成配置化。这样方便灰度、A/B 测试、版本回滚。

Prompt 优化最常见的方向有三个：

角色设定清晰
输出格式明确
给足边界条件，减少自由发挥

3. 怎么减少大模型幻觉？

减少幻觉常见就这几种办法：

给模型真实上下文，不要裸问
明确告诉它不知道就说不知道
限制回答范围，只允许基于提供内容回答
给标准输出格式
对结果做引用和校验
高风险场景加规则兜底或人工审核

如果是知识问答场景，最常见就是：

检索增强 + 回答约束 + 结果校验

幻觉不能只靠模型自觉，必须靠上下文、Prompt 和校验一起压。

4. temperature、top_p 这些参数分别是干什么的？

temperature 控制随机性。越低，输出越稳定；越高，输出越发散。

top_p 是核采样。模型不是从所有词里采样，而是只从累计概率达到某个阈值的一小部分词里采样。top_p 越小，输出越保守。

常见经验：

问答、摘要、结构化提取：temperature 低一些
文案、创作、发散生成：temperature 高一些

一般线上不会同时把 temperature 和 top_p 调得太激进，不然结果容易飘。

5. Function Calling / Tool Calling 是怎么做的？

核心就是让模型别直接回答，而是先判断要不要调用工具。

常见流程：

模型先根据用户问题和工具描述决定是否调用工具。如果要调，就输出工具名和参数。业务层接到这个结构化结果后，真正执行工具。拿到工具结果后，再把结果回传给模型，让模型生成最终答案。

关键点有两个：

工具描述要清楚
参数校验要做严，不能直接信模型

一个简单例子：

tool_call = {
    "name": "get_weather",
    "arguments": {
        "city": "北京"
    }
}

6. 你们怎么做会话记忆？

会话记忆通常分两种：

短期记忆和长期记忆。

短期记忆就是当前几轮对话上下文，直接放在 prompt 里。长期记忆一般是把用户偏好、历史事实、重要事件提取出来，单独存储，必要时再召回。

线上不会无限拼接全部历史消息，因为：

token 成本高
长上下文噪声大
很多历史内容根本没用

所以常见做法是：

保留最近 N 轮
对老对话做摘要
关键信息单独结构化存储

7. 流式输出是怎么实现的？

流式输出本质上就是模型边生成，服务边返回。不是等整段话生成完再一次性返回。

常见实现方式：

模型服务端按 token 或 chunk 推送
业务层用 SSE 或 WebSocket 转发给前端
前端一边接收一边渲染

这样做的好处：

首字返回更快
用户体感更好
长回答不容易让用户觉得卡死

如果是 Python 服务里，常见就是生成器逐段返回。

def stream_answer():
    chunks = ["你好，", "这里是", "流式输出结果。"]
    for c in chunks:
        yield c

8. 怎么控制大模

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.

全部评论

推荐最新楼层

站队站对牛

门头沟学院机械设计/制造

这些都太专业的问题了

点赞回复分享

发布于 03-30 20:48 江苏

哞客374226558号

数字马力（长沙）信息技术有限公司_后端开发

祝二面顺利

点赞回复分享

发布于 03-16 21:11 陕西

哈哈哈，你是老六

门头沟学院大数据开发工程师

我看了你很多总结，感觉都很好

点赞回复分享

发布于 03-15 19:22 北京

04-23 20:47

已编辑

复旦大学 C++

猿辅导—春招-Android开发—一面

📍面试公司：猿辅导🕐面试时间：4.20💻面试岗位：Android开发工程师🙌面试感想：看邮件里面只约了30min，以为没有什么难度，然后就掉以轻心了，因为确实是不太熟悉Android相关的，想说问到就摆烂了，所以还是挺吃力的，最后还是面了1h左右。❓面试问题：0.面试官介绍业务（挺好的，很大程度上帮助了我对这个部门的业务了解）——3min1.自我介绍（经典背书环节）——5min2.问项目。因为本人的实习经历和项目比较杂乱，所以他确定了一下我的技术栈。可能后续便于针对这个技术栈提问八股（大概10min）——————————————————————————————————八股环节：3.C+...

鼠鼠的面筋摊

点赞评论收藏

04-27 10:20

西南林业大学汽车设计

求拷打，同时我想去暑假实习找个好一点的厂，目标职业是SQE，有没有大佬内推一下

点赞评论收藏

04-14 09:10

门头沟学院 Java

AI时代了，面试要不要死磕八股

刷遍了牛客的吐槽帖，大家都在骂“都2026年AI时代了，面试还在死磕八股，毫无意义”。我特别能共情这种吐槽，毕竟谁没被JVM、MySQL的偏难怪题拷打过呢？但骂归骂，我们必须清醒地认清一个现实：哪怕AI能帮我们写90%的代码，面试问八股这件事，短期之内根本不会消失。我们能做的，不是抱怨，是搞清楚“为什么还要问八股？该不该准备？怎么高效准备？遇到纯八股公司要不要跑？”今天就把这些问题讲透，给所有正在春招的应届生，一份最清醒、最实用的备考指南。一、先搞懂：都2026年了，为什么面试还在疯狂问八股？很多人说“AI都能写代码了，问八股还有什么用？”，其实企业面试问八股，从来不是看你能不能背下来，背后有...

哪些公司面试还在问八股？

点赞评论收藏

04-15 00:14

云南大学品质工程师

比亚迪2026校园招聘

211硕士，比亚迪工艺岗，工资，工作强度怎么样啊

点赞评论收藏

03-29 20:40

门头沟学院 Java

笔试无面

基本上每家春招只要开了我就投，由于自身bg不够好，笔试完之后就基本上石沉大海了，目前唯一一家约面的只有虾皮，也是止步于二面了，希望四月会好起来，面试机会多一点。

春招至今，你的战绩如何？

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

# 实习想申请秋招offer，能不能argue薪资 #

258553次浏览 1359人参与

# 你和你的mentor相处模式是__ #

9458次浏览 77人参与

# 机械制造公司求职体验 #

141713次浏览 386人参与

# 没有合适的工作，你会先找个干着，还是考公考研 #

193087次浏览 1367人参与

# 实习第一天，你在干什么 #

5972次浏览 50人参与

# 你最满意的offer薪资是哪家公司？ #

带得科技 大模型应用开发 二面

1. 你们线上大模型应用的整体架构是怎样的？

2. 你们怎么做 Prompt 工程？

3. 怎么减少大模型幻觉？

4. temperature、top_p 这些参数分别是干什么的？

5. Function Calling / Tool Calling 是怎么做的？

6. 你们怎么做会话记忆？

7. 流式输出是怎么实现的？

8. 怎么控制大模

全站热榜

创作者周榜

带得科技大模型应用开发二面