03-19 15:10 广西大学算法工程师发布于河北

关注

Momenta AI Agent开发一面

1、自我介绍

2、项目介绍

3、离线数据处理咋做的

离线数据处理我一般会按“采集、清洗、标准化、切分、标注、校验、入库”这条链路来做。先把多来源数据接进来，比如文档、表格、对话日志、接口结果、历史工单，然后做编码统一、去重、去噪、脏字段修复和无效样本过滤。对于文本类数据，还要做特殊符号清理、HTML 去标签、分段切分、敏感信息脱敏和元信息补全。

如果是训练数据，还会进一步做 schema 对齐，比如统一成 instruction / input / output，或者统一成多轮消息格式 messages=[{role, content}]。如果是 RAG 知识数据，就会做 chunk 切分、标题挂载、来源保留和 embedding 入库。如果是 Agent 轨迹数据，还要保留 task_id、step_id、tool_name、tool_input、tool_output、status、error_type 这些字段，方便后面做回放和失败分析。

离线处理的重点不是把数据存进去，而是让后续训练、检索、评测、回溯都能直接复用，所以字段设计、版本管理和质量校验会非常重要。

4、训练数据接入规范

训练数据接入规范的核心是统一格式、保证质量、可追溯、可扩展。一般至少会约束这几层。

第一层是样本结构统一。如果是 SFT 数据，通常会统一成指令格式或者消息格式，比如：

{
  "id": "sample_001",
  "messages": [
    {"role": "system", "content": "你是一个智能助手"},
    {"role": "user", "content": "帮我总结这段内容"},
    {"role": "assistant", "content": "这段内容主要讲了..."}
  ],
  "source": "manual_annotation",
  "domain": "qa",
  "version": "v1"
}

第二层是字段约束。像 id 必须唯一，messages 不能为空，role 只能在 system、user、assistant 里选，文本长度不能超过上限，敏感信息必须脱敏。第三层是质量校验，比如空回复、乱码、重复样本、标签错位、上下文断裂都要过滤。第四层是来源和版本管理，必须知道这条数据从哪来、谁标的、属于哪个版本、什么时候接入，后面效果波动才能追得回来。

如果是训练 Agent 的轨迹数据，还会要求保留中间步骤，比如工具调用前的思考、工具参数、返回结果和最终答案，这样后面不管做监督学习还是错误分析都更方便。

5、阶段模型效果验证咋做

阶段效果验证一般不会只看一个最终指标，而是分层去看。最基本的是离线验证，先划分训练集、验证集、测试集，看基础指标，比如准确率、召回率、F1、BLEU、ROUGE，或者 RAG 场景下的 Recall@K、MRR、NDCG。对于 Agent 系统，还会多看一步任务完成率、工具调用成功率、参数填充正确率、平均执行步数和异常中断率。

如果模型是分阶段迭代的，我通常会做三层验证。第一层是组件级验证，比如检索器单独看召回质量，重排器单独看排序效果，分类器单独看准确率。第二层是链路级验证，也就是完整输入后看最终结果是不是正确。第三层是对比验证，把新版本和旧版本放到同一批评测集上做 A/B 对比，尤其关注回归问题，也就是原来能做对的有没有被新版本做坏。

再往后会上小流量灰度，看线上延迟、错误率、用户采纳率和失败分布。真正的效果验证不是“模型分高不高”，而是“新版本是不是比旧版本更适合当前业务”。

6、失败样本回流有做吗

有做，而且这部分很重要。线上系统如果没有失败样本回流，优化会非常慢，因为你根本不知道系统到底错在哪。一般回流链路我会拆成“采集、归因、清洗、标注、重训/重评测”这几步。

先在线上把关键日志打全，包括用户输入、检索结果、Prompt、模型输出、工具调用参数、工具返回、最终答案、用户反馈和错误码。然后根据失败类型做归因，常见的有召回失败、证据引用错误、工具参数错误、输出格式错误、上下文截断、超时中断和幻觉。归因之后，不是所有失败样本都直接进训练集，还要先去重、筛噪、脱敏，再做人工标注或者半自动打标签。

最后这些失败样本一般有两个用途。一个用途是进专项评测集，变成回归测试样本；另一个用途是进训练或微调数据，用来做定向增强。真正有效的回流机制，一定是“问题发现了以后，下一个版本能明确验证有没有修好”。

7、断点重训咋做

断点重训本质上是为了避免训练过程中因为机器故障、中断或者策略调整导致全部重来。做法上一般依赖 checkpoint 机制，也就是定期保存训练状态，不只是保存模型参数，还要保存优化器状态、学习率调度器状态、当前 epoch、global step、随机数种子、混合精度 scaler 等信息。

如果只保存模型权重，其实不算完整断点重训，因为恢复后优化轨迹可能已经变了。标准做法一般是这样：

checkpoint = {
    "model_state_dict": model.state_dict(),
    "optimizer_state_dict": optimizer.state_dict(),
    "scheduler_state_dict": scheduler.state_dict(),
    "epoch": epoch,
    "global_step": global_step
}
torch.save(checkpoint, "checkpoint.pt")

恢复的时候：

checkpoint = torch.load("checkpoint.pt")
model.load_state_dict(checkpoi

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.

全部评论

推荐最新楼层

04-11 12:40

香港中文大学（深圳）人工智能

【实习】高通一面复盘

项目经历之外，也问了基础和端侧 AI Agent 理解这场高通一面整体给我的感觉是，节奏比较平，先从自我介绍和项目经历展开，然后慢慢转到计算机基础、Agent 理解、岗位匹配度和实习安排这些内容。不是那种一上来就连续追问很深的底层细节，更像是在确认你的背景是不是和岗位方向对得上，以及你是不是具备继续做这类工作的基础。开头还是常规自我介绍。我主要讲了自己现在做的方向，包括 AI Infra、底层性能优化、算子开发、图优化这些，也讲了在一段 GPU 软件栈相关实习里做过的几类事情，比如算子性能优化、算子融合、稳定性问题排查，以及在学校里做过的一个量化推理 runtime 小项目。这里我还是尽量把重...

查看13道真题和解析

点赞评论收藏

04-21 01:10

武汉大学 HRBP

同程怎么样呀

有没有友友知道国际酒店供应链商务这个岗怎么样呀？听说同程会卡转正和裁应届，是真的假的呀，概率大概多少呢。有没有在职的朋友可以交流一下呀。

同程旅行稳定性 13人发布

点赞评论收藏

04-17 10:04

已编辑

南京邮电大学运维开发工程师

4.16晚面试同花顺运维开发

和面试官聊的挺好，他说后续会有hr找我，但我这边没收到后续，难道被横向了？

点赞评论收藏

04-12 11:00

门头沟学院运营

随记

这段时间被面试面的绝望。今天和一个搞操作系统内核的大佬聊了一下，怎么说，他说只能分析一下大概的，具体的他也不懂我们这个专业。因为他是物联网毕业的走的社招，然后我是机器人工程的想搞嵌入式走的校招。就是现在很多岗位不需要那么多人，因为有ai的参与。然后同类竞争者，也不是说有一个具体的标准去衡量你做到什么程度才能上岗，hr可能就是觉得上一个和你一比觉得他更好就pass你了。然后现在主要是多做开源项目，多搞一些有用的竞赛，把简历的项目好好打磨一下，现在也可以不问其他人然后不懂的地方去问ai也是够的。还有就是现在岗位比较饱和，还是要找认识的人内推比较容易一些。他说他给我的可能就是一些心理辅导和广泛的建议。他当时也是什么都找不到疯狂海投。怎么说呢，我觉得我确实这段时间被接二连三的面试搞烂了心态，情绪很重了😭😭😭但是哭也没用，毕竟还要向前走，就业市场不会因为个人情绪就收我。

点赞评论收藏

04-21 14:33

北京邮电大学 Java

别再调 API 就说自己会 RAG 了，看看真正的企业级 AI 智能体长什么样

AI 这波浪潮来得太快了。半年前面试还在聊微服务和高并发，现在面试官张口就是：RAG 怎么做的？Agent 的执行链路是什么样的？你的检索策略是怎么设计的？会话记忆怎么控制 Token 成本？这些问题已经不是加分项了，而是越来越多 JD 里的硬性要求。但现实是，大部分人接触 AI 的方式还停留在"调 API"的阶段——跟着教程往向量库里塞点数据，让大模型吐一段话，截个图发朋友圈说自己"做过 RAG 了"。面试官稍微追问两句就露馅：文档怎么切的？检索召回率低怎么办？幻觉怎么控制？一问三不知。跑通一个 Demo 和做出一个能上线的系统，中间差的不是几行代码，...

AI项目实战

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

# 大学四年该怎么过，才不算浪费时间？ #

# HR问：你期望的薪资是多少？如何回答 #

Momenta AI Agent开发 一面

1、自我介绍

2、项目介绍

3、离线数据处理咋做的

4、训练数据接入规范

5、阶段模型效果验证咋做

6、失败样本回流有做吗

7、断点重训咋做

全站热榜

创作者周榜

Momenta AI Agent开发一面