今天 16:11 黑龙江大学 Java 发布于山东

关注

agent实习都干什么？深入了解项目构成(二)

在前文agent实习都干什么？深入了解项目构成(一) 对日常工作进行了大概的分享后，本文是我在工作中对于方案设计的一些小思考和对于架构的粗浅理解，希望和大家共同讨论进步(完全脱敏)。

一、方案设计(以敏感词为例)

敏感词审核作为功能模块的组成，其本身多聚焦于与文档进行交互，需同时满足“实时响应”和“高覆盖率”，因此架构设计阶段确定AC自动机+AI双轨方案：

AC自动机做基础筛查：合同审核场景下敏感词库规模庞大，AC自动机针对文档识别时间复杂度为O(n)（n为文档长度），能以低于10s的延迟完成固定敏感词的字面匹配，满足高并发下的效率要求，但仅能识别精准匹配的词汇，无法处理谐音、变体或语义衍生的隐性违规表达，同时受限于本身机制，仅能匹配完整的敏感词，如果存在AABB和AA类型的敏感词，则AA通常无法识别。
AI做补充校验：基于行业微调的大模型能识别“套现→套取现金”等语义衍生违规、“氵包娼”等变体表达，弥补AC自动机的覆盖率短板；双轨结果交叉验证，既保证基础审核效率，又将敏感词漏检率降低80%以上。

二、文档切块策略：语义切块+最长一页限制

在POI解析文档内容、AI模型处理文本的全流程中，token限制是核心约束：

token限制的核心影响：一方面，POI解析长文档时，单次处理过长篇幅易导致内存溢出；另一方面，主流大模型（如Qwen3、deepseek）存在token上限（如4096），超出上限会触发截断，导致上下文丢失。
语义切块+最长一页的设计逻辑：按语义切块：以段落、条款为最小单位拆分文档，避免将“合同有效期”“违约责任”等完整语义单元截断，防止AI误判或POI解析遗漏关键信息；最长一页限制：单块内容最长不超过一页（约500-800字），既保证单块token数远低于模型上限（预留冗余空间），又控制切块数量，避免多次调用AI导致响应延迟增加。

三、AI效果评估体系

在agent开发中，目前的测试方法极多，如困惑度测试等等，但在指定任务中，通常采取传统评估方法，即通过多维度评估指标量化审核效果，：

核心指标：精准率（避免误判合规条款）、召回率（降低漏检违规内容）、F1值（平衡精准率与召回率）；
效率指标：单文档审核延迟、单块文本处理耗时；
覆盖率指标：敏感词变体识别率、行业特规匹配率。评估方法采用“人工标注测试集+自动化对比”，确保模型效果达标。

总结

架构设计阶段的核心决策均围绕MCP+Agent架构的核心目标展开：AC自动机+AI双轨兼顾效率与覆盖率，语义切块规避token限制，多维度评估体系保障效果可控。这些决策既解决了传统微服务的耦合问题，又适配AI原生特性，最终实现“工具层标准化、逻辑层灵活化”的重构目标。

一图流

#AI求职实录#

全部评论

推荐最新楼层

02-07 18:21

沐瞳科技_游戏策划(准入职员工)

游卡内推，游卡内推码

游卡服务端开发面经（已oc） 一面1.自我介绍2.虚函数和多态3.vector删除一个元素如何实现的，讲讲移动语义，如何回收一个vector的内存（创建一个空的，移动给现在的（挺巧妙））4.讲讲几种智能指针的应用场景、weak_ptr如何保证在使用期间资源不失效的5.socket编程的流程6.进程、线程、协程7.cpu计算密集型任务用多线程还是多协程,为什么8.死锁是什么，如何解决9.每次生成1个1到1亿的随机数、且不重复10.反问二面+hr面1.自我介绍2.实验室项目拷打，做的东西偏底层，为什么想来做游戏3.bustub，为什么用B+树4.了解innodb的页面组织形式吗5.了解mangod...

点赞评论收藏

分享

02-08 18:23

叠纸游戏_UI美术设计(准入职员工)

叠纸游戏内推，叠纸游戏内推码

前端面试问题：1. 自我介绍2. 低代码平台Blocksuit方案，这个技术选型的逻辑3. 物料和数据源连接是用什么样的解决方案，还追了一下数据源的获取4. 团队规模，负责的具体内容，职责之类的5. 你认为前端工程化包括哪些方面？你具体做过哪些6. Git提交，你们有引入什么工具，检测方式来控制不规范提交7. 前端监控埋点方面有做过哪些吗8. 后面的职业规划9. 离职原因10. 排期和人手不够的情况，假设你作为leader，你怎么处理冲突？反问：1. 项目情况，技术栈2. 面试流程叠纸游戏2026校招启动叠纸游戏成立于2013年8月，是一家专注于内容创作的游戏公司。叠纸当前拥有暖暖系列和恋与系...

点赞评论收藏

分享

01-20 16:20

郑州升达经贸管理学院 Java

求助，今年大四，之前没有过实习，简历投出去都说不合适

离上岸不远了的海螺：线程不是县城

实习，投递多份简历没人回...

点赞评论收藏

分享

2025-12-18 09:59

中南大学 Java

网易被鸽穿了吗？已经开始补录了

网易互娱，秋招早早就投了，笔试做的也还行，应该a了快3道，但却是一直不给面试。现在发起了补录计划，是不是被鸽穿了啊。不过看网上的薪资给的确实挺可以的，在杭州，能有33k，已经是t0级别了，大家快冲!

秋招特别不鸣谢

点赞评论收藏

分享

昨天 08:43

蚌埠坦克学院嵌入式软件开发

春节前一般没有人投简历了吧

每年临近春节，招聘市场都会进入一段微妙的“真空期”。不少HR开始收尾年度工作，候选人也逐渐放慢投递节奏，仿佛整个职场都在为新年的到来按下暂停键。对求职者来说，春节前投简历往往显得有些尴尬。一方面，很多公司已经完成年度招聘计划，预算收紧；另一方面，用人部门忙于年终总结与绩效评估，面试安排变得零散甚至停滞。即使投出简历，也可能石沉大海，让人误以为市场“冻结”。但事实上，这并不是完全的停摆期，而是一个低调的缓冲阶段。仍然有公司在悄悄补人，尤其是关键岗位或年后即将启动的新项目。有经验的求职者反而会利用这段时间提前布局，在别人休息时悄悄投递，等待节后第一波面试机会。春节前的求职，更像是一场耐心的比拼。投...

春节前，你还在投简历吗？

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

27届简历点评

27届寒假/转正实习汇总

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 春招什么时候投？ #

6572次浏览 102人参与

# 牛友的春节生活 #

3131次浏览 86人参与

# 春节前，你还在投简历吗？ #

9169次浏览 127人参与

# 实习到现在，你最困惑的一个问题 #

2588次浏览 80人参与

# 牛客AI体验站 #

13832次浏览 259人参与

# 春节提前走，你用什么理由请假？ #

6092次浏览 149人参与

# 从夯到拉，锐评职场mentor #

2323次浏览 47人参与

# 备战春招/暑实，现在应该做什么？ #

2237次浏览 82人参与

# 聊聊Agent开发 #

17721次浏览 454人参与

# 推荐一个值得做的AI项目 #

4844次浏览 145人参与

# 距离春招还有一个月，你现在是什么开局？ #

3585次浏览 71人参与

# 暑期实习什么时候投？ #

4331次浏览 103人参与

# 听劝，这个简历怎么改 #

380559次浏览 1826人参与

# 机械人的秋招小目标 #

28307次浏览 239人参与

# 参加完秋招的机械人，还参加春招吗？ #

108114次浏览 704人参与

# 我的AI电子员工 #

27484次浏览 183人参与

# 实习的内耗时刻 #

221405次浏览 1643人参与

# 腾讯工作体验 #

567738次浏览 3709人参与

# bilibili求职进展汇总 #

180837次浏览 1074人参与

# 找工作，行业重要还是岗位重要？ #

96339次浏览 1837人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务