agent开发常见任务

做 RAG(知识库智能体)
几乎所有公司都要:爬文档、清洗数据;切分文本、向量化;搭检索、优化召回率;解决 幻觉、答非所问
这是 Agent 实习最常见、最容易上手的活。
#聊聊Agent开发#
全部评论

相关推荐

02-28 19:07
已编辑
成都理工大学 后端工程师
一面2.12一面是产品leader面的,整体来说偏业务面试官叫我共享屏幕演示Agent平台1 你的这个Agent平台做了什么?2 Agent平台的盈利模式是什么?3 平台的用户画像?4 做这个项目的核心目标是什么?5 实习中的规则引擎解决了什么问题?6 场景题:给出一个关于广告创意平台的场景,如何设计Agent赋能7 了解过哪些Agent框架主要是说了python的一些框架8 整体职业规划二面(技术面)2.271 个人信息:- 请做一个自我介绍。- 在你的项目里,挑一个技术难度大或有成就感的点介绍一下。- 你的技术栈主要是Java,对其他语言有接触吗?- 你平时工作中用过哪些AI编程工具?- 对Python掌握如何?相比Java有什么优势或劣势?- 如果要做Go开发,你介意转语言吗?- 对Go有哪些了解?说了一下协程和虚拟线程,提了一下Go用于云原生比较多2 实习:- 多版本快照模型和乐观锁解决并发更新问题,你们是怎么处理的?- 回滚时如何保证线上实例不受影响?- RTE从150ms降到25ms,你们如何定义和拆分核心链路和非核心链路?- 非核心链路执行失败,如何保证核心链路的数据一致性?- 应用程序关闭优化,进程关闭耗时325秒,你们是如何监控的?- 业务池未响应,具体原因是什么?- 关闭长任务时的数据一致性如何保证?- 使用本地消息表如何在重启后恢复数据?3 Agent项目- MCP网关实现协议转换,你们的MCP协议解决了什么问题?- 大模型(LLM)的熔断和降级是如何处理的?- 多跳检索是怎么实现的?循环检索策略是什么?4 MySQL和Redis- MySQL、Redis使用频率及场景是什么?- MySQL的InnoDB为什么用B+树做索引?- 联合查询索引怎么建?- 如果只用联合索引的非最左字段查询,会失效吗?总结归纳了MySQL索引失效了根本原因是破坏了索引的有序性- MySQL事务一致性是如何保障的?这里延申比较多,从ACID开始答,提到了SQL语句执行顺序和WAL,最后说了一下怎么选择事务隔离级别- Redis常见的数据结构有哪些?- 排行榜类型的数据结构应该用哪种?为什么?- MySQL和Redis之间如何保证数据一致性?没有说太多具体方案,主要是提了一下自己的理解5 平时怎么使用AI工具?
点赞 评论 收藏
分享
发一下问题给大家参考,攒攒人品!1*Agent与Workflow的区别是什么?在实际业务中,你会根据什么标准选择对应的方案2*设计一个企业级Agent架构,如何实现 BFF、Tool Server 与 Worker 的多组件拆分3*在企业级Agent中,怎么实现安全与隔离?权限管理、审计与日志追踪具体的落地方案是什么?4*说一下什么是MCP?它在Agent生态中解决了什么痛点?5*MCP 有哪些具体的分类?Transport 层是怎么工作的?如何开发一个 MCP Server?6*谈谈你对 Claude Code、Manus 这类 Agent 产品的理解,它们的架构逻辑与传统 Chat Agent 有什么差别?它工程部分的能力是怎么实现的?7*如何实现 Claude 的 Agent Research 方法论?Deepsearch 场景下需要配备哪些工具?基础设施与安全挑战在哪里?8*在多轮对话中,分别实现 Short-term memory、Long-term memory 与 Task memory怎么做?9*上下文机制的完整实现流程是怎样的?说一下它的写入策略、读取策略以及 Rerank 的做法是怎么样的。10*当上下文超过 Token 限制时,组合使用 Rolling Summary、State Extraction 与 RAG 这三段式策略?11*说一下Prefix Caching 和 KV Cache 的原理。为什么缓存的是 K 和 V 而不是 Q?不再计算前缀具体节省了哪部分算力?12*引入 Prefix Caching 后,Attention 的计算复杂度是怎么下降的?13*Few-shot在Agent评测中是为了提升能力还是降低方差?在评测Pipeline的哪个阶段注入?如何防止过拟合?14*对比一下Transformer中Self-attention与FFN的作用差异。15*为什么 Prefix Caching 只能优化 Attention 部分,而无法优化 FFN 部分?16*从 Softmax 的数学角度解释,为什么在计算过程中加上负无穷就能让注意力权重变为 0?17*什么是掩码?你分别说一下Causal Mask与 Padding Mask 的作用是什么。
查看17道真题和解析
点赞 评论 收藏
分享
发一下问题给大家参考,攒攒人品!有面试过同岗的朋友欢迎评论区交流1.实习拷打2.项目拷打3.处理查询文档里的异构数据(如图片)时,具体的处理流程是什么?解析成纯文字后如何进一步加工?这样只返回文字给用户,图片信息不会丢失吗?4.你们是通过人工打标建立图片和文本的对应关系吗?文档量很大的情况下,打标工作能完成吗?5.如何保证大部分图片异构数据解析后回答的正确性?若回答错误,怎么识别问题?后续要验证回答准确性,你有什么方案?6.用于评测的另一个大模型,如何构造问题、分析文字并进行对比?这个大模型的正确率以及模型自我一致性怎么确定?7.你们的模型基于哪些异构图像做增强?模型会不会产生幻觉,生成文档外的内容?8.若用户的问题不在文档里,你们会怎么处理?是调用其他模型吗?大模型回答不了时,会提示用户补充问题吗?用户补充后仍无法解决该怎么办?模型如何判断何时需要让用户补充提问?9.你们有框架编排这些流程吗?用的是什么框架?10.怎么理解检索召回率?这些指标具体包含哪些评价项?什么是忠实度?召回率的分子分母是怎么定义的?11.你之前那段实习的具体工作内容是什么?针对设备故障叙述报告这类复杂文本,模型如何理解?是做了相关检测吗?大模型是怎么实现术语解释的?12.请讲一下LoRA技术,除了减少参数量,它还有什么优点?你做的LoRA相关工作,后续有落地应用吗?13.你写代码主要用Python吗?会不会用Java?了解Java的多线程、双亲委派模型以及消息中间件吗?有没有做过Java相关项目?
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务