T厂 Agent开发日常实习一面挂凉经
一上来先是手撕,比较简答,大概做了5分钟。
一、多模态 RAG 与检索评估
多模态预处理中,图片在 RAG 系统里是如何向量化检索的?
多模态预处理环节的技术难点是什么?
如何杜绝跨场景召回相似步骤的问题,具体实现方式是什么?
介绍评估精度和召回率所采用的框架,以及召回率的具体计算细节。
该框架中精度和召回率的计算方式分别是什么,二者的核心区别是什么?
能否只关注召回率而不关注精度,原因是什么?
二、实习项目与意图识别
介绍实习业务方向相关的意图识别模型的实现内容。
意图识别模型具体能解决什么问题,结合实例说明模型效果提升的具体表现。
实习项目中遇到的三个技术问题里,最难的是哪一个,具体难点是什么?
实习项目的数据集是如何构造的?
该实习项目的开发周期是多久,开发人员配置如何?
三、代码生成项目与模型适配
代码生成相关项目的开发目的是什么?
该项目与相关经典框架解决的问题是否相同,核心区别是什么?
相关经典框架为何不支持 Qwen 系列模型,具体问题是什么?
如何让 Qwen 模型正常使用相关工具,具体实现方式是什么?
思考模型与非思考模型的输出除标签外,还有哪些核心区别?
如何解决 Qwen 思考模型产生错误工具调用、空工具调用的问题?
项目中遇到的核心挑战是否与相关经典框架解决的问题一致?
该项目是完全自研还是参考相关实现,具体做了哪些内容和思考?
四、Agent 记忆体系(长 / 短期记忆)
模型多轮对话的历史记录中,长期记忆和短期记忆由谁定义、如何区分?
长期记忆和短期记忆的判断主体是谁,判断的指标是什么?
长期记忆的维护需要哪些策略或算法,具体如何维护?
长期记忆是否需要做处理,是直接保留对话内容还是总结后保存?
长期记忆的总结工作由谁实现,总结的触发时机和算法是什么?
结合发现的问题和采取的措施,继续介绍项目后续的开发内容和思路。
模型调用搜索工具的优化实现效果如何,与未使用工具前的核心区别是什么?
项目中状态机的能力具体是如何体现的?
大模型如何感知状态机的当前状态?
短期记忆的 5 轮对话指原始对话还是整理后的内容,短期记忆如何转化为长期记忆?
触发短期记忆转化为长期记忆的条件是什么,如何结合短期记忆和已有长期记忆生长新的期记忆?
长期记忆的淘汰算法是否为先进先出,该算法是否存在问题?
针对长期记忆先进先出算法的潜在问题,是否有新的优化思路?
长期记忆是否一定要淘汰,能否通过检索方式调取而非丢弃,该思路的可行性如何?
长期记忆占用模型上下文窗口会导致输出窗口压缩,该问题的优化方向是什么?
五、RAG 与代码助手落地
项目中 RAG 的作用是什么,其调用时机是怎样的?
该代码生成相关项目整体的技术难点是什么?
现阶段各类大模型代码助手平台大规模落地使用的最大难点是什么,解决哪个核心问题才能实现规模化应用?
如何解决大模型对大代码量项目理解不足、易出错的问题?
代码助手在代码检索时,如何高效找到与问题相关的依赖并提供给大模型?
现阶段为何少有框架做代码依赖相关的优化工作,核心原因是什么?
若要解决代码依赖难以查找、模型无法理解整体代码库的问题,除构建图谱外还有哪些方法?
六、模型训练与技术拓展
介绍实习过程中做的模型后训练相关工作,具体实现方式是什么?
基于 400 条回答不佳的真实数据,如何将其用于模型训练?
仅靠 400 条数据难以训练出靠谱模型,如何将数据集扩展到 1 万条,具体的扩展过程是什么?
介绍近期看过的技术相关文章,说明其核心内容和解决的问题。
该技术框架与其他同类框架(如 Agent 相关框架)的核心区别是什么?
介绍毕业论文的研究方向和核心内容。
能否立即到岗实习,实习的可到岗时间是怎样的? #Agent面试会问什么?#
一、多模态 RAG 与检索评估
多模态预处理中,图片在 RAG 系统里是如何向量化检索的?
多模态预处理环节的技术难点是什么?
如何杜绝跨场景召回相似步骤的问题,具体实现方式是什么?
介绍评估精度和召回率所采用的框架,以及召回率的具体计算细节。
该框架中精度和召回率的计算方式分别是什么,二者的核心区别是什么?
能否只关注召回率而不关注精度,原因是什么?
二、实习项目与意图识别
介绍实习业务方向相关的意图识别模型的实现内容。
意图识别模型具体能解决什么问题,结合实例说明模型效果提升的具体表现。
实习项目中遇到的三个技术问题里,最难的是哪一个,具体难点是什么?
实习项目的数据集是如何构造的?
该实习项目的开发周期是多久,开发人员配置如何?
三、代码生成项目与模型适配
代码生成相关项目的开发目的是什么?
该项目与相关经典框架解决的问题是否相同,核心区别是什么?
相关经典框架为何不支持 Qwen 系列模型,具体问题是什么?
如何让 Qwen 模型正常使用相关工具,具体实现方式是什么?
思考模型与非思考模型的输出除标签外,还有哪些核心区别?
如何解决 Qwen 思考模型产生错误工具调用、空工具调用的问题?
项目中遇到的核心挑战是否与相关经典框架解决的问题一致?
该项目是完全自研还是参考相关实现,具体做了哪些内容和思考?
四、Agent 记忆体系(长 / 短期记忆)
模型多轮对话的历史记录中,长期记忆和短期记忆由谁定义、如何区分?
长期记忆和短期记忆的判断主体是谁,判断的指标是什么?
长期记忆的维护需要哪些策略或算法,具体如何维护?
长期记忆是否需要做处理,是直接保留对话内容还是总结后保存?
长期记忆的总结工作由谁实现,总结的触发时机和算法是什么?
结合发现的问题和采取的措施,继续介绍项目后续的开发内容和思路。
模型调用搜索工具的优化实现效果如何,与未使用工具前的核心区别是什么?
项目中状态机的能力具体是如何体现的?
大模型如何感知状态机的当前状态?
短期记忆的 5 轮对话指原始对话还是整理后的内容,短期记忆如何转化为长期记忆?
触发短期记忆转化为长期记忆的条件是什么,如何结合短期记忆和已有长期记忆生长新的期记忆?
长期记忆的淘汰算法是否为先进先出,该算法是否存在问题?
针对长期记忆先进先出算法的潜在问题,是否有新的优化思路?
长期记忆是否一定要淘汰,能否通过检索方式调取而非丢弃,该思路的可行性如何?
长期记忆占用模型上下文窗口会导致输出窗口压缩,该问题的优化方向是什么?
五、RAG 与代码助手落地
项目中 RAG 的作用是什么,其调用时机是怎样的?
该代码生成相关项目整体的技术难点是什么?
现阶段各类大模型代码助手平台大规模落地使用的最大难点是什么,解决哪个核心问题才能实现规模化应用?
如何解决大模型对大代码量项目理解不足、易出错的问题?
代码助手在代码检索时,如何高效找到与问题相关的依赖并提供给大模型?
现阶段为何少有框架做代码依赖相关的优化工作,核心原因是什么?
若要解决代码依赖难以查找、模型无法理解整体代码库的问题,除构建图谱外还有哪些方法?
六、模型训练与技术拓展
介绍实习过程中做的模型后训练相关工作,具体实现方式是什么?
基于 400 条回答不佳的真实数据,如何将其用于模型训练?
仅靠 400 条数据难以训练出靠谱模型,如何将数据集扩展到 1 万条,具体的扩展过程是什么?
介绍近期看过的技术相关文章,说明其核心内容和解决的问题。
该技术框架与其他同类框架(如 Agent 相关框架)的核心区别是什么?
介绍毕业论文的研究方向和核心内容。
能否立即到岗实习,实习的可到岗时间是怎样的? #Agent面试会问什么?#
全部评论

感觉问的可以呀
这agent面试这么难,这是要结合背后的算法
相关推荐
查看12道真题和解析 点赞 评论 收藏
分享