AI岗面试必问,附上我的回答思路

一、Agent模块(秋招顶流!大厂会轮番追问)

  1. 为什么做Agent项目?(结合岗位说,比如“想解决XX场景的效率问题,刚好贴合贵司AI落地方向,还能锻炼推理和工程能力”)
  2. 讲下你的Agent项目?(必追问预警:难点咋解决的?踩过啥坑?落地有啥数据效果?别只说“做了啥”,重点说“解决了啥问题”)
  3. 演示下Agent项目实现细节?(划重点:别只说“用了LangChain”,面试官要听具体的!比如核心代码逻辑、用的框架版本、部署时卡在哪了,怎么解决的)
  4. Agent开发框架咋选?LangChain/LLaMA Index/AutoGPT/Chroma,你为啥选这个?(避坑:别只吹优点,提一嘴框架的小缺点,再说说你怎么规避的,显得你很懂)
  5. Agent的“自主性”咋实现的?(冷门坑题!字节、百度常问,结合记忆机制、推理决策、技能调用说,不用太复杂,说清逻辑就行)
  6. 还有其他Agent范式不?(反应式、目标导向、分层、协作式)你项目用了哪种?为啥适配?(别死记定义,结合你做的项目说,比如“我做的任务需要分层拆解,所以用了分层范式”)
  7. Agent项目背景是啥?(必追问:市场上同类产品有啥短板?你做的项目牛在哪?突出你的产品思维,面试官很吃这一套)
  8. Agent推理模式有哪些?(少样本、链式、反向、树状)各自适合啥场景?咋做差异化设计?(举个小例子,比如“简单任务用少样本,复杂任务用链式推理”,更直观)
  9. 推理模式咋选?咋实现动态切换?(答题技巧:结合任务复杂度、数据量、响应速度说,比如“任务简单就用少样本,复杂了就自动切换成链式推理”)
  10. 多Agent执行策略怎么选?怎么切换?(必追问:任务咋分配?冲突咋解决?有没有容错机制?结合你项目里的实操说,别空谈理论)
  11. 跨模块错误追踪的Agent知识库咋建?(说点实在的:数据从哪来、怎么清洗、检索咋优化、错误咋反馈,一步步说,面试官爱听细节)
  12. 基于代码构建知识库的Agent咋设计?(补细节:用啥工具解析代码、知识库索引咋优化、能不能适配多语言,这些都是面试官会追问的)

二、大模型相关(所有AI岗必问,别只关注老模型!)

  1. 主流大模型有哪些?(开源+闭源,别只说GPT-4、文心一言!补最新的:Qwen-2、Llama 3、Gemini 1.5、GPT-4o,各自的特点说两句,比如“Qwen-2开源,适合企业部署;GPT-4o准确率高,适合复杂任务”)
  2. LLM为什么会产生幻觉?咋解决?(分三层说,好记:数据层面——训练数据有错误;模型层面——推理逻辑有问题;应用层面——没有约束,解决方案对应着来,比如“数据层面清洗数据,应用层面加Prompt约束”)
  3. 模型预热是什么?为什么要预热?咋实现?(大白话:预热就是提前加载模型,避免首次调用太慢,实现方案:批量请求预热、模型缓存、负载均衡,结合项目说)
  4. 长文本生成怎么做?(解决碎片化问题:滑动窗口、注意力压缩、多轮续写+连贯性校验,比如“把长文本分成小块,逐块生成,再做连贯性调整”)
  5. 大模型怎么量化部署?(有点冷门!工程岗必问:INT4/INT8量化、模型蒸馏,比如“用INT8量化,模型体积变小,部署更高效,准确率略有下降但不影响使用”)
  6. 大模型微调怎么做?(必追问:数据咋准备?超参数咋设?效果咋评估?比如“用行业相关数据微调,超参数学习率设0.001,用测试集对比微调前后的准确率”)

三、Prompt工程与多轮对话(应用岗非常高频)

  1. 如何写好Prompt?(核心原则:清晰、具体、有约束、给示例,每个原则配个小模板,比如“让模型生成NL2SQL:‘基于表user,查询年龄大于25的用户姓名,输出SQL语句,不要多余解释’”)
  2. 你做Prompt工程有什么经验?(必追问:咋优化Prompt的?比如“从模糊到具体,加约束条件,多轮迭代,比如一开始Prompt太笼统,模型输出混乱,加了具体要求后,准确率提升了40%”)
  3. 写两个Prompt示例?(高频场景,直接抄:1. NL2SQL:“基于表order,查询2024年10月的订单数量,输出SQL语句,仅返回SQL,不添加任何说明”;2. 代码查bug:“以下Python代码有bug,请找出bug并修改,说明修改原因,代码:xxx”)
  4. 多轮对话如何实现?(解决模型遗忘问题:上下文压缩、历史信息筛选、歧义处理,比如“只保留最近5轮有效对话,压缩冗余信息,遇到歧义就追问用户”)
  5. Prompt注入有什么风险?怎么防护?(冷门!应用岗必问:风险是恶意Prompt让模型输出不当内容,防护:过滤恶意输入、设置Prompt白名单、添加安全约束)
#AI求职实录#
全部评论
接好运
1 回复 分享
发布于 03-03 21:19 北京
蹲蹲面经
1 回复 分享
发布于 03-03 21:19 北京
接好运
1 回复 分享
发布于 03-03 18:11 北京
点赞 回复 分享
发布于 03-06 08:21 美国
跟着牛佬好好学习 天天向上
点赞 回复 分享
发布于 03-04 21:05 广东
框架选型细节?
点赞 回复 分享
发布于 03-03 21:18 北京
很有价值!
点赞 回复 分享
发布于 03-03 18:36 北京
哇!学到了学到了,可以出一个针对这些问题更详细的解读下嘛,想直接背下来
点赞 回复 分享
发布于 03-03 18:15 北京

相关推荐

04-09 17:45
门头沟学院 Java
一、自我介绍与项目深挖做一下自我介绍。简单讲一个你最有代表性的项目,你在其中解决的最关键问题是什么?结合实习或项目,做细节追问(工作流、职责、决策、挑战等)。二、Agent 与提示工程相关提示词模板是怎么设计与迭代的?你如何判断一个模板真的变好了?你们的 Agent 是单 Agent 还是多 Agent?为什么这么设计?有没有考虑过替代方案?Agent 的任务是怎么拆分的?拆分粒度是怎么决定的?上下文是如何构建的?你们怎么避免上下文过长或信息污染?如果上下文窗口不够,你会优先保留哪些信息?为什么?三、代码理解与单测生成(工程场景)做代码理解时,AST、调用关系这些信息是怎么用起来的?单测生成里,哪些代码不适合生成单测?你们是如何识别并过滤的?覆盖率高但测试质量很差,你见过吗?你们是如何解决的?mock 在单测里什么时候是必须的?什么时候反而会带来问题?如果一个函数同时依赖数据库和 RPC,你怎么让模型生成的单测稳定运行?你们如何评估生成单测的质量? 除了覆盖率,还有哪些指标有效?四、LLM 基础与 Transformer 细节LLM 的输入到底是什么?模型真正看到的内容包含哪些?self-attention 的核心作用是什么?为什么要拆成 Q、K、V?为什么 attention 能建模长距离关系?为什么需要 multi-head?attention 为什么可以看成动态加权?同一个 token 的 Q、K、V 为什么不相同?attention 复杂度很高,当上下文特别长时,你会怎么优化?模型产生幻觉的常见原因是什么?工程上有哪些方法可以降低幻觉?五、后端与系统基础Python 有多线程吗?GIL 是干嘛的?什么时候多线程才是有用的?讲一下 C++ 从源码到可执行文件的完整编译流程。六、算法题(手撕)给定一个数组 nums,计算所有子数组的中位数之和。定义:如果子数组长度为奇数:中位数 = 排序后中间的数。如果为偶数:中位数 = 排序后靠左的那个数。要求:计算所有子数组的中位数之和。
查看24道真题和解析
点赞 评论 收藏
分享
04-16 15:44
厦门大学 Java
一、面试官问题清单(共24题)(一)AI相关问题(6题)1. 若AI回答出现错误/幻觉,有哪些优化方案?2. 常规AI Agent的核心组成模块/能力模块有哪些?3. AI Agent的记忆机制分为哪几类?4. 长期记忆和短期记忆分别有哪些?5. RAG属于长期记忆还是短期记忆?6. 是否了解React框架?(二)Java相关问题(7题)1. JDK 1.8中ConcurrentHashMap的底层实现原理?2. JVM运行时数据区域的组成部分?3. OOM(内存溢出)的排查思路?4. Java中sleep和wait方法的区别?5. synchronized的作用和底层原理?6. Volatile的作用和底层原理?7. MySQL事务的四大特性是什么?(三)数据库&缓存相关问题(4题)1. MySQL事务四大特性的实现方式?2. MySQL索引的底层数据结构?3. B+树的结构是怎样的?4. Redis中Zset的底层实现?5. 跳表的节点晋升机制是怎样的?(四)Spring相关问题(2题)1. Spring有哪些依赖注入的方式?2. Bean的作用域有哪些?(五)计算机网络相关问题(3题)1. 计算机网络5层协议模型及每层协议(可讲OSI七层模型)?2. Cookie和Session的区别?3. HTTPS如何保证安全性?4. HTTPS四次握手的流程?(六)算法题(1题)算法题 无重复字符的最长子串 哭死了一个地方一直没调出来,最后面试官让我讲下思路就下了ps:记错时间让面试官白等我8分钟,还是hr 打电话过来提醒才知道。真心向面试官道歉😭😭
查看25道真题和解析
点赞 评论 收藏
分享
评论
30
197
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务