A厂 Agent开发 一面面经题目整理

1.自我介绍。

2.你目前还在实习吗?你参与的实习吗?你参与的 AI 产品主要面向什么问答场景、包含哪些问题类型?

3.处理查询文档里的异构数据(如图片)时,具体的处理流程是什么?解析成纯文字后如何进一步加工?这样只返回文字给用户,图片信息不会丢失吗?

4.你们是通过人工打标建立图片和文本的对应关系吗?文档量很大的情况下,打标工作能完成吗?

5.如何保证大部分图片异构数据解析后回答的正确性?若回答错误,怎么识别问题?后续要验证回答准确性,你有什么方案?

6.用于评测的另一个大模型,如何构造问题、分析文字并进行对比?这个大模型的正确率以及模型自我一致性怎么确定?

7.你们的模型基于哪些异构图像做增强?模型会不会产生幻觉,生成文档外的内容?

8.若用户的问题不在文档里,你们会怎么处理?是调用其他模型吗?大模型回答不了时,会提示用户补充问题吗?用户补充后仍无法解决该怎么办?模型如何判断何时需要让用户补充提问?

9.你们有框架编排这些流程吗?用的是什么框架?

10.你简历中提到的识别率、检索召回率等指标,怎么理解检索召回率?这些指标具体包含哪些评价项?什么是忠实度?召回率的分子分母是怎么定义的?

11.你之前那段实习的具体工作内容是什么?针对设备故障叙述报告这类复杂文本,模型如何理解?是做了相关检测吗?大模型是怎么实现术语解释的?

12.请讲一下 LoRA 技术,除了减少参数量,它还有什么优点?你做的 LoRA 相关工作,后续有落地应用吗?

13.你写代码主要用 Python 吗?会不会用 Java?了解 Java 的多线程、双亲委派模型以及消息中间件吗?有没有做过 Java 相关项目?

14.你用过 LangChain 吗?如何用它解决模型的幻觉问题?若不熟悉 LangChain,还能通过什么方法做 AI 能力增强?

15.让你实现一个查询天气的对话 AI 顶层设计,具体步骤是什么?聊天记录最终如何返回给用户?除了文本存储,还有其他方式吗?多模态的具体实现方法是什么?

16.天气大模型要关联地理位置信息(如杭州属于中国),该怎么处理?如何对接天气 API?怎么定义 API 调用的相关内容?

17.若查询天气后,还要根据天气推荐买伞这类服务,大模型如何按顺序调用多个服务?如果有七八项服务,每个服务的调用逻辑都要单独写吗?

18.LangChain 和 LlamaIndex 的区别是什么?

19.如何测试这个 AI 系统的技能?它和传统 AI 测试有什么区别?有哪些具体的测试方案?评测数据集该怎么构建?测试具体分哪些步骤,要验证哪些能力?

20.要让模型完成“在公司周边奶茶店(如霸王茶姬)订一杯奶茶”的任务,该怎么实现?若调用高德 API 做定位和门店查询、调用外卖平台 API 下单,这两个 API 该怎么对接?编写大模型让它按顺序调用 API,可能会遇到什么问题?怎么解决?

21.若高德 API 要求输入经纬度坐标,但大模型产生幻觉输出错误公司坐标,导致门店查询错误,该怎么干预模型?如果模型坚持认为自己的坐标是对的,该怎么处理?定位到问题原因后,又该怎么解决? #聊聊Agent开发#
全部评论
?你这是校招吗?感觉像是社招已经干过完整系统项目的啊
1 回复 分享
发布于 03-10 21:32 广东
秋招进度如何
点赞 回复 分享
发布于 03-04 11:16 北京
感觉是新型岗位
点赞 回复 分享
发布于 02-27 13:58 四川
大佬看看简历
点赞 回复 分享
发布于 02-24 08:38 江苏
借楼,谢谢!!希望对大家有帮助。 帮转-小红书视频剪辑Agent开源项目 帮转-求star FireRed-OpenStoryline 基于本地部署项目,使用起来更丝滑哦 github开源链接: https://github.com/FireRedTeam/FireRed-OpenStoryline/tree/main hugging face网页版体验链接: https://fireredteam-firered-openstoryline.hf.space/ RedTech公众号宣传推文: https://mp.weixin.qq.com/s/tr-SEjZp6fNVS6IrjIbCRg
点赞 回复 分享
发布于 02-12 22:30 江西
眼花缭乱了
点赞 回复 分享
发布于 02-12 20:31 山东
点赞 回复 分享
发布于 02-10 16:09 天津
看完瑟瑟发抖
点赞 回复 分享
发布于 02-10 16:08 山东
眼花了
点赞 回复 分享
发布于 02-10 16:08 黑龙江

相关推荐

02-27 11:25
门头沟学院 Java
有面试过同岗的朋友欢迎评论区交流!1.若用户量大幅增长,实习的项目相关系统能否应对,瓶颈是什么?2.你平时会使用大模型处理哪些任务,觉得大模型在哪些任务上处理得好,哪些任务处理得不好?3.你做的另一个项目的核心目标和整体架构是什么?4.你做的另一个项目是生成文档还是生成核心代码?5.你做的另一个项目若工业界落地失败,会如何处理?6.你做的另一个项目在记忆模块设计上有什么思路,如何让相关技能更好地发挥作用?7.你做的另一个项目中,模型是如何选择的,有什么选择依据或方法?8.大模型幻觉问题该如何处理,服务化过程中会产生哪些相关问题?9.你做的另一个项目现在能否在本地运行?10.RAG的优缺点有哪些?11.多任务相关模型有什么适用场景?12.常见的Agent产品有哪些特质?13.若发现项目中模型执行不成功,会如何处理?14.长期记忆相关设计中,关键关注点有哪些?15.从整体设计角度,长期记忆相关功能会从哪些角度考量?16.长期记忆相关设计还有哪些可优化的点?17.Agent领域的发展趋势是什么?18.若代码生成成本越来越低,工程师的核心竞争力会发生什么变化?19.平时会通过哪些渠道关注AI技术动态?20.最近有没有遇到让你觉得印象深刻的AI应用,其情节或功能有较大亮点?21.进入项目后遇到新的工具技术,会如何评价技术是否能解决问题?
查看21道真题和解析
点赞 评论 收藏
分享
自我介绍以后开始拷问:项目:1,如何做到筛选视频困难样本的(只有这个答得有点曲折,也记不清项目里面是怎么做的了,其他答得还好的都记不清了,后面也知道了这个经历和公司业务内容强相关)八股:A。面试官说先从Python基础问起(问之前还确认了我用C还是用Python):1,Python里面可变对象跟不可变对象的一个区别,及其含义,以及模型训练当中怎么用2,Python里面可变对象包括什么,元组算不算可变对象3,对上一个的follow up:可变对象和不可变对象的本质区别?也即list能不能作为哈希表的key?(可能因为上一个问题答得隔靴搔痒没有切中面试官的心意)4,什么是全局解释器锁GIL,在这种情况下怎么进行多线程编程5,什么情况下会用多进程什么时候会用多线程6,多进程之间做并发的话怎么去做数据共享以及同步互斥(一开始自己回答了Lock,后来面试官提示是多线程之间做的并发,于是端上了Event和Semaphore Quene等)7,了解过Python装饰器的作用吗,在代码里面有没有用过,它的原理是什么8,Python在数据处理当中常见的性能优化手段9,10个T的视频数据浏(浏览数据或者点赞数据),想去统计这些数(每个视频的观看人数和点击人数)。这个东西用Python来写的话,会怎么去写(后续补充:在本地的机上面处理,而不是说用分布式那种那个来处理。10个T还不至于一定要上分布式)B,计网:1,HTTP跟HTTPS区别和联系C,数据库1,了解数据库事务吗,简单讲讲2,LEFT JOIN 和INNER JOIN的区别(但是本人对数据库实在不熟不知道有没有听错问啥……)D,大模型Transformer里面会用那个Flas Attention跟那个Paged Attention去优化,它们的那个区别跟那个原理是什么代码手撕:最长回文子串,不过是直接返回子串面试官看我补全代码以后捉了点bug就没说别的了,问了问时间复杂度以及有没有比动归更好的解法(此外我听过一个说法,说如果面试官直接问你hot100原题就是很想招你进来了,我不清楚)反问环节:1,这个实习岗位具体做什么?业务场景是什么?——主要围绕 TikTok 直播的音视频内容理解与标签体系建设。在连麦、试音等场景下,对内容进行识别后自动打玩法/分类/风格等标签。目标是提升标签质量(准确率/覆盖率等)并推动自动化。工作会包含线上推理服务与工程链路设计,配合策略/算法团队做模型与策略调优2,使用什么模型对数据打标签?开源还是闭源?——同时会做开源与闭源大模型的对比实验,效果好的方案会通过实验与切流获得更多流量。根据内容来看感觉这个应该是加了AI调用和提示词工程的python后端开发,整体更偏工程,也无怪乎大模型这块也就问了这么点btw喜茶的提拉米苏浓巧好喝
查看17道真题和解析
点赞 评论 收藏
分享
评论
11
95
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务