淘天暑期实习-AI应用开发二面 1h

继续来分享下最近的面经~欢迎友好讨论,信息共享
1.实习拷打
2.有没有召回的准确率之类的过程指标
3.评测机制是怎么构建的,评测集是怎么构建的
4.人工标注的话,大概多少条呢
5.你说召回率75%,那剩下的25%是什么原因呢
6.第二段实习你做过多Agent的设计是吗?讲一下单Agent和多Agent的差异
7.调研过程中,对一些任务编排有了解过吗
8.RAG的原理如何理解
9.你的prompt提示词模板怎么管理的
10.每次更新有没有版本的概念
11.第一段实习中的自研大模型,有没有和别的通用大模型作对比
12.你们最终衡量这个项目的结果时,用什么指标衡量的
13.LocalLife是你自己做的项目吗,说一下其中的function Calling完整的工作流
14.如果用户的询问中命中了两个函数,那系统调用的逻辑是怎样的
15.定义了几个function供大模型调用,如何设计的
16.会不会出现不同function之间,描述有歧义或冲突
17.function Calling和Agent的区别
18.如果将你的LocalLife升级成一个Agent的体系结构,你觉得还要做哪些事
19.举一个用AI编程工具完成的比较复杂的一个开发任务
20.对AI代码的审查你用的是开源框架还是什么方式
21.利用AI进行的模块设计中,有用到一些设计模式之类的吗
22.单Agent和多Agent的使用场景
23.电商场景下,会涉及到商品的图文分类,那么你会如何设计这样一个自动分类的系统
24.用秒杀场景类似的思路,对Agent的很多接口调用,做一个接口限流
如果要控制成本,对不同的大模型,也需要做一个差异化限流(比如轻量模型和重量模型的切换等),你有怎么样考虑思路
25.秒杀场景的不超卖用的什么方案
26.Agent中的长期记忆和短期记忆你是如何理解的
全部评论
牛啊,ai也看看我们啊
点赞 回复 分享
发布于 05-01 10:12 天津

相关推荐

不愿透露姓名的神秘牛友
04-30 17:45
本人简历上 1 个 RAG 项目 + 1 个 Agent demo;这次面的是AI岗一面前我以为:背完八股 + 把项目讲清楚,应该能稳过。0-5 min:自我介绍 + 项目背景- 顺利。讲清楚了我的 RAG 是给法律咨询场景做的,痛点是大模型不懂行业术语。5-20 min:项目深挖(开始崩)- Q1:你的法律文档总共多少?切了多少个 chunk?- 我:约 500 份 PDF,5 万个 chunk- Q2:500 份 PDF 加起来才 5 万 chunk?平均每份 100 个 chunk,你切片粒度是多少?- 我:512 token- Q3:法律文档里"第三条第二款"和"第三条之二"是不同含义,你的切片会不会把它切散?- 我:(沉默 5 秒)……应该会- Q4:那你怎么解决?- 我:我可以加一个 metadata……(开始编)❌ 第一次崩:切片粒度没考虑业务语义。20-35 min:评测体系(继续崩)- Q:你怎么知道你的 RAG 有效?- 我:我用 Recall@5……- Q:评测集多少条?怎么构造的?- 我:100 条,我手工标注的- Q:100 条够吗?分布怎么样?- 我:分布……我没分- Q:那你的 Recall@5 是 0.81,你怎么知道这个数字是好是坏?baseline 是什么?- 我:(沉默 10 秒)❌ 第二次崩:没有 baseline,没分布分析,纯靠"看起来还行"。35-55 min:Agent 部分(彻底崩)- Q:你的 Agent demo 用了几个工具?- 我:3 个,搜索、计算器、文档查询- Q:当用户问一个问题,你的 Agent 怎么决定调哪个工具?- 我:用 ReAct,让模型自己决定- Q:模型决策错了怎么办?- 我:我加了个 reflection……- Q:reflection 失败 3 次后怎么处理?- 我:(沉默 15 秒)……我没想过❌ 第三次崩:异常路径完全没设计。55-65 min:业务理解 + 反问- Q:你觉得字节做 AI 应用最大的瓶颈是什么?- 我:算力?数据?- Q:你看过哪些字节最近发的 AI 产品?- 我:豆包、扣子……- Q:扣子是 Agent 平台还是工作流平台?- 我:(再次沉默)❌ 第四次崩:对面试公司业务一无所知。
面试官拷打AI项目都会问...
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务