小厂Agent开发面经分享攒人品版

继续来分享下之前的面经~欢迎友好讨论,信息共享
1.当时为什么决定选用 RAG 这个技术框架?
2.你选择的是哪个 RAG / 哪个向量库?为什么选它?
3.你们做了哪些评测对比?
4.你为什么要用向量检索(RAG)?为什么不用其他方式?
5.为什么不用全文索引(类似某度/某g那种关键词检索)?
6.你说大模型有幻觉,那为什么不用更“权威”的全文检索来避免胡编?
7.如果用开源全文检索在本地部署、自己喂私有数据,也能搜——那你们当时为什么没选这条路?
8.你选的向量维度是多少维?
9.这个维度为什么重要?你有没有显示配置/修改过维度?
10.你用的切分策略是什么?
11.你说按段落/按语义切,那段落有的 100 字、有的 1 万字怎么办?
12.你的 chunk size 为什么定 1000 token?这是拍脑袋还是有依据?
13.overlap 设多少?为什么这样设?
14.你怎么评价/评测 RAG 效果的好坏?
全部评论
考虑我司不 欢迎联系
点赞 回复 分享
发布于 昨天 16:00 上海

相关推荐

昨天 13:50
东北大学 C++
我本身的主力编程语言就是Python,再加上导师的研究方向刚好是机器学习、深度学习,这方面的基础也就自然而然积累了一些。后来也是误打误撞,进入了AI Agent开发相关的岗位实习,整个过程也算实打实的干中学、边做边练。刚接触这块的时候,我最先做的就是梳理Agent的主流开发框架、完整运行流程,先把整体体系摸清楚。等对各类框架有了基础认知后,我就开始往深钻研,吃透每个模块底层的代码逻辑:一边在GitHub上研读优质的开源项目代码,一边仔细扒LangChain官网,把里面的各项功能都研究明白,在这里也特别感谢我的小导豆包老师,帮了我不少忙。把整体框架和流程吃透之后,我就开始深耕各个核心模块,比如深挖RAG模块里的文本分块方式、Embedding实现逻辑、检索增强的实现原理,以及各类优化策略等等,一点点把细节摸透。但这个时候也真的忍不住感叹,AI行业的技术迭代速度实在太快了,我刚把一套技术技能学扎实,Claw Bot也就是现在的龙虾模型就推出了,还是得持续跟进、不停学习。平时也有不少朋友问我,有没有推荐的学习老师或者教程。其实我就是典型的电子蝗虫学习法,不管来源是什么,只要是自己需要的知识点、技术内容,就针对性去看去学,完全按需学习。总而言之,AI行业更新迭代的速度太快了,想要跟上节奏就必须保持持续学习的状态,有时候甚至还要及时跟进顶会论文,才能不落后。以上就是我这段时间的完整学习路径啦,也希望评论区的各位大佬多多指点、不吝赐教。
从事AI岗需要掌握哪些技...
点赞 评论 收藏
分享
钱嘛数字而已:拖拉机被发明出来之后,就不需要农民了吗?农民还是需要的,但不需要这么多了,另外对农民的要求也变高了,需要会开拖拉机。
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务