4月开始找暑期还来得及吗 level
获赞
18
粉丝
5
关注
8
看过 TA
157
东南大学
2027
算法工程师
IP属地:江苏
暂未填写个人简介
私信
关注
bg单9硕 先请你做一下自我介绍。请讲一下你的那段实习经历。希望你先讲一下它的背景,然后要解决什么问题,以及你们具体采取的一些措施,最终的结果。你在这里写到用了父子文档,父文档是怎么得到的?你刚刚说用语义的方式把它切分,具体是怎么做的?你是把每一句做一个 embedding,然后去聚类吗?是按句来进行划分的吗?还是说按照比如 512 个 token 这样一段一段来切分?比如现在有一个文本,有两段,总 token 数超过 512,你是怎么切分的?最后小于 512 个 token 是怎么做的?你聚类的最小单元就是一句话吗?比如现在有两段话,总 token 数是 600,你先按句子级别划分,再去聚类,聚类之后聚成多少个类?如果是 600 个 token,相当于是聚成两类是吧?聚类之后,你们怎么区分 A 跟 B(考虑聚类后会打乱原有文档顺序的问题)?你做的这些切分和聚类,其实只是为了后面加速检索,是吗?检索时如果命中某个类里面的文档,就会把整个文档返回作为知识库,是吗?你还对 Rerank 模型进行了蒸馏,蒸馏的数据是什么样的?训练数据大概有多少条?什么量级?用的是千问 3 8B 吗?后面还有 Skill 跟 MCP 这一块,大概讲一下吧。你这个 SKill中的 SOP 大概是什么样的?请讲一下你的下一个项目。你这个项目中的相关性的结果后面是要怎么用?请讲一下 BERT 跟 GPT 架构的区别。请大概说一下 Transformer 的架构,从一句话输入到最终生成,中间发生了哪些事情?在你的第一个项目里,有用到一些不同的检索算法吗?请讲一下。基于 embedding 的语义检索跟基于 BM25 这种关键词检索,它们的区别是什么?反问
查看23道真题和解析
0 点赞 评论 收藏
分享
05-21 23:09
已编辑
东南大学 算法工程师
请先做一个简单的自我介绍。你现在是研究生在读吗?预计什么时候毕业?之前在北京的医疗科技公司实习,主要做什么内容?是实习岗位吗?你了解我们现在面试的也是一个实习岗位吗?你在那家公司主要待了多久?他们公司主要做什么?你参与的是RAG知识库的构建工作吗?具体是怎么做的?拿到一个文本后,你会怎么处理来构建知识库?输入源是文本,具体处理流程是怎样的?你提到大于512(token)的存在向量数据库,小于512的存在缓存里,对吗?如果大于512的内容没有存入向量数据库,那检索时怎么找到它?因为最终查询是基于向量数据库的。实际使用时,用户通过自然语言对话来查询,表达方式多样且不确定,RAG返回的答案会不会出现较大偏差或波动?检索时计算向量距离,用的是Embedding模型吗?向量化是怎么做的?比如给定一段文本,如何将其向量化?能否解释一下向量化的过程?你主要用了哪个Embedding模型?用了GPU吗?公司是否部署了GPU用于训练大模型?RAG的知识库是部署在本地还是企业服务端?你在介绍模型优化时提到了“蒸馏”,请解释一下什么是知识蒸馏技术。你写过Skill吗?(进一步问:Skill是什么?)你们主要用什么开发语言?用什么工具?除了Cursor之外,你有没有自己编过码?有没有独立开发过?使用Cursor和自己编码有什么区别?有什么感受?你的英语怎么样?CET6是本科还是研究生考的?你这边有什么问题想问我的吗?
查看22道真题和解析
0 点赞 评论 收藏
分享
05-17 23:14
已编辑
东南大学 算法工程师
查看13道真题和解析
0 点赞 评论 收藏
分享
自我介绍 项目:详细介绍一下项目的那个混合检索架构是怎么实现的吗?知识图谱在里面起什么作用?这三路检索的结果你是怎么返回的?会做重排吗?特别是知识图谱那一路,结果可能没什么语义相关性,排序怎么办?检索评测是怎么做的?我看你写了 recall、MRR 这些指标,能详细介绍下吗?那评测的准确性怎么保证?是人工评估的吗?能详细介绍一下另一个项目,这种多智能体的上下文隔离和共享是怎么做的吗?除了这种串行架构,你还了解哪些其他多智能体架构?那多智能体架构里,怎么保证上下文 Cache 的命中率?毕竟 Token 挺贵的,很多时候可以通过一次编排把前缀固定下来,确保一个高命中率。这块你们怎么做的?Agent 你们是都使用同一个模型,还是会有选择机制?详细介绍一下设计的记忆系统,比如短期、长期记忆是怎么处理的?记忆用的是什么存储介质?真实记忆的保鲜你是怎么做的?如果记忆中有事实冲突,怎么处理?八股:MCP 跟 Function Call 有什么区别?MCP 跟 Function Call中schema是一次性发,还是每次对话都发给LLM?Function Call 能做的事,MCP 能不能完全替代?详细介绍一下 HTTP 和 HTTPS 的区别,以及 HTTPS 的通信过程。栈和队列的区别?栈如何去实现队列?进程间通信的几种常见方式?介绍python异步编程?具体怎么做到不阻塞的?无手撕反问
查看17道真题和解析
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务