4月开始找暑期还来得及吗 - 个人主页动态 - 牛客网

发布(6) 评论刷题收藏

05-28 19:01

东南大学算法工程师

同程一面凉经 agent开发实习

bg单9硕 先请你做一下自我介绍。请讲一下你的那段实习经历。希望你先讲一下它的背景，然后要解决什么问题，以及你们具体采取的一些措施，最终的结果。你在这里写到用了父子文档，父文档是怎么得到的？你刚刚说用语义的方式把它切分，具体是怎么做的？你是把每一句做一个 embedding，然后去聚类吗？是按句来进行划分的吗？还是说按照比如 512 个 token 这样一段一段来切分？比如现在有一个文本，有两段，总 token 数超过 512，你是怎么切分的？最后小于 512 个 token 是怎么做的？你聚类的最小单元就是一句话吗？比如现在有两段话，总 token 数是 600，你先按句子级别划分，再去聚类，聚类之后聚成多少个类？如果是 600 个 token，相当于是聚成两类是吧？聚类之后，你们怎么区分 A 跟 B（考虑聚类后会打乱原有文档顺序的问题）？你做的这些切分和聚类，其实只是为了后面加速检索，是吗？检索时如果命中某个类里面的文档，就会把整个文档返回作为知识库，是吗？你还对 Rerank 模型进行了蒸馏，蒸馏的数据是什么样的？训练数据大概有多少条？什么量级？用的是千问 3 8B 吗？后面还有 Skill 跟 MCP 这一块，大概讲一下吧。你这个 SKill中的 SOP 大概是什么样的？请讲一下你的下一个项目。你这个项目中的相关性的结果后面是要怎么用？请讲一下 BERT 跟 GPT 架构的区别。请大概说一下 Transformer 的架构，从一句话输入到最终生成，中间发生了哪些事情？在你的第一个项目里，有用到一些不同的检索算法吗？请讲一下。基于 embedding 的语义检索跟基于 BM25 这种关键词检索，它们的区别是什么？反问

查看23道真题和解析

0 点赞评论收藏

分享

05-26 13:24

东南大学算法工程师

CVTE一面凉经

请简单介绍一下你自己。你在那边实习了差不多半年是吗？主要做算法还是偏工程化的工作？实际工作内容是以算法为主，还是以你描述的RAG项目内容为主？可以简单介绍一下两个项目吗？这个产品的质量是怎么衡量的？具体结果如何？你在差旅助手里设计了一个4层内存的隔离架构，大概是什么样的方案？如果不同的 agent 需要共享上下文，一般会怎么做？这个共享过程中会存在多线程或进程间的竞争情况吗？如果存在竞争，一般是什么情况下会出现多线程或多进程的竞争？常规的解法或方案有哪些？这种锁一般会采用什么样的锁？我看到你在差旅助手里拆分了四个 agent 的引擎，这种拆分的逻辑是什么？如果新增一个签证办理的场景，是会新增一...

查看18道真题和解析

0 点赞评论收藏

分享

05-21 23:09

已编辑

东南大学算法工程师

中兴实习 agent开发一面凉经

请先做一个简单的自我介绍。你现在是研究生在读吗？预计什么时候毕业？之前在北京的医疗科技公司实习，主要做什么内容？是实习岗位吗？你了解我们现在面试的也是一个实习岗位吗？你在那家公司主要待了多久？他们公司主要做什么？你参与的是RAG知识库的构建工作吗？具体是怎么做的？拿到一个文本后，你会怎么处理来构建知识库？输入源是文本，具体处理流程是怎样的？你提到大于512（token）的存在向量数据库，小于512的存在缓存里，对吗？如果大于512的内容没有存入向量数据库，那检索时怎么找到它？因为最终查询是基于向量数据库的。实际使用时，用户通过自然语言对话来查询，表达方式多样且不确定，RAG返回的答案会不会出现较大偏差或波动？检索时计算向量距离，用的是Embedding模型吗？向量化是怎么做的？比如给定一段文本，如何将其向量化？能否解释一下向量化的过程？你主要用了哪个Embedding模型？用了GPU吗？公司是否部署了GPU用于训练大模型？RAG的知识库是部署在本地还是企业服务端？你在介绍模型优化时提到了“蒸馏”，请解释一下什么是知识蒸馏技术。你写过Skill吗？（进一步问：Skill是什么？）你们主要用什么开发语言？用什么工具？除了Cursor之外，你有没有自己编过码？有没有独立开发过？使用Cursor和自己编码有什么区别？有什么感受？你的英语怎么样？CET6是本科还是研究生考的？你这边有什么问题想问我的吗？

查看22道真题和解析

0 点赞评论收藏

分享

05-17 23:14

已编辑

东南大学算法工程师

华为暑期实习技术面面经

部门华为终端bg ai应用开发（面试官上来迟到30min，我约的10点面试 10点02分收到短信 说上一个人开始面 10点26分我开始面）bg 单9硕 0论文1. 自我介绍询问本科硕士背景成绩，奖项，提醒我有什么奖都要登记在系统里，华为和其他厂不一样面试官看不到简历原件。2.实习项目拷打业务背景是什么，项目整体设计，具体负责哪些模块，各个模块怎么设计的？询问实习项目组的人员组成和任务分配情况？为什么选择这个LLM？追问如何选定的测试集，rag项目的评估指标？（觉得我的指标太高了怀疑置信度）LLM-as-Judge的分数结果如何衡量，怎么确定LLM打高分就一定是好？询问有没有遇到检索结果自相矛盾的badcase，如何解决的？询问项目在长尾问题的情况下的性能，有没有专门优化？询问我的应用场景下，怎么解决模型幻觉问题，只靠微调模型不够，追问有没有其他方案？是否上线？有没有收到什么反馈？有没有改进？RAG知识库的测试有没有专业人员参与？3.手撕lc26 在leetcode网站上写并提交测试无八股结束后一分钟秒挂，虽然感觉自己答得还可以，手撕也秒了，但不知道为什么挂了，问接头人面评也不予告知

查看13道真题和解析

0 点赞评论收藏

分享

05-10 16:27

东南大学算法工程师

网易技术中心日常实习一面凉经

自我介绍 项目：详细介绍一下项目的那个混合检索架构是怎么实现的吗？知识图谱在里面起什么作用？这三路检索的结果你是怎么返回的？会做重排吗？特别是知识图谱那一路，结果可能没什么语义相关性，排序怎么办？检索评测是怎么做的？我看你写了 recall、MRR 这些指标，能详细介绍下吗？那评测的准确性怎么保证？是人工评估的吗？能详细介绍一下另一个项目，这种多智能体的上下文隔离和共享是怎么做的吗？除了这种串行架构，你还了解哪些其他多智能体架构？那多智能体架构里，怎么保证上下文 Cache 的命中率？毕竟 Token 挺贵的，很多时候可以通过一次编排把前缀固定下来，确保一个高命中率。这块你们怎么做的？Agent 你们是都使用同一个模型，还是会有选择机制？详细介绍一下设计的记忆系统，比如短期、长期记忆是怎么处理的？记忆用的是什么存储介质？真实记忆的保鲜你是怎么做的？如果记忆中有事实冲突，怎么处理？八股：MCP 跟 Function Call 有什么区别？MCP 跟 Function Call中schema是一次性发，还是每次对话都发给LLM？Function Call 能做的事，MCP 能不能完全替代？详细介绍一下 HTTP 和 HTTPS 的区别，以及 HTTPS 的通信过程。栈和队列的区别？栈如何去实现队列？进程间通信的几种常见方式？介绍python异步编程？具体怎么做到不阻塞的？无手撕反问

查看17道真题和解析

0 点赞评论收藏

分享

03-03 14:59

东南大学算法工程师

uu们能不能讲一下我这履历能不能去做ai相关工作啊

本科双一流 硕士中游985 27届毕业 现在在准备暑期实习 研二被老师安排去了一个小医疗器械公司 做ai医学影像 做了一个模型 有两论文在投不知道中不中还是想做llm方向的工作 但感觉牛客上简历都太强了 bg都远强过我 我不知道我这bg是不是只能去干开发 因为现在在准备实习面试 可能时间不太够 同时准备ai和java了 故只能选一个 求大佬指点

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务