腾讯混元大模型算法一面

1.能否解释Transformer使用多头注意力机制的动机?
2.如果只使用单头注意力,可能会在哪些方面受限?
3.请谈谈Transformer是如何实现并行化计算的。在计算注意力得分时,为什么通常要对点积结果进行缩放(即除以根号dk)?
4.在推荐系统的模型适配中,对比LoRA与全参数微调,它们各自更适合什么样的场景?
5.有什么优势和代价?在推荐系统中引入RAG(检索增强生成)主要是为了解决哪些问题?
6.通常如何构建与更新其背后的知识库?
7.在RAG实践中,选择BGE作为嵌入模型主要出于哪些考量?后续的向量检索索引(如FAISS)是如何构建和优化的?
8.对于RAG中的文档,通常采用哪些策略进行分块(chunk)?
9.如何平衡块的大小与信息完整性?GraphRAG适用于解决哪些传统RAG难以处理的问题场景?
10.你的项目中利用LangGraph来编排多工具调用链路。与纯Prompt工程方法相比,这种框架带来了哪些核心优势?
11.当输入的文本长度超出模型的上下文窗口时,目前有哪些主流的处理方案或模型架构来应对?
全部评论

相关推荐

04-23 19:11
重庆大学 Java
点赞 评论 收藏
分享
主包从3月初开始投的简历,最开始面的部门是IEG,然后二面的时候挂掉了,后面又被微信搜索给捞了,结果一面的时候又挂了,后面又被广州的WXG给捞过去了。没错,主包一共经历了六轮面试,好在最后的结果是很好的.......一面(1h左右)- 自我介绍- 拷打在美团的实习(占比很大)- 项目(占比很少)- 八股(cpp + OS + 计网 + 数据库 + rabbitMQ + redis)关于八股这块,MySQL底层问的比较多,其次就是cpp的继承和多态这块儿,中间件也问了些。- 手撕两道算法:最长无重复子串 + 交换链表中的结点二面(1h左右)- 自我介绍- 拷打两段实习:美团,以及一家中厂的实习经历(同样占比很大)- 少量八股(OS + 数据库 + LangChain + docker + cpp)关于八股这块,同样 OS 和 数据库问的比较多,其他就是简历上写的一些小点- 手撕两道算法 + 一道SQL优化:每m个结点反转单链表 + 合并两个有序数组,SQL优化的话,就是加索引(具体我搞忘了)- 反问:部门情况,目前负责的业务。- 最后面试官说还会加一场技术面。三面(50来分钟)- 问实习:美团 + 中厂实习的情况。- 科研情况、实验室方向、读研生活、个人爱好等等。- 三面没有八股和手撕,除了实习问的比较多,其实就是一些个人的学习情况,以及怎么学习技术的...等等。- 反问:组内业务、入职需要做什么(面试官讲的很详细,应该是大Boss)HR面(半小时)- 自我介绍- 家是哪儿的- 平时怎么学习的- 看你是28届的,为什么想这么早来实习?- 导师放不放实习- 在这三段实习中,有没有印象最深刻的?那位实习导师对你的帮助很大?- 有无直系亲属在鹅工作?- 其实就是为什么考研?如何平衡工作与个人学习?- 等等之类的话题,比较轻松,就像是在聊天一样。- 最后说的是周五之前出结果。总结主包一共有过三段实习经历(两段中厂 + 一段大厂),所以面试官更多的是在问实习期间做的事情,解决了什么问题之类的。八股和项目也有在问,但是问的没有实习那么多。除开美团,这是主包面的第二个大厂,虽然有点波折,但还是比较顺利。我个人认为,目前就业竞争比较大,越早实习越好,其次就是如果你本身已经有了 1~2 段大厂实习,那么约面的机会真的很大。字节、京东、滴滴都给了面试机会的,但是字节我挂了,然后京东和滴滴拒了,俗话说:有鹅选鹅嘛😂
牛客92772631...:28届都要抢了嘛
查看24道真题和解析
点赞 评论 收藏
分享
评论
3
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务