商汤NLP一面

整体不到1h前20min讲了一个项目,没太详细问。

然后八股:
1. Llama2架构 (embedding, transformer block, LM head)
2. Llama2 transformer block里做了哪些改变 (RMSNorm, RoPE, SwiGLU, PreNorm不太清楚说全了没)
3. 为什么用RMSNorm不用LayerNorm (答参数量少,不太对)
4. 为什么用RoPE不用绝对位置编码,RoPE能表示绝对位置信息吗
5. 为什么现在主流都用Decoder-only而不是Encoder-decoder
6. LoRA原理,LoRA在用的时候可能会有哪些坑
7. QLoRA原理,QLoRA里用的是哪种量化,可以看作是一种超参数 (没太理解)。

最后手写一个快排,终止条件写反了愣了五分钟,回去等消息了
全部评论
这估计同一个面试官
1 回复 分享
发布于 2024-09-06 09:21 北京
佬,你的面经被小地瓜的偷了
点赞 回复 分享
发布于 2024-09-24 16:04 广东
佬,oc了吗,一共有几面啊,我刚刚约二面
点赞 回复 分享
发布于 2024-09-10 18:52 广西
佬,你是用小鱼易连面试的吗,怎么写算法题,是共享屏幕吗
点赞 回复 分享
发布于 2024-09-06 23:59 广西

相关推荐

03-17 09:45
南开大学 Java
继续多发面经多多攒人品---------------------------------------------------------1.个人的基本介绍(2min)------------------------------------------项目介绍(25min)---------------------------------------------------2.项目的介绍以及拷打。3.技术和业务上面的难点能分别讲讲么?4.RAG知识库如何搭建的,如何进行隔离呢,用的是什么样的元数据过滤,具体是靠什么字段来区分的呢?5.讲一下embedding 的原理,以及你的项目用的是什么模型,和其他的模型比较有什么用的不同么?6.整体流程,就是问当前端调用,用户输入流经的全过程,哪些工具要调用,然后交互是什么样的,记忆是如何进行一个更新的呢,然后会输出返回什么给用户。7.PE的提示词工程的设计是怎么样的,你说的分层次设计和最佳范式以及高质量样本是什么呢?8.项目用了MCP么?如果Mcp工具如果要运用在你的项目当中该怎么做?9.有多少工具,这里的调用会不会有其他的问题,比如上下文的占用以及这些工具的设计目的是为了什么业务场景?----------------------------------------------------基本八股(8min)---------------------------------------------------10.如何进行AI coding 的使用呢?个人或者团队开发时是怎么办的?11. TRAE、克劳德、谷歌,gpt,都用过那可以说一下他们各自的使用体验,多模态和分析角度的不同。12.Mysql的数据引擎有哪些,InnoDB,MyISAM,Memory从事务,锁的粒度来讲,以及innoDB为什么更好呢?13.索引的实现,有哪些数据结构?有哪些索引,能说多少说多少--------------------------------------------------算法题(16min)---------------------------------------------------DFS的岛屿数量问题,思路,写一下,以及如果要求最大面积该怎么做呢?写完再写一个(调了好一会,因为好像没有debug的功能么)-------------------------------------反问--(10分钟)--------------------------面试官也比较能说会道,给我讲解了业务的方向,以及遇到了什么样的难点,用户意图识别,以及openclaw相关的未来应用的方向的讨论。---------------------后续:2小时后约三面。
查看14道真题和解析
点赞 评论 收藏
分享
评论
9
34
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务