小米自然语言处理算法工程师面经

10.12一面,10.18二面,目前等三面通知

一面/技术面 2024/10/12 下午17:00-18:00

  1. 自我介绍
  2. 介绍大模型实习
  3. 介绍一下YaRN
  4. 其他长文本技术
  5. 介绍一下flash-attn,解决的问题是什么,如何解决的
  6. 介绍一下RoPE
  7. 从别的方向转到NLP这块的具体过程
  8. 做大模型SFT过程中有没有遇到什么困难
  9. 实习过程中最有意思以及最有挑战的部分
  10. 大模型各个环节中比较倾向于做哪一部分
  11. 面试官介绍了部门的主要情况,做小爱相关的大模型应用
  12. 代码题:lc55,跳跃游戏

二面/技术面 2024/10/18 晚上19:00-20:00

  1. 自我介绍
  2. 论文的方向
  3. 介绍大模型实习
  4. 介绍一下YaRN
  5. 还有哪些长文本扩展技术
  6. 如何进行效果评测
  7. 介绍另一段推荐实习
  8. 实习中做了哪些改进
  9. 数据规模大概多少
  10. 如何解决高数据量高复杂度的问题
  11. 还有没有其他有关LLM的项目
  12. 了解哪些分词方式,BPE、WordPiece、Unigram LM
  13. 大模型实习中有没有做过一些效果上的优化,怎么做的
  14. 询问了一些有关位置内插的东西
  15. 介绍一下NTK
  16. 代码题:lc394,字符串解码
  17. 反问:部门业务
#小米求职进展汇总##自然语言处理##算法工程师##小米正式批##25秋招#
全部评论
兄弟一般如何介绍RoPE,交流一下这种很难讲的点,大概需要讲到什么程度?
2 回复 分享
发布于 2024-10-21 11:30 北京
佬,有进展吗,同nlp,二面后一直无消息
点赞 回复 分享
发布于 2024-11-05 00:05 云南
佬,二面完有后续了吗?我面完一周了还没后续😅
点赞 回复 分享
发布于 2024-10-31 17:43 江苏
请问佬有消息了吗
点赞 回复 分享
发布于 2024-10-23 16:46 新加坡

相关推荐

面试官人很好,态度和蔼可亲,没答出来时也会引导你去思考。由于是晚上面的,导致我白天一天都有点紧张,面的时候状态也不是很好,正常可能面试官提问完应该思考几秒再答,而我就像抢答一样一口气把所有会的都说出来,这样就导致逻辑比较混乱,东一句西一句的。首先是自我介绍,先把会的技术大致讲一下,由于我八股背的多所以着重讲了一下,Java,go,jvm,MySQL,Redis,计网,操作系统这些,然后一小部分闲聊,然后先问了一下项目,面试官问我这个项目是否落实之类的,直接坦言说是写的练手的,包括之前也写过IM通讯,外卖之类的。然后面试官就把提问的重点放在了八股上。先问了Java:类加载器(答:3种+自定义类加载器、tomcat、原因+双亲委派+好处)JVM参数(答:xmx,xms,newsize这些,问我是如何设定的,我回答是把内存分一半给堆,再把堆分一半给新生代,这方面确实不太了解)然后问了一下并发相关的:线程池(答:线程池的7个参数(忘了线程工厂和阻塞时间了),3个重要参数,还有线程如何启用,为什么要设计最大线程数之类的,提到Java栈默认分配1MB运行时不可以更改)AQS(答:先讲clh是自旋锁+list,然后是AQS在这个基础上做的两个优化,然后举了一下reentrantlock根据state如何获取资源)CAS(答:使用三个字段,aba问题,然后将通常搭配自旋锁实现,面试官问通常会自旋多少次,这个不太了解,答的100,然后问100次大概多少秒,回答微秒级,然后面试官讲了一下怎么做资源可能没用完,意识到可能还需要进行阻塞操作)然后考虑一下Linux命令(top,ps,如何使用管道符过滤线程和使用Linux启动线程没答出来)然后问Redis:持久化机制(答:三种aof,rdb,混合,aof的三个参数刷盘策略,rdb以快照保存,使用bgsave会使用子线程来保存不会阻塞,而aof虽然会阻塞但是只在写完数据后追加一条命令,不会太影响,然后是他俩的优缺点,还有混合是怎么保存数据的)集群模式(答:三种,主从复制到缺点再到哨兵机制,正常使用三个哨兵互相监督,主节点挂了投票选主哨兵然后选主节点,然后额外讲一下脑裂的问题,主节点进行数据更新然后把命令写入aof来同步从节点,最后cluster集群,如何实现,使用16383个哈希槽(艹答成16384了),先根据哈希码取余,再根据节点数取余决定放在哪个节点上,然后问了一下我会怎么选集群模式,首先是cluster的问题,会让管道操作之类的失效,然后哨兵会导致整个集群结构变得复杂,使用小项目可能会考虑哨兵,大的考虑cluster,然后考了一下cluster如果一个节点挂了怎么办,根据节点数重新取余然后数据转移,面试官说这么转移比较慢,有没有别的办法,我隐约记得使用一个类似环形数组的方式,想不起来了)然后考了一下MySQL的b+树(这方面的知识点太多了,导致我什么都想讲逻辑就比较乱,讲了一下聚簇索引,树的叶子节点对应着一张页16KB,MySQL有一个区的概念,把这些页放在同一个区中,这样叶子节点的双向链表遍历时速度更快,然后b+树的扇出比较大(非常二,说成扇度之类的,面试官以为说的是扇区)这样层数就比较小,一行1kb数据的话3层可以放心2000w数据)其他的暂时想不起来了算法是lru,面试官问要不要提示,我说写个,然后写了10分钟左右,说大概写好了,但是面试官指出了2个小错误,第一个马上就改回来了,第二个一直没看出来(大脑这时候已经停止工作了)反问:问学习建议,说根据实际的项目进行深入,考虑应该怎么做,还问了一下组里面是做Java的吗?面试官说他是做go的,组里什么语言都有,语言影响不大,连忙补充了一句我对go的底层有深入源码的学习)结束。总体感觉答得不太好,没有太体现出深度,细节也不够全面。
下一个更好呗:佬,我投完云智一直没消息,多久约的一面啊
查看14道真题和解析
点赞 评论 收藏
分享
评论
17
53
分享

创作者周榜

更多
牛客网
牛客企业服务