算法面经3:nlp和llm,商汤科技

商汤 LLM (2+0)🥲 二面后挂了
1. 主要是以项目为主,讲完项目,提问发散问题以及八股。
2. Baichuan2-7B的架构讲一下,有什么特别之处?
3. Lora微调7B模型,可训练参数是多少?显存占用如何?
4. 介绍下Lora以及qlora的区别
5. 其它多模态对齐方式有哪些?
6. LSTM与Transformer的区别,以及后者的优势?
7. 讲解下scaling law
8. 预训练一般分为哪些阶段,每个阶段的特点有何区别?
#春招# #实习# #秋招# #ai算法工程师# #大模型# #nlp算法工程师# #商汤科技#
全部评论
佬几个项目
点赞 回复 分享
发布于 2025-03-17 11:02 辽宁

相关推荐

面了100年面试不知...:小天才g了,但是天才还在
我的求职进度条
点赞 评论 收藏
分享
2025-12-06 01:10
已编辑
哈尔滨工程大学 Java
一面问的真细,二面不知为啥变双机位。9.29快手主站平时怎么学习 AI 的,国内外知名大模型,实习公司都用的什么大模型,怎么评估效果的java池化思想,线程池构造方法的核心参数,线程池中阻塞队列注意事项,submit方法参数和执行逻辑,shutdown和shutdownnow,核心线程允许过期吗threadlocal底层,为什么key是弱引用,key回收了再get或者set这个value会怎样aqs,如何保证公平性java代理java堆划分,新生代还有别的晋升老年代的情况吗,什么时候触发gc,gc失败抛什么异常,如何排查oom,导出dump命令redis数据结构,哪个底层是跳表,和其他数据结构对比布隆过滤器会出现大key问题吗,你咋实现的布隆过滤器你怎么实现redis分布式锁,可重入,续期聚簇索引非聚簇索引select语句会加锁吗,怎么实现的不加锁undolog redolog binlog怎么能让select加锁,update这个范围加的什么锁,update一条呢手撕简单01背包,接雨水10.10快手主站意图识别用的哪个大模型,走到意图和rag的比例,faq是点击的吗自然语言怎么识别的gap一年干啥了,转正怎么样没跟组里提意向吗,研究生研究方向是传统算法吗,会大模型微调吗注册场景为什么用布隆过滤器,原理分布式锁底层的key怎么拼的,value里是什么redis持久化zset底层mysql索引结构,一个表三个字段有主键唯一索引和没索引的字段会有几个b+树,聚簇索引非聚簇索引存的啥无手撕
点赞 评论 收藏
分享
评论
8
31
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务