智慧树日常实习 大模型算法 面经

3.15 面了有55分钟,这波没有盯着简历问,感觉以八股为主,面完就忙别的事情去了,忘了一部分面试题,也没录音,以下为回忆版
1.自我介绍,快速过简历,然后稍微问了一些简历的项目实现。
2.如何进行特征选择,不同的方法好处是什么
3.遗传算法的适应度函数是怎么算出来的?存在什么样的问题,怎么改进
4.Transformer的具体结构与实现。
5.介绍一下Transformer的位置编码,有什么用,怎么实现的
6.你了解多少种注意力机制?讲一下,它们之间的主要区别是什么
7.你自己实现过注意力层吗,怎么实现的
8.全套Bert八股,结构、输入、输出、预训练任务、特点等等
9.介绍llava
10.似乎还问了一些别的八股文,但我不记得了
11.共享屏幕,写代码实现softmax, sigmoid
12.算法题,最大子串
13.反问
面试体验也不错

更新:就这一次面试,当晚oc
全部评论
llama不是llava哈哈
2 回复 分享
发布于 2024-03-23 21:02 上海

相关推荐

补发一下之前面试腾讯的面经,具体timeline可以参考前面的帖子。一面(约30mins):自我介绍,挑一个简历里最好的一个项目详细介绍下项目中遇到了什么挑战,怎么解决的了解DeepSeek吗,为什么DeepSeek现在这么火?说一下DeepSeek里的MLA和GRPOGRPO和DPO,PPO,RLHF的区别看你之前有LoRA微调DeepSeek的项目,简单说说微调经验,效果如何RAG在检索阶段能有哪些优化?(sub-query,HyDE等)二面(约1h10mins):自我介绍,拷打简历。写一下GRPO的公式先屏幕共享从头到尾walk through讲一下DeepSeek技术报告论文。面试官中间会穿插提问DeepSeek-v3/r1/r1-zero有什么区别DeepSeek-r1-zero的冷启动数据是怎么组成的DeepSeek-r1-zero解决了DeepSeek-r1的哪些问题如何解决大模型的幻觉Embedding如何微调(讲了对比学习啥的)RAG的评测指标有哪些业界现在function call的做法和水平场景题:大致是RAG中检索结果遇到张冠李戴的问题该如何解决举几个例子能够体现你的研究能力三面(约30mins)拷打LoRA微调项目,问了实验的数据集,参数设置,结果如何等等你目前的研究方向主要是什么?讲一下ReRanker的目的,做法有哪些场景题:我现在运用RAG来检索回答,目标是检索四个季度的表格数据,但是经过检索+ReRanker后只出现了三个季度的数据,该如何解决hr面(约15mins)比较常规,大致如下:用三个词语描述下你为何能胜任这份工作你的优缺点都说一下你过往实习项目中遇到过的最大困难是什么,怎么解决的最早实习时间,实习时常引流:腾讯字节阿里淘天美团拼多多
Rafae1:接好运
查看27道真题和解析
点赞 评论 收藏
分享
评论
7
41
分享

创作者周榜

更多
牛客网
牛客企业服务