滴滴1,2,3面

滴滴
一面 8.08 16:00(40min)
面试官提前进入了会议发现早就进去的我,于是我们就15:40开始了
自我介绍
选择一篇论文进行介绍,
除了知识图谱以外还了解哪些机器学习和深度学习模型,分别列举介绍
手撕:括号生成
反问

二面 8.08 16:44(40min)
自我介绍
介绍第一篇论文(15min)
介绍第二篇论文(8min)
介绍第三篇论文(3min)不是一作
介绍第四篇(直接说了不是一作不太了解)
介绍下BERT模型,预训练任务?有哪些结构组成?为什么是双向?
了解哪些大模型?
手撕:二叉树bfs相关的一个题
反问

三面 8.08 17:50(55min)
自我介绍
这些工作的motivation介绍,对motivation比较细,主要是想了解你这些工作的出发点
深聊第一篇论文(15min)
聊聊第二篇论文(10min)
了解哪些大模型,chatgpt训练过程是怎么样的?
智力题:ABCD四个人,2黑2白四个帽子,B能看到C,A能看到BC,四分钟后,有一个人知道自己的帽子颜色,是谁?较简单 B
手撕:1.八皇后(寄)2.排序数组中找到所有等于target的两数下标
反问
dd真的够顶,一天三面,论文问的很深,不过八股确实少
八皇后是真的不会写,寄
第二个好像有一些重复样例也没写全对
全部评论
羡慕
2 回复 分享
发布于 2023-08-10 22:12 北京
有后续了嘛?
点赞 回复 分享
发布于 2023-08-14 16:04 浙江
佬这是什么岗?
点赞 回复 分享
发布于 2023-08-11 08:25 广东
稳了
点赞 回复 分享
发布于 2023-08-11 01:37 山东
提前批
点赞 回复 分享
发布于 2023-08-10 22:04 北京

相关推荐

1.自我介绍;2.本科毕设项目介绍;3.Retinaface和Facenet的具体网络模型;4.Retinaface是如何检测人脸的,Facenet是如何识别人脸的;5.项目的创新点有什么,评判指标是什么;6.检测和识别用的时间,其中esp8266,mg996r分别是做什么用的;7.大模型量化比赛项目介绍;8.AWQ和GPTQ是什么;9.什么模型适合用AWQ,什么模型适合用GPTQ;10.其中最优的参数是怎么得到的;11.llm- benchmarker怎么用的,是什么评判指标;12.了解算子吗?(marlin kernel)详细说一下这个算子是什么;13.除了量化其他的方法了解吗?(压缩、减枝、LoRA)14.LoRA是什么;QLoRA是什么?为什么要用LoRA;15.具体的原理是怎么样的;16.如何将LoRA结合到TransFormer各个层?17.介绍一下TransFormer的架构;18.Encoder和Decoder是由什么组成的;19.MHA细节是怎么样的(QKV),softmax是干什么用的;20.单头注意力和多头注意力有什么区别;21.为什么MHA下面要除根号d;22.潜在多头注意力了解吗,多头注意力的作用;23.FFN详细说一下;24.残差链接有什么用;25.Layer Normalization有什么用;26.Layer Normalization和Batch  Normalization的区别;27.Qwen3的基础架构是怎么样的;28.Qwen3和Qwen2.5相比有什么区别;29.Qwen3和DeepSeek有多少个头;30.大模型要训练出思维链应该如何训练;31.如何平衡精度和推理速度,怎么做trade off的;32.了解Agent吗,做过什么agent项目33.Dense模型是什么;34.MoE、MLA是什么,详细讲一下;35.LoRA的偏置矩阵详细说一下,为什么LoRA初始化A要正态分布,B要初始化为0;36.秩是什么意思;怎么理解;37.Qwen3哪里做的好;38.快手实习项目介绍;39.经纬恒润实习项目介绍;40.了解量化交易吗;41.你平时做交易是趋势还是阶段?------二更已oc
你最近因为什么迷茫?
点赞 评论 收藏
分享
评论
5
14
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务