知乎推荐算法一面 人才库版
给我面没招了,发点面经攒攒人品~
1、项目拷打
2、八股
(1)GBDT的参差是怎么拟合的,为什么xgboost要用二阶泰勒展开,和gbdt的区别是什么
(2)lightgbm的原理
(3)模型的显存消耗计算(有咯让、混合精度)
(4)Qwen-3-VL
(5)Lora原理、矩阵初始化、哪个是0哪个是高斯
(6)Flash attention
(7)推理阶段显存消耗哪部分最多。
3、手撕:a2+b2=c
1、项目拷打
2、八股
(1)GBDT的参差是怎么拟合的,为什么xgboost要用二阶泰勒展开,和gbdt的区别是什么
(2)lightgbm的原理
(3)模型的显存消耗计算(有咯让、混合精度)
(4)Qwen-3-VL
(5)Lora原理、矩阵初始化、哪个是0哪个是高斯
(6)Flash attention
(7)推理阶段显存消耗哪部分最多。
3、手撕:a2+b2=c
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
佬 考虑我司么 考虑的话 可以看我主页帖子
相关推荐
查看10道真题和解析 点赞 评论 收藏
分享
京东工作强度 428人发布