京东技术一面大模型

一面 HR,这是二面,技术一面。
面试官人很好,聊了很久,总结一下问题吧。
1.自我介绍
2.项目介绍
3.你这个 prompt 是怎么调整的?
4.你如何评估你们这个效果呢?(我从数据评估和模型评估两方面讲)
5.你们的训练数据怎么构造的?用的什么格式?
6.全参微调训练一次多久?
7.主要是 SFT 吗?没考虑强化学习?
8.你觉得为什么现在大模型都是 only decoder?有什么好处?
9.lora 做过吗?讲一下原理
10.lora 你对哪些层次加 adapter?怎么定的?print model 看吗?(面试官后面说对不同层加 lora 效果影响还蛮大的,不仅仅是参数大小)
11. 对训练精度了解吗?(fp16 bf16 我讲的不太对,这部分不是很记得了,要复习一下)
 12.attention 里面的注意力分数是什么?为什么要 Q 乘以 Kt?什么含义?
13. 位置编码了解吗?讲一下

代码题:类似于 topk 但是不要求复杂度,更像是数据处理场景题。
反问:聊了很多,面试官人确实很好,泪目。只能说面试确实看缘分。
全部评论
我勒个豆,咱俩好像一样,我二面也是这个岗
点赞 回复 分享
发布于 2024-08-30 13:53 山西
东子一面是HR面么,为什么邮件通知一面都安排到了10号了
点赞 回复 分享
发布于 2024-08-30 12:27 北京
请问一面结果大概多久出的呀
点赞 回复 分享
发布于 2024-08-28 15:35 内蒙古

相关推荐

08-26 17:02
已编辑
山东大学 算法工程师
8.26一面无八股,反复拷打项目,拷打麻了都1. 自我介绍2. 论文一,为什么用这个结构,是否尝试过其他结构3. 论文的背景是什么样子的?主要面对的对象是什么?说说数据集是什么样的?4. 评价标准是什么5. 模型具体结构(超参数(不断拷打,神经网络的层数是多少,滑窗是多大,滑窗可以再增大一些吗?网络层数可以增大一些吗?MLP的宽度是多少呢?数据是连续的吗,通过采样得来的吗,采样频率是多少呢?),数据来自于哪里,数据量是多少,数据采样,数据量不够的情况下可以采用什么方式呢?数据增强了解吗)(最近一直没做这科研,论文早就发了,大抵具体参数快忘记了,我就凭印象说了一下还说错了,希望面试官别在意,大家一定再看看自己论文)6. 超参数为什么这么设置,其他的为什么不行7. Transfomer试过吗,在别的项目里面试过吗,如何往Transfomer里面传数据的?8. 论文二,你是如何用图神经网络来解决问题的?如何解决过拟合和欠拟合?图结构是如何建立的呢?空间关系吗?9. 如何判断效果好不好?如何判断几层这个超参数?10. 项目:描述一下你的项目和背景,这些工作都是你做的吗11. 如何三维立体建模的?12. 是如何路径规划的?用的什么算法?13. 你这个算法的代价函数是什么?14. 其实你的就是找到一个可行解就行对吗?并不是找的最优的,比如说考虑时间等因素15. 京东这边做的仓储系统都是考虑一些代价的,比如最短时间等,100个订单需要在规定时间内出来,你对于你的项目觉得还有什么可以改进的吗?比如说分大小件,或者其他的?(我们项目的目标确实不一样)16. 再问Transform还有一些更细的问题,面试官真的是一层一层问下去的,聊了40多分钟,说让我等下次面试的通知(也不知道过没过)。总的来说,面试官真的是前辈,真的懂得太多了,我们在他们眼里只是孩子哈哈哈哈,哪怕是自己不了解的领域,人家大概了解一下就知道怎么回事了,怎么说呢,他问的比我做的都细哈哈哈哈哈。太牛了!不管过不过都是经历,自己确实有很多不足,感谢和面试官畅聊的40分钟,懂了很多东西和细节。秋招继续冲!
独角兽内推__免笔试:同学,瞅瞅我司,医疗独角兽,校招刚开,名额有限,先到先得,我的主页最新动态,绿灯直达,免笔试~
查看16道真题和解析
点赞 评论 收藏
分享
评论
9
40
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务