携程LLM算法(暑期实习笔试)

一、选择题(10道20分)
主要是概率论(贝叶斯、高斯分布)、机器学习和深度学习(交叉熵,有个含有softmax的求偏导)的一些知识,其他忘了
二、编程题(4道80分)
1、取石堆,注意数值范围
2、最大正方体,想半天没想出来怎么做
3、SVM,忘了相关模型是怎么个导入的了
4、数组中的四个值求异或,只能想到最笨的暴力求解
感受:应该是没戏了,差的内容太多了,面向ai编程的我如今只能靠多年前学C的一点零星印象做题(bushi
第二题想了半天差点用MATLAB做,但是下手的时候突然发现自己不知道怎么输入,笑死,习惯了直接生成输入输出
第三题今天下午差点就给我复习到了,哈哈。感觉条件给的很齐全了,损失函数怎么用参数怎么设置都给了,害
第四题差点忘了异或的符号是个啥,算出来结果的时候我自己都懵了
总结:道阻且长,女娲补天啊
#携程笔试#
全部评论

相关推荐

05-25 22:17
已编辑
中山大学 算法工程师
一面(1小时30分钟):上来先做题1. 手撕AdamW2. 手撕无重复字母的字串(hot100)3. 出了两个题都是对数据库的操作,我以为是让写大模拟,写到一半结果面试官告诉我是用sql写🐱,不会遂罢。4. 面对海量数据的时候怎么对数据进行处理,比如说去除掉敏感词等等,面对海量数据会出现哪些问题,该如何去处理5. 介绍发表的顶会论文6. 介绍Q-learning和DQN二面(2小时30分钟)实习乃至秋招面的最久的一轮面试了,从晚上七点多面到十点,最后人都麻了🥵,面试官估计要下班了结束了面试🐱1. 介绍论文,主包是做强化学习相关的,围绕问了很多强化学习算法(GRPO,PPO,reward model),介绍马尔可夫决策过程。2. bf16、fp16和fp32,并进行计算。3. lora微调的细节,量化相关知识然后开始漫长的手撕过程🥵4. 手撕ppo5. 算马尔可夫决策过程的γ阈值,我感觉是个无穷级数?6. 算模型sft的参数量大小及显卡利用率7. 是否重合链表(hot100)8. 如何使得一个输入向量x在经过一个或多个全连接层后,其输出向量y所在子空间基底尽可能接近标准正交基三面(面委会面)(30分钟)1. 介绍第一篇顶会论文(共享屏幕)2. 介绍第二篇顶会论文3. 不同强化学习之间的区别4. 和使用强化学习训练大模型相比,使用强化学习训练小模型需要做出哪些改变hr面(30分钟)常规的hr面问题,主要问来wx的意向。感觉前几面比较侧重技术细节,面委会感觉就比较侧重聊未来技术的发展,个人感觉前几面的压力比较大😼📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看18道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务