秋招提前批面经记录

提前批结束~分享下经验攒人品,正式批继续冲
边实习边面试真是战战兢兢,想尽可能少有几家有把握的,四家约面,大厂的人才计划高不可攀没感投

1. 百度 小度大模型算法工程师(已oc)
一面
- 问实习项目
- 继续预训练怎么做,词表大小多大,如何扩充词表
- dpo训练,如何优化
- 拒绝采样出来的数据如何筛选
- ppo与dpo细节对比
- 质量打分大模型怎么训
- 二叉树层序遍历

二面
- 拷打实习项目细节 1h
- 聊天 1h

三面
- 挑个项目拷打 30min
- llm最重要的是什么,对什么最感兴趣
- 怎么自动构造数据,筛选
- 问了一堆hr问题

minimax(已oc)
一面
- 监督微调有用么,怎么做效果好
- 手撕lr

二面
- 挑个项目讲
- 你认为llm哪块最重要,让你当ld你会怎么投人力
- 怎么清洗数据,有什么经验
- 摘要任务怎么做评估
- 手撕概率题

三面
- 偏聊天

科大讯飞飞星计划(已oc)
一面
- 拷打项目
- moe细节
- ppo细节
- 推理有哪些增强方法
- 说说最新的icl技术
- rm训练trick,训练时常见问题

二面
- 大致问了其中两段实习
- 想做什么方向
- hr问题
- 征途整体偏聊天

hr面

百川星耀计划(一面挂)
- 问项目
- tot怎么做的,了解哪些变体(面试官态度不很好,此时已经不想说话了)
- rm细节 怎么优化
- dpo细节,训练有哪些问题
- ppo细节,调参经验
- 怎么做评估
好久没碰到这么不爽的面试了

网易伏羲(没动静)

oppo(简历挂)

蔚来(简历挂)
(老东家都不收留了,枉我兢兢业业在贵司实习了半年

#面经#
全部评论
佬!OC了这么多啊
2 回复 分享
发布于 2024-08-09 17:46 陕西
百度二年两小时,聊这么久
1 回复 分享
发布于 2024-08-09 18:05 广东
佬百度那个oc他是咋说的,就是面完三面之后说10月份再聊是吗
点赞 回复 分享
发布于 2024-08-23 11:42 北京
minimax提前批发的什么offer呀佬 hr说要去三个月实习?
点赞 回复 分享
发布于 2024-08-20 15:08 浙江
佬,想问一下你讯飞飞星hr面之后多久oc的呀
点赞 回复 分享
发布于 2024-08-18 13:31 辽宁
请问下Minimax的概率题具体是啥样的
点赞 回复 分享
发布于 2024-08-12 02:26 北京
佬,啥背景呀,论文实习竞赛啥的
点赞 回复 分享
发布于 2024-08-12 00:06 北京
oc了可以挂多久嘞
点赞 回复 分享
发布于 2024-08-10 18:17 四川
问下佬飞星的时间线。
点赞 回复 分享
发布于 2024-08-09 22:12 广东

相关推荐

1.实习学到的收获企业化的开发流程2.做的对自己有提升的点?说了调接口查询表格,实现订单的跟踪和合同入库3.做了什么比较难度的?模型微调,先是线程安全的配额检查,然后校验文件格式,然后冻结token,消息队列发送模型微调部署的消息,算法组那边拉取消息去部署,最后用定时任务检查微调任务状态并扣减token4.如果说算法那边部署出问题了怎么办?微调这个接口用什么指标来评价他的好坏?定时任务检查微调任务状态,如果部署失败重新发消息。主要是接口正常返回率和微调成功率吧。5.你说的这个jsonL文件是什么样的一问一答的格式6.那他如果很大怎么办?用的是oss上传api,分片上传,并且支持断点续传,显示上传进度7.用户把文件上传到服务器,服务器在传给对象存储,然后算法去对象存储里拉取是这样吗?是的8.那你只解决的服务器和对象存储之间的大文件传输问题,用户和服务器之间怎么办?不会,不是我做的9.你这里用到了redisson分布式锁是吧,说说咋用的用来记录用户当天调用服务的次数,并且保证其线程安全10.如果没有分布式锁会怎么样可能用户短时间内请求了很多次服务,但是当天的请求次数只加了1,这样会导致用户当天超额部署11.自己做的两个项目哪个熟一点?oj项目12.遇到了什么难点?主要是部署上线,我用云服务器安装宝塔linux部署这个项目,包括maven打jar包,放在vm上部署,最后要配置云数据库和云redis,解决前后端跨域问题。并且这个判题机用的process类执行代码的相关函数之前没有了解过。对我来说比较有挑战13.那你是用物理机部署的,了不了解容器化部署?kubernetes和docker?有没有用过实习的时候用的jenkins就是用的容器自动化部署,只要选择对应的git分支jenkins就会自动部署14.那你了解原理吗?不了解,只会用15.这个oj项目,应该有很多测试样例和输出答案吧?这个怎么做呢?这里首先用户把代码上传上来,然后后端会生成一个判题消息放在broker中持久化,然后判题机拉取消息拿到用户传来的代码,调用process函数拼接指令执行代码然后把执行结果记录到一个list中,有几个测试样例就执行几次,然后最后拿list和标准答案的list做比较,统计分数。16.数据库了解哪些索引b+树索引,主键索引,唯一索引,普通索引,聚簇非聚簇,倒排索引17.库表设计的时候,题目信息和用户传来的代码这两个string字段都比较大吧,那存的时候聚簇索引会出现什么问题?这个导致叶子节点很大,会增大插入和删除节点时维护b+树的压力。(这里答的不对,问ai是会导致每个页(通常16KB)能存储的记录数减少,数据量增长时更容易触发页分裂,页分裂会导致主键索引的维护成本增加,并且会使b+树变得更高,增大了查询成本18.jvm虚拟机垃圾回收了解多少标记整理算法,标记清除算法,复制算法,分代回收算法,CMS,g119.g1比CMS强在哪这里答的很拉,具体看小林coding吧20.我看你用到了rocketmq是吧,那消息丢失是怎么产生的,怎么解决的首先消费者到broker要用ack来确认,broker这边如果异步刷盘突然宕机会导致消息丢失,所以这里要改为同步刷盘,然后消费者这边拉了消息之后不能立刻向broker更新consumerQueue的位置,要等消费消息的逻辑完全结束才能去更新。21.平时玩啥游戏,有没有玩过国外的游戏,用啥加速器,为啥用雷电因为b站搜出来第一个就是他,而且他是按小时收费,感觉好一点22.按月收费和按小时收费你喜欢按小时收费是吧,为什么?23.反问主要做游戏的技术中台,负责游戏饰品交易,活动,游戏加速器,延迟检测等等估计凉凉
查看22道真题和解析
点赞 评论 收藏
分享
评论
12
28
分享

创作者周榜

更多
牛客网
牛客企业服务