大模型面经 (第二期)

上期写道刚开始面试的时候,这期写一写5月11号时候,

这个时候手上就已经有两三家offer了,然后去北京的前一两天又发了三家offer随便选了个离公司近的工资高点的就去了。

那么这期还是讲一下怎么去面试。

其实面试的东西都一样,就是说你干过什么,回答问题就行了你要考虑的,不是这么去背八股文,而是要去琢磨到底要不要去实习,

我个人而言,我最开始是因为电脑配置带不动才去好点的公司有好的卡给我用,然后呢去了也有工资,但是我的自由被限制了,我没法再天天琢磨新玩意我很痛苦,然后学会了怎么摸鱼,人家都是9点半来,我一开始是8点40到,我现在就吃了早饭再去差不多9点能到(就尽力偷懒还是最勤奋的那一批,因为人家都是老油条,而我不大习惯摸鱼,现在也就写的烦的时候回去洗把脸走两圈),

相对于之下可能更愿意回学校躺着,半天打游戏,半天学习,这对我而言收益会更高,所以说大概率这两段实习完了我就会直接去找远程工作的,或者搞证券量化的公司了,因为本身博主是有炒股的习惯,也有网店和自媒体收益,本身上班图个实习经历,说白了工资其实没有副业赚的多,所以待不待都一样,不过尽量出去走走,当然了,也可能直接不干了,直接网上接单做外包也好,做软件,做量化策略当数字游民了,本身也懒得给人家打工。很多人可能会很惊讶,怎么博主大三什么都学了,有懂炒股又会写代码,又搓大模型又懂点中医,还会做短视频剪辑起账号。

对此我要说的是,可以说我每天都在学习,可以说基本上因为离家远的缘故这三年较长的假期,比如国庆,五一我都没有回家或者出去玩,

作为我每天娱乐活动只有三样,打游戏,看书,看电影,然后趁着寒暑假去陌生的城市旅行考察风土人情,然后该旷的课全部旷了。

就这么简单,你连你最基本早睡早起都做不到,又拿什么去改变阶级?以前我总是很疑惑,在我眼里是常识的东西,人家缺难以理解,当下之年轻人,脑袋空空,啥也不想,啥也不问,失了那份心气,缺又怨天尤人,怪这怪那,沉浸于那资本编制的精致的网中,

手中不断刷新着短视频,小红书,上网浏览网页,被各种各样的小游戏,小玩意吸引注意力,回头望去,又是空耗一天,慢慢变得麻木,变得那般痴傻而无所事事。

你想减肥又管不住嘴,你想看书买了一大堆却舍不得花一点时间看看,明知如此却还是不肯承认,最后摆烂,然后过了段时间又说早该健身的,你要我说你为什么这么别扭呢?你想吃就吃,你想玩就玩,你管他呢,为什么要活在别人眼里,是你喜欢你才去做,

于我而言,我说了我要去写书,所以我更新博客,而我不希望你还是因为每天荒废时间而烦恼什么,想耍就耍嘛,找不到工作又不会天塌了,每天学了78个小时就差不多了,别学那么累哎呀。

好了,言语可能有点尖锐,很感谢大伙驻足观看,说正事。

一家厦门的小厂:

这老板做数字人的,我说一天200行不行,他说直接说月薪啊,随便提,确实爽快,然后随便报了个5500,他说好,满口答应,我估计叫9k也许也会同意。

先自我介绍,

然后介绍公司干什么,问怎么去做数字人,

我把开模啊那些然后怎么本地部署怎么引流给他整了,

他很满意,

又问spring的东西,问了些vue,问了问钩子和生命周期。

然后又问了问ai的发展方向是什么,怎么看待deepseek,

然后就oc了,这种公司一看就是老板心血来潮刚开的公司,然后就是厦门太远了,要是去其实也可以去,你去了学的就不是写代码,你学的是怎么干销售怎么去搭建软件和环境之类的。

一家西安的大厂:

因为这些公司都离山东太远了,正好手头上有两家北京的offer所以说先考虑的就是北京的公司,

上来先自我介绍,

整了个小算法题,

然后问了解强化学习吗?

然后问深度学习的东西,问了问你怎么不搞搜广推那些,我说这个有点落后于时代了,

他点点头说大模型你怎么学的。

就光看开源项目,网课,文档,不懂的就问ai之类的,

他反问没有什么老师带着你?我笑了,有人带着学就好了,现在这些老师根本没我懂,每个老师方向都不一样,而且基本上满脑子只是想着怎么搞产出,不会去研究琢磨东西是怎么来的,怎么去用怎么去实现。

接着问我简历项目怎么设置过滤的,

你项目里面的混合精度损失函数怎么设置的,

然后过了几天就oc了,可能实在缺人吧没催什么,

直接上来个hr加微信说你过了。

最后照例推荐一下音乐:这放假啊,每天就是没人看,大伙喜欢的点个关注,听听HeatWaves假设你喜欢的我的品味那么实在荣幸之至,过几天再更新吧,这会确实没什么人看。

#创作激励计划##牛客激励计划##面试问题记录#
全部评论
真干
点赞 回复 分享
发布于 06-04 10:14 四川
mark学习
点赞 回复 分享
发布于 06-04 09:45 北京

相关推荐

1️⃣一面时间:9.12  时长:1hcode:统计岛屿数量、最大岛屿面积,DFS方法解了然后介绍实习项目,面试官非常耐心地听,没有打断八股1.bert和gpt的区别?(从模型架构、训练方式、使用场景方面回答的)2.训练/微调一个LLM的流程?3.实习时用的 megatron 框架吗,对分布式训练框架了解多少?(回答了deepspeed和megatron区别,以及几种并行方式,以及deepspeed的三种zero)4.了解强化学习吗,跟SFT有什么区别?5.反问:业务,对岗位的期望💣评价:有点紧张,算法题有一个小失误没注意到2️⃣二面时间:9.14  时长:1h八股1.写一下 attention 公式(代码实现了下)2.训练时为什么要mask,推理时也需要吗?两处有什么区别?推理时的sequence length和训练时一样吗3.transformer和传统seq2seq模型有什么区别?4.计算attention时为什么要除以d_k,这个d_k的含义是?5.attention计算时还有哪些scale处理?6.attention中softmax函数作用、公式、为什么有减去最大值的处理?换个函数还能这样处理吗?7.解释数值上溢、下溢问题8.讲一下prompt书写的经验,如何判断prompt是否达标,如何改进prompt9.讲一下SFT,会对哪部分计算loss?为什么?10.讲一下deepspeed11.训练用一个7b模型要占用多少显存?不同zero阶段能够节省多少显存?12.训练模型时用了几张卡,有遇到什么异常中断问题吗?反问: 在乎候选人什么能力?对面试表现有哪些改进意见?💣评价: 基础不够扎实,网上有的知识都能回答上来,在同龄人里算比较优秀,欠缺一些多机多卡实践经验。  
查看17道真题和解析
点赞 评论 收藏
分享
评论
11
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务