大模型面经(第一期)
因为又被运营约稿了,然后也老被催更新,
所以趁着放假就更新一下,这篇就写怎么去面试,怎么去准备大模型吧,
这里也很有意思,这个牛客网在boss上来要我简历了,后面加了微信不过他们只要2-4年的资深大模型工程师。
那么直接开始吧,本来打算早点更新的,不过嘛,下班之后一直在打游戏,对此只能说三角洲太好玩了,琳琅天上还是当年模样,
好玩,想起小学时代玩的qq飞车了(时代眼泪了算是,现在人估计都没听过这个游戏了何况会去玩呢,真怀念那会边听歌边跑图)
一晃便过去一个时代,这时间若白驹过隙,所以啊,诸君当是要珍惜时间和家人,不要太看重工作。
先随便讲点吸引大伙注意力,那么直接开始今天的教程。
先叠甲:以下的问题,基本上都是我面试面出来的,很可能跟你理解的会有出入,或者会让你感到惊讶。
5.6(无实习):
面试刚开始的时候:
一家小厂:
先做个自我介绍(一般上都有这么个流程,大伙尽量简短,然后要说明自己已经介绍完了,着重说明优势在哪里,我开局就说我有两年开发经验,然后一般人家就会开始问了)
你觉得agent是什么?
你有没有什么常用的ai?
你知道GPT和BERT的区别是什么吗?(就语言推理和双向模型,具体自个去看,这里先做总结,毕竟篇幅有限难以面面俱到)
请问cot是什么?
请问function call现在用在那里?(就上下文召回和函数调用)
问了下我的项目,你自己研究的模型?
我说整体架构我做的,调用的是deepseek-r1-7b这个,
为什么用这个?
废话,电脑只能带的动这个,qwen3-32B下载下来都要400多G,何况跑起来。
请问整体模型微调步骤是什么?
请问deepspeed-Zero是什么?(加速推理的东西,自己去看)
两天后oc,
一家远程:
先自我介绍。。。。。。
首先给我来了一手小小的面试官自我介绍(就是接入LLM做了数据库,然后人在西海岸拉投资,西雅图的硅谷,并不是HK,大伙估计不知道有这么个区别,我讲清楚)
你知道ppo是什么吗?
请问RL和DPO的区别是什么?
请问megatron怎么用?
请问有没有用过云计算?
假如你加入我们可以干多久,然后是否熬夜对进度?(因为美国和中国存在时差)
你的agent怎么样?
用没用过fastapi?
你觉得和spring的tomcat区别是什么?
为什么不考虑AWS?(原因很简单,要钱,懒得租人家的)
第二天上午oc,因为说了8月份才给工资原因是他们手上没钱,估计是8月份拿到投资给期权之类的,这懒得打白工加上手上几家offer直接不管他了。
一家中厂:
这里说清楚,如果公司让你去线下面试,直接问能不能远程线上面试,不行就不去,真给他脸了,你来回要时间,万一挂了也难受,
这些人就故意恶心人的,我操tm的开个腾讯会议都不愿意这家公司你去了也干的不顺心懂吗。
问了学习的方向,我说专业分流到人工智能方向,
问了cnn,RNN是什么(卷积神经网络,和随机神经网络,去搜网课看看就行,他考的基本都不难就知道这个怎么算的就行了)
,
然后介绍了公司干什么,一家做金融,估摸着是外包,然后去了可以学债券金融之类的,然后可以给证券公司内推之类的。
不用管,这些钱才是真的,工资没人家高,150一天,boss看着100到499个人,完事还在广州不考虑这家。
然后问了场景题,你现在想做一个评论搜集的功能你要怎么做?(就是控评,我说了怎么洗数据,怎么采样,然后权重比,然后加个关键字过滤之类的)
然后问你项目里面怎么做到把90%的准确率的,我直接实话实说,想让简历更好看点所以就写了个这个,实际上测了40轮,大概准确到36轮左右。
那个hr直接认可坦率与真诚哈哈哈。
第三天上午发了offer。
那么这期先写到这里了,先吃饭先。这里再推荐一首Por Una Cabeza跳舞的小曲~。可以去听听看,最后希望这首歌能给你带来好心情。后面还会写面经,大伙点个关注先,想看随时可以看到,然后想要路线的,直接私信我就行,最近又更新了一版学习路线。
#牛客激励计划##牛友故事会##创作激励计划##牛客创作赏金赛##面试经验谈#