面试岗位AI软件开发面试官一副肥头大耳(虽然评论外貌有点不妥,但是忍不住了),语气中给人透露着傲慢,感觉参加的不是面试,而是一场羞辱,承受着他工作中的不顺。开局介绍项目,然后说你这个C++还能编译为arm架构?用的什么编译的?arm指令版本是什么?cmake编译时能看到arm参数吧,你设的参数是什么?在你这arm机器上还能运行python?你这里提到了npu,他的具体型号是什么?他内存布局是什么样子?存储层级是什么?他的内存可以改吗?你说npu共用操作系统内存,NPU存储和ARM存储有什么区别?(WCNM,实习干的就是上层应用,谁TM关注底层NPU,而且这是我能接触到的吗?要不要我去把NPU图纸偷出来给你看,开局一套组合拳给我干麻了?语气就是,你真的在这里实习过?)接着八股期间让先介绍Transformer多头注意力机制,介绍完之后,他说我要的是你介绍他里面怎么算的,我???(我不是刚介绍过了吗,包括QKV矩阵和点击注意力和多头怎么切片),我说我刚才介绍了,然后又重复了一遍他的问题,我要的是多头注意力怎么计算的?我愣了,我说那我在白板上演示下每一步怎么计算以及得到的结果的维度,他说不用,你就语言说一下多头注意力怎么计算,我说的还不够清晰?听不懂?后面的八股包括但不限于大模型训练用什么优化器,adam相较于SGD的优点,ADAM里面动量是什么,怎么更新计算,交叉熵损失的物理意义是什么?介绍一下pytorch里面的**和**模式(没听过,没记住),介绍pytorch indicator,pytorch支持的模型并行化方法有哪些,在数据并行和模型并行的时候,哪些模块消耗显存?模型量化方法有哪些?模型训练时链式求导怎么算的,不要说数学推导,有两个fc层的残差结构,链式求导怎么求?介绍python gc模块,python中怎么解决循环引用。yield和yield from的区别是什么?cpp模版里的内存萃取是什么?模版特化是什么?python和cpp多线程有什么区别?Python线程和协程有什么区别?python里异步调用和同步调用区别是什么?其中很多都没答上来,最后快结束的时候说,那我们问个简单的,都知道的东西,在x86的cpu中,为什么一个核心通常都是有两个线程。(我不知道,在这一刻,仿佛失去了所有的力气和手段)固然,我是个彩笔,达不到你们的招聘要求,但是有必要这样的压力吗?面完心态直接炸穿了。