9.11 15:00面试官迟到几分钟,上来态度就不好!1、自我介绍2、介绍一下最主要的项目3、项目中的最大困难是什么,怎么解决的(说你的项目少,问点别的吧(但我写了4个,可能和他们方向不一样吧/(ㄒoㄒ)/~~))4、Transformer结构5、attention的计算公式6、attention计算为什么除以缩放因子7、位置编码为什么选择正/余弦编码,有什么好处8、防止过拟合的方法9、正则化具体是怎么做的,L1/L2的区别是什么10、MHA的优点是什么11、MHA的计算复杂度比较高,有哪些改进的方法给一个数组,找出其中目标值出现的次数,必须用二分查找的方法看面试官的态度,估计没戏,啊啊啊啊#