刚结束之前的流程就被捞起来了 全程大概1h15min还是先自我介绍,提问论文(大概20min):1.介绍一下论文的Transformer-based model2.Embedding采用的方式3.和Transformer的不同点相比之前对项目的拷打这次的一面以机器学习基础知识为主(记不太全了)1.Transformer哪几层有参数(qkv,LN),推一下Transformer中参数量O(n^2)2.优化器了解吗,推导一下Adam3.BN和LN区别4.序列建模的方法了解吗,比如target attention手撕:1.手写LR反向传播2.leetcode最长递增子序列 dp秒了反问:跟面试官聊了一下推荐的职业路线和如何学习,聊了很长时间