字节跳动自然语言处理面经-成功
上个面经有老哥表示没什么干货,这次记录了大部分的问题
1面
经历
word2vec如何训练,hierarhical softmax和negative sampling(后面的没印象了)
千万向量中找到和单个向量相似的那个
sentence embedding
文章embedding
tf-idf原理
比赛中用到的模型
rnn梯度弥散和爆炸的原因,lstm为什么不会这样
cnn在文本中的用法,pooling的作用,有哪些pooling
dropout的作用
算法题:两个有序数组求交集
这里先写了自己觉得不错的解法,然后他提出自己觉得不错的解法,理解之后过
2面
emsemble原理,boosting两种方法,bagging,stacking
深层网络容易过拟合还是浅层网络容易过拟合
l1范数和l2范数的区别,作用。为什么bias不正则
lstm公式
只管ac的算法题
和为s的所有连续正数序列
3面(答得不好)
介绍项目
transformer结构
self-attention原理公式--为什么有效,答不好,忘记了
gbdt原理,给出了一个比较狭义的解释,但他要比较general的解释,答不好
三面表现比较糟糕,目前是 30天内给通知 这个短信,等结果-,-