小米是我面到现在体验最差的了。 刚才小米面试官问我word2vec负采样,我说损失函数是正样本sigmoid算的概率对数+1-每个负样本sigmoid算的概率对数(就是说不是用的softmax),面试官一直说我错了,然后说是用的softmax。 可是我在网上又看了一圈发现负采样都是写的每个样本单独用sigmoid算啊,是他弄错了吗?大佬来帮忙看看? 然后后面问我transformer的输入,我说词向量啊,他说真不是,你下去再去看看吧。我下去才想起来他可能是想让我说还有位置编码,但是说一句“只有词向量吗”就这么难吗? 也许是前面负采样让他觉得我是个大彩笔吧...