一面:8.11 自我介绍 介绍实习项目; 对于极度不平衡的样本,如何选取更有用的特征,acc不能很好的评估效果,如果更好的评估 如何处理回译效果不好,同义词替换效果不好,EDA数据增强的阈值,无监督的怎么做的。 介绍word2vec,负采样的细节,fasttext的改进,特征hash的作用 算法题: 用rand2实现rand5,解释拒绝采样,让我算数学期望。 概率p输出1,概率1-p输出0,等概率输出0和1,并求数学期望。 二面:8.13 介绍论文做的东西, 1.介绍一下Bert以及三个下游任务,self-attention 2.除了Bert其...