上来先是自我介绍 巴拉巴拉小魔仙~~~~ 一面 : 30min 主要还是以项目为主,下面回忆下问我的一些问题,主要是项目延伸出来的 1.为什么使用中位数对缺失值进行填充,这样做的好处是什么? 2.随机森林的基本原理? 3.讲一下信息增益,信息增益比,Gini系数的关系? 4.讲一下GBDT和Xgboost,说下他们的原理,以及不同点? 5.one-hot编码的原理及意义? 6.特征维度很高时你是怎样做的操作? 7.说下你的缺点和优点? 8.最后让我反问了几个问题 我请小哥哥点评了我这次面试,小哥哥语重心长的说要加强一下理解的深度,还和我说...