上来就是基础抢答题,项目的话“等到有时间再问” 1. 生成式模型与判别式模型 2. 你知道的机器学习流程(我答了需求分析、特征工程啥的,想不到别的了) 3. 偏差高、方差低怎么办(Boosting集成学习,欠拟合的处理方法:增加迭代轮数,使用更复杂的模型) 4. 偏差低、方差高怎么办(Bagging集成学习,过拟合的处理方法:增大数据量、正则化、降低模型复杂度) 5. (此处讲了一个具体的场景)如何在数据不平衡的场景建模?(话说我答了GBDT相较于随机森林,对于数据不平衡更不敏感,不知道对不对,求大佬纠正) 6. 当阈值从0.5调到0.6,精确率pre、召回率rec、准...