random forest 小记

random forest是一种典型的集成学习算法,主要思想是用多颗决策树来集成结果。

RF设置超参的策略:①有这些超参数,比如多少棵树,树分别有多深,分几层等等需要尽量设置的不一样,这样才能让每棵树的能力不同。②随机选取子集,让每棵树看到的样本都不一样,进一步加大区别,让集成学习更加有意义。

结果:对回归问题去均值,对分类问题取众数

优缺点,
优点:①对异常值不敏感,也不容易过拟合,效果稳定。②处理速度快,因为去了子集 ③树状结构可解释性好。
缺点:由于集成度过高,会导致难以处理困难样本,只关注更多的好处理的样本。从而导致起点高,上限低。
全部评论

相关推荐

白火同学:1、简历可以浓缩成一页,简历简历先要“简”方便HR快速过滤出有效信息,再要“历”用有效信息突出个人的含金量。 2、教育背景少了入学时间~毕业时间,HR判断不出你是否为应届生。 3、如果你的平台账号效果还不错,可以把账号超链接或者用户名贴到对应位置,一是方便HR知道你是具体做了什么内容的运营,看到账号一目了然,二是口说无凭,账号为证,这更有说服力。
面试被问期望薪资时该如何...
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务