引入L1正则,也可以理解为对参数分布做了假设,假设w服从拉普拉斯分布,而L2是做了高斯分布;其实工程中由于是浮点数参与计算,L1并不会真正的成0,而是通过截断形式的计算,强行将小的参数w变成0
点赞 1

相关推荐

在看牛客的社畜很积极:身高体重那一行信息去掉,学校那一行的信息放上面,找半天都没找到你是哪个学校什么专业的
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务