线性回归

一、线性模型

(一)概述


 

1.损失函数

基于均方误差最小化来进行模型求解的方法称为“最小二乘法”。(试图找到一条直线,是所有样本到直线的欧式距离之和最小)

2.梯度下降法

①原因
最小二乘法需要逆矩阵,有可能逆矩阵不存在
当样本数量特征较多时,计算逆矩阵非常耗时甚至不可行
②步骤
损失值是否足够小?如果不是,计算损失函数的梯度
按梯度的反方向走一小步,以缩小损失
循环到第一步
③参数更新法则

二、实现线性回归  (LinearRegression)

(一)步骤

使用sklearn库提供的API实现线性回归  LinearRegression
① 导入包
Import numpy as np 
Import sklearn.linear_model as lm  线性模型
Import sklearn.metrics as sm    模块性能评价模块

② 数据预处理
1 提取输入和输出  iloc进行切片 
2划分训练集和测试集 train_test_split  (测试集占比和随机种子需要自己设)

③创建线性模型
Model=lm.LinearRegression()

④ 训练模型
Model.fit
⑤ 预测输出y
Model.predict
⑥ 模型评估
Sm.r2_score()
Sm.classification_report() 
⑦绘制曲线
Plt.plot(x,pred_y,c=’red=)   x 轴 y轴
Plt.scatter(x,y) 散点图
Plt.show()

(二)模型评价指标

平均绝对误差:单个观测值与预测值的偏差的绝对值的平均
均方误差:单个样本到预测值的平方平均值
MAD(中位数绝对偏差):与数据中值绝对偏差的中值
R2决定系数:趋向于1,模型越好,趋向于0,模型越差。

三、多项式回归 (基于线性回归   sp.PolynomialFeatures(项次数),lm.LinearRegression(),用pl进行连接两个模型)

(一)过拟合、欠拟合

过拟合:模型对于训练数据拟合过当的情况,训练集准确率较高,测试集准确率较低,以至模型泛化能力变差。
欠拟合:模型没有学习到数据分布规律,模型拟合程度不够,预测准确率过低。

(二)如何处理过拟合、欠拟合

过拟合:降低模型复杂、扩大样本数据、正则化(L1范数、L2范数)、集成学习(多个模型集成在一起)、
树结构中对树进行枝剪、减少训练的迭代次数、神经网络中加入dropout模型、主动加 入噪声数据样本。
欠拟合:提高模型复杂度、增加样本特征、减小正则化系数

(三)岭回归ridge和拉索回归lasso




















#机器学习#
全部评论
9.12
点赞 回复 分享
发布于 2022-09-12 18:44 北京

相关推荐

程序员花海:实习和校招简历正确格式应该是教育背景+实习+项目经历+个人评价 其中项目经历注意要体现业务 实习经历里面的业务更是要自圆其说 简历模板尽可能保持干净整洁 不要太花哨的
点赞 评论 收藏
分享
行云流水1971:优化后简历(以 “后端开发岗” 为目标) 基本信息 姓名:XXX | 电话:XXX | 邮箱:XXX 求职意向:后端开发工程师 | 意向城市:XXX 教育经历 2023.09-2027.07 XX 大学 | 计算机科学与技术 | 本科 核心课程:Java 程序设计、数据库原理、计算机网络、数据结构(成绩均 85+) 技能关联:掌握 Java 基础语法、MySQL 增删改查,为后端开发奠定技术基础 项目经历 项目 1:小说推荐 - 大数据智能推荐平台 | 后端开发 | 2025.09-2025.12 技术栈:Java、SpringBoot、MySQL、Redis、Kafka 核心动作: 参与用户行为数据采集模块开发,用 Kafka 实现日志数据异步传输,峰值吞吐量提升 40%; 基于 MySQL 设计用户 - 小说关联表,配合 Redis 缓存热门推荐列表,页面响应时长从 300ms 缩短至 120ms; 成果:支撑日均 1000 + 用户访问,推荐内容点击率较初始版本提升 25%。 项目 2:在线博客 - 个性化博客分享平台 | 后端开发 | 2025.03-2025.06 技术栈:Java、SpringBoot、MyBatis、MySQL 核心动作: 开发博客发布 / 编辑接口,通过 MyBatis 实现数据持久化,接口成功率达 99.8%; 设计用户权限控制逻辑,区分普通用户 / 管理员操作权限,避免非法内容发布; 成果:完成 5 个核心功能模块开发,实现博客内容的全流程管理。 技能证书 技术栈:熟练使用 Java、SpringBoot、MyBatis 进行后端开发;掌握 MySQL 数据库设计与优化、Redis 缓存应用 工具:Git 版本管理、Postman 接口测试 自我评价 具备 Java 后端开发基础,参与 2 个完整项目的后端模块开发,能独立完成接口编写、数据持久化等工作;熟悉 SpringBoot 等主流框架,可快速上手企业级开发流程,具备良好的代码规范与逻辑思维。 需要我帮你补充项目的量化成果细节(比如接口性能、用户数据等)吗?若需要更精准的岗位适配优化,可私信沟通。
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务