1. Scikit-learn(sklearn)用途:一个功能强大的机器学习库,提供了各种监督学习和无监督学习算法的实现。主要功能:分类、回归、聚类、降维等算法(如 SVM、随机森林、K-Means、PCA)。数据预处理(标准化、归一化、编码分类变量)。模型选择与评估(交叉验证、网格搜索、性能指标计算)。特点:简单易用,适合快速实现机器学习流程。2. LightGBM用途:一个高效的梯度提升框架(Gradient Boosting),主要用于机器学习中的分类和回归任务。主要功能:基于决策树的高性能梯度提升算法(比 XGBoost 在某些情况下更快、内存占用更低)。支持并行学习、类别特征自动处理、大规模数据训练。特点:速度快、内存消耗低,适合处理大数据集。3. Matplotlib用途:Python 中最流行的数据可视化库,用于创建各种静态、动态或交互式图表。主要功能:绘制折线图、散点图、柱状图、直方图、饼图等。支持自定义图表样式(颜色、标签、标题、图例等)。可与 Jupyter Notebook 无缝集成,适合数据探索和结果展示。特点:灵活且功能强大,是 Python 数据可视化的基础工具。典型使用场景数据科学/机器学习流程:用 matplotlib 可视化数据分布。用 sklearn 进行数据预处理和模型训练。用 LightGBM 训练高性能的梯度提升模型(尤其适合结构化数据)