休哈特控制图
专业分析师 +人工智能
适用于 Windows、Mac、Linux

俄罗斯软件登记册(条目号 18857,日期为 09/05/2023)

购买软件

机器学习(ML)。使用算法训练数学模型 多元线性回归

[多元线性回归]按钮

线性回归是一种回归模型,用于统计一个(解释变量、因变量)对另一个或几个其他变量(因子、回归量、自变量)的依赖性,并具有线性相关函数。

线性回归被定义为确定最适合一组不同数据点的直线的过程。然后可以投影这条线来预测新的数据点。由于其简单性和重要特征,线性回归是机器学习中的基本方法。

在构建某个随机变量对一组多个随机变量(一个因变量与多个自变量)的回归依赖性的情况下,我们称之为构建多元线性回归(多元线性回归)。如果自变量只有一个,他们会谈论建立一个简单的线性回归。

您可以下载结构化电子表格文件的示例,用于创建数学模型并使用多元线性回归算法进行预测(此数据的示例也用于回归模型的决策树和神经网络算法: XLSX

表文件中的结构化数据可用于导入:Excel 工作簿 (*.xlsx); Excel 二进制工作簿 (*.xlsb); OpenDocument 电子表格 (*.ods)。

它用在哪里?

可以应用使用多元线性回归的数据分析:

  • 作为有效的(成本、时间、资源)替代方案” 规划实验 “寻找输入参数的最佳模式;
  • 当通过昂贵和/或耗时的测试来执行输出参数的测量程序时,用于对输出参数进行初步或替代评估;
  • 对于专家决策支持系统(DSS),当决策与人为错误的风险相关时。
数据模型文件

我们的软件可以使用 scikit-learn 库经过训练的多元线性回归数学模型,该模型在其他计算机上创建并保存在文件 (*.sav) 中。

用于连续输入和输出测量的多元线性回归
用于跳转到机器学习 (ML) 功能的窗口

图 1. 用于访问机器学习 (ML) 功能的窗口。将鼠标悬停在主菜单项【数据分析方法】上时,会显示下拉菜单列表。

用于跳转到机器学习 (ML) 功能的窗口

图 2. 机器学习 (ML) 功能窗口。当您将鼠标悬停在按钮上以导航到多个线性回归函数时,会出现工具提示。

多元线性回归函数窗口 - 1

图 3. 多元线性回归函数窗口。

多元线性回归函数窗口 - 2

图 4. 多元线性回归函数窗口。在下拉列表框中[模型评估的图形类型]中,图形[折线图。当前与预测]。

多元线性回归函数窗口 - 3

图 5. 多元线性回归函数窗口。在下拉列表框中[模型评估的图形类型]中,图形[折线图。当前与预测]。该图沿 X 轴缩放。

多元线性回归函数窗口 - 4

图 6. 多元线性回归函数窗口。在下拉列表框中[模型评估的图形类型]中,选择图形[多元线性回归系数表]。

多元线性回归函数窗口 - 5

图 7. 多元线性回归函数窗口。当您将鼠标悬停在用于选择表文件以导入新数据的按钮上时,会出现下拉工具提示。

多元线性回归函数窗口 - 6

图 8. 选择用于使用多元线性回归训练数学模型的表文件的窗口。

多元线性回归函数窗口 - 7

图 9. 多元线性回归函数窗口。将鼠标悬停在选中的 [保存模型] 复选框上时,会出现下拉工具提示。当您在下拉列表中选择所需的因变量 [预测因变量值:] 时,模型会自动保存在适当的应用程序文件夹 [SCCPython\resources\Model_AI] 中

多元线性回归函数窗口 - 8

图 10. 多元线性回归函数窗口。将显示有关保存数学模型文件的消息窗口。

多元线性回归函数窗口 - 9

图 11. 多元线性回归函数窗口。当您将鼠标悬停在按钮上以转至控制面板以选择已保存的数学模型时,会显示下拉工具提示。

多元线性回归函数窗口 - 10

图 12. 多元线性回归函数窗口。用于选择已保存数学模型的控制面板。当您将鼠标悬停在所选数学模型的文件路径上时,会显示下拉工具提示。

多元线性回归函数窗口 - 11

图 13. 多元线性回归函数窗口。用于选择已保存数学模型的控制面板。当您将鼠标悬停在按钮上以转至控制面板以选择包含用于预测因变量的数据的文件时,会出现下拉工具提示。

多元线性回归函数窗口 - 12

图 14. 多元线性回归函数窗口。用于选择具有自变量的数据并应用数学模型来预测因变量的仪表板。当您将鼠标悬停在数据文件的路径上时,会出现一个下拉工具提示。选择数据文件中的一张表来预测指标的值。

多元线性回归函数窗口 - 13

图 15. 多元线性回归函数窗口。用于选择具有自变量的数据并应用数学模型来预测因变量的仪表板。将鼠标悬停在 [预测结果] 按钮上时,会出现下拉工具提示。

多元线性回归函数窗口 - 14

图 16. 多元线性回归函数窗口。通过单击“预测结果”按钮,模型将应用于上一步中导入的数据,操作完成后,将打开一个通知窗口,将预测值保存在 Excel 文件中。

如果您导入的数据包含一个或多个具有分类值的解释变量列,例如 [male,female],则将执行自动 One-Hot Encoding 过程,将数据转换为新的数字编码列 [0, 1]。热编码数据将保存在新工作表中的原始 [xlsx] 文件中。

使用线性回归方法的数学模型精度较低的原因
  1. 线性回归假设的不一致:线性回归假设特征和目标变量之间存在线性关系。如果存在非线性关系,则线性回归的准确性可能较差。
  2. 错误的特征选择:选择正确的特征对于线性回归模型的准确性非常重要。如果模型中包含不适当或不相关的特征,则可能会降低其准确性。
  3. 数据不足:如果模型使用少量数据进行训练,可能会导致准确率较低。可用于训练的数据越多,线性回归模型就越准确。
  4. 违反误差独立性假设:线性回归要求模型误差独立且同分布。如果违反此假设,模型的准确性可能会较低。
  5. 特征的多重共线性:当模型中的特征彼此高度相关时,就会出现多重共线性。这可能会影响线性回归的准确性。
  6. 特征标准化不当:如果特征不标准化,不同尺度的特征对模型的贡献可能不均匀,从而导致精度较低。