休哈特控制图
专业分析师 +人工智能
适用于 Windows、Mac、Linux

俄罗斯软件登记册(条目号 18857,日期为 09/05/2023)

购买软件

将相关图(散点图)与分布直方图和热相关矩阵配对,以表示无限数量的因素

多元统计分析MSA(多元统计分析)。

[多元统计分析]按钮

散点图功能具有分布直方图和相关热图,提供了一种有效的方法来直观地表示数据中表示的许多因素(测量值和计数)之间的统计函数关系。每张图均显示趋势线方程、皮尔逊相关系数 [R] 和决定系数 [R²]。

您可以下载结构化电子表格文件的示例,用于创建带有值分布直方图和相关性热图的散点图: XLSX

表文件中的结构化数据可用于导入:Excel 工作簿 (*.xlsx); Excel 二进制工作簿 (*.xlsb); OpenDocument 电子表格 (*.ods)。

需要注意的是,高相关系数并不能证明分析因素之间存在因果关系,而是表明它们之间的统计函数联系。例如,这两个因素都可能取决于一些其他因素或一组其他因素。

打开主程序窗口的菜单,进入多维数据分析控制面板。

图1. 主程序窗口菜单打开,进入多维数据分析控制面板。

定性特征多因素相关分析-1.

图 2. 将鼠标悬停在按钮上时,会显示一个下拉工具提示,转至控制面板,查看带有各个值分布直方图的配对相关图(散点图)。

定性特征的多元相关分析-2。

图 3.带有直方图的散点图控制面板。通过在散点图上用户选择的点上单击鼠标左键,将显示带有数据点(行)编号的标题。通过在热图中用户选择的彩色区域上单击鼠标左键,将显示标题,其中包含沿 Y、X 轴的源数据列的名称和相关系数。隐藏签名是通过右键单击签名区域来完成的。

由于有大量受监控的可测量因素,即使是经验丰富的技术人员也很难理解受监控的过程特性之间可能存在的关系。使用我们的软件,您可以一键分析无限数量的因素,注意异常异常值(图表上总体之外的点)或成对的相关性预期大小和方向(负、零、正)的差异分析值。

定性特征粘度和pH值的多元相关分析

图 4.带有直方图的散点图控制面板。将鼠标悬停在热图控件中的“执行”按钮上时打开工具提示下拉列表。

多元相关分析艾姆斯住房数据集

图 5. 热图控制面板。热图中相关系数的标签被禁用。在热图控制面板中,选择了所有 35 个源数据列的范围。在热图上显示用户选择的相关区域的标题。数据来源:艾姆斯住房数据集。

表达式“4.552e+04”表示数字 45,520。这个数字用科学计数法表示,其中“e+04”表示乘以10的4次方,即该数字乘以10,四倍。

多元相关分析艾姆斯住房数据集

图 6. 热图控制面板。在热图控制区域中,启用相关值标签,并选择源数据从第 25 列到第 35 列(含)的范围。数据来源:艾姆斯住房数据集。

定义

相关系数和决定系数是相互相关的,两者都用来衡量两个变量之间的相关程度。

相关系数(表示为 R 或 r)衡量两个变量 (x) 和 (y) 之间的线性关系程度。它取值从-1到1,其中-1表示完全负线性关系,1表示正线性关系,0表示没有线性关系。相关系数显示数据点与趋势线或回归线的接近程度。因此,数据点越接近趋势线,相关系数越高,变量 (x) 和 (y) 之间的关系越强。

决定系数(表示为 R² 或 r²)是相关系数的平方。它显示了因变量 (y) 中的方差有多少可以由自变量 (x) 解释。决定系数的范围为 0 到 1,其中 0 表示自变量不能解释因变量的变异性,1 表示自变量完全解释因变量的变异性。

因此,相关系数显示了变量之间的关系程度,而决定系数则显示了自变量解释因变量变异性的程度。

排放量的定义

通常,借助简单的图形方法,可以了解一对中的两个因素中的哪一个是造成观察到的异常值的原因,为此,只需查看每个因素及其自身的直方图的相关图,参见图 6。

多元相关分析:因子 1 和因子 3 与其自身相关的图表

图 7. 相关性热图仪表板:所有因素和因素 1 与其自身的相关性图表。记录Factor-1的两个值有问题。

鼻子 操作意义 这种对“异常值罪魁祸首”的理解只能通过 Shewhart 根据 Factor-1 的初始数据构建的个体值控制 XMR 图来确认或反驳,参见下图 5。

控制单个值的 XmR 图,根据 Factor-1 的初始数据构建(去除异常值之前)。

图 8. 根据 Factor-1 的初始数据(去除异常值之前)构建的各个值的控制 XmR 图。

根据Factor-2的初始数据构建的个体值的控制XMR图

图 9. 根据 Factor-2 的初始数据构建的各个值的控制 XmR 图。 mR-map图上从81到89的一系列红点是了解这些点出现的特殊原因的理由。重要的是,图 4 中的多变量分析不具备这种能力。

根据Factor-3的初始数据构建的个体值的控制XMR图

图 10. 根据 Factor-3 的初始数据构建的单个值的控制 XmR 图。

重要的

有时,仅删除一个异常点即可将相关方向(趋势线的方向)从正相关更改为负相关。您应该意识到趋势线和所有自动计算的导数的这种行为的可能性,例如:趋势函数的方程、决定系数 R2(近似的可靠性值)和相关性 R。此评论也适用于根据原始数据构建的线性方程和其他类型的回归。第一步是查看您的数据,这些数据以图形方式呈现在休哈特控制图上。注意操作员的初始数据输入过程,并使用输入值的自动验证来改进它。

例子。某大型制造企业生产一种产品,仅长度和直径略有不同,对一对产品圆度指标进行多元相关分析,结果表明这些指标的相关性方向相反,原始数据中没有发现异常值。数据。让我向生产管理人员指出生产线操作员可以根据产品的尺寸控制相同流程的不同方式,这导致了对操作员实际操作的调查。

通常,排放是由一些微不足道的原因引起的,例如,控制器在记录从设备读取的值时出现错误(这是一个特殊原因)。休哈特控制图可以轻松应对此类超出过程控制上限和下限限制区域的错误条目,例如,分隔整数部分和小数部分的符号移动一位数。例如,写为 0.0232 或 2.32,而不是 0.232。

但在某些情况下,如果记录一位数字出错,控制器会在记录值时出错,同时该值仍保留在过程控制上限和下限所限制的区域内。例如,将 (0.232) 写为 (0.282)。在这种情况下,多元统计函数将有更好的机会识别具有写入错误的数据行。但你必须明白,休哈特控制图的鲁棒性(普遍适用性)是由于这样的误差不会对过程控制限值的计算产生任何重大影响,而这是休哈特控制图最重要的属性。

数字运算者可以使用我们软件中的回归模型(预测连续变量)的机器学习功能,或使用 Microsoft Excel 中包含的数据分析包来计算数据的线性回归模型。接下来,您可以使用休哈特控制图(XmR 或 XbarR)来分析残差(实际值与模型预测值之间的差异)。如果控制图显示的子组(红点)带有特殊变异原因的迹象,这也可能表明数据模型与当前流程之间不匹配,则必须解决并消除这些原因。

例如,根据回归模型的[残差]值构建的单个值和移动范围的控制 XmR 图将用作 操作定义 ,而不是对散点图中观察到的异常值(异常值或非异常值)的主观判断。

而且,此类分析将保留有关实际值相对于线性回归函数预测值的偏差的信息,这极大地方便了数据的解释,并且是与使用 Hotelling T2 图表分析数据的重要区别。

关于多因素 SPC 的热情

许多喜欢使用数字而不是车间级流程的专家关于多元统计流程控制的目的是为了更有效地控制多因素流程(与传统的休哈特控制图相比)的说法毫无意义。就好像休哈特、戴明、惠勒为单因素过程构建了控制图一样,这样的过程根本不存在。此外,如果您还没有开始使用休哈特控制图来管理生产流程,那么生产流程很可能处于统计上无法控制(不可预测)的状态。此类过程的休哈特控制图已经包含需要处理的信号,以便消除特殊原因并使过程进入统计控制状态。

虽然多元分析对于管理层来说似乎很前沿,但向车间工人解释使用多元统计控制所学到的知识只会让他们感到困惑,证实改进车间流程的工作“非常困难”,并进一步阻碍公司的发展。基层员工。