使用休哈特控制图分析罕见事件

文章:[39] DONALD J. WHEELER:“处理罕见事件”。来源: www.qualitydigest.com
翻译、注释和附加图形材料及解释:AQT 中心科学主任 谢尔盖·格里戈里耶夫 ,使用唐纳德·惠勒向他提供的文章材料和许可。

免费获取文章不会以任何方式降低其中所含材料的价值。

当平均数量变得非常小时会发生什么?

从数据分析的角度来看,罕见事件是有问题的。在发生事件之前,没有什么可计算的,因此,我们的许多时间段将以零值结束。由于零值不包含真实信息,因此我们需要考虑计算罕见事件的替代方案。本文将探讨处理罕见事件的简单和复杂方法。

我们的第一个例子涉及化工厂的泄漏。尽管泄漏是不受欢迎的,并且尽管已尽一切努力防止泄漏,但泄漏还是偶尔发生。在过去的几年里,一家工厂平均每八个月就会发生一次泄漏事件。当然,如果工厂平均每八个月发生一次泄漏,那么每月 1 次泄漏将比平均水平高 700%! (在处理罕见事件时,一个单位的变化可能会产生巨大的百分比差异。)前四年内总共发生了六次泄漏事件。 48 个月内发生 6 次泄漏,平均每月发生 0.125 次泄漏。

正如我在文章前面所建议的那样,如何使用 XmR 图表来表示各个值和这些计数的滚动范围: 替代数据(属性、计数)的控制图 p 图、np 图、C 图和 u 图或单个值的一张 XmR 图 ?使用前四年作为基线,移动极差图的控制上限为:0.83,单个值的 X 图的控制上限为:0.80。这使得每个月发生的泄漏事件都成为系统发生变化的信号!显然这是对这些数据的误解。问题在于,在这种情况下,该 XmR 卡会出现数据不足的情况。 (任何类型的数据都可能出现稀疏数据。如果平均计数数低于 1.00,则计数数据往往会变得碎片化。稀疏数据人为地缩小了过程行为图的限制,并导致过多的误报。)

稳定测量系统的可能误差

图 1. XmR 卡每月的溢出次数

当计算罕见事件时,特殊卡变得不敏感并且XmR卡失效。这不是控制图的问题,而是数据本身的问题。对罕见事件进行计数本质上是不敏感且薄弱的。无论如何分析这些计数,将这些数据放在任何类型的控制图上都不会显示任何内容。但还有其他方法来描述罕见事件。您可以测量泄漏之间的天数(测量罕见事件之间的范围),而不是计算每月的泄漏次数(事件计数)。对于这些数据,溢出之间的时间间隔计算如下。

稳定测量系统的可能误差

图 2. 确定泄漏之间的时间。

322 天内发生一次泄漏相当于每天 0.0031 次泄漏的泄漏率:1⁄322=0.0031

如果将每日泄漏率乘以 365,则每年发生 1.13 次泄漏:0.0031×365=1.1315

因此,第一次和第二次泄漏之间的间隔相当于每年 1.13 次泄漏。同样,第二次和第三次泄漏之间的间隔为 247 天,这意味着每年的泄漏率为 1.48 次。继续这样,每次发生事件时,我们都会得到瞬时泄漏率。

稳定测量系统的可能误差

图 3. 瞬时泄漏率

稳定测量系统的可能误差

图 4. 泄漏率的 XmR 图

前四年的平均泄漏率为每年 1,418 次泄漏。平均移动极差为 0.244。虽然使用五个值来创建 XmR 图表的情况很少,但获得这五个值却花了四年时间!

如果未来点高于控制上限,则表明泄漏率正在增加。未来,低于控制下限的点将表明泄漏率正在下降。控制限之间区域中的点将被解释为意味着泄漏率没有变化。 2005年的两次泄漏事件的间隔分别为172天和115天。这些间隔转化为每年 2.12 次泄漏和每年 3.17 次泄漏的泄漏率。当这些值添加到 XmR 图表中时,我们得到如图 5 所示的结果。

稳定测量系统的可能误差

图 5. 溢出率的完整 XmR 图

尽管2005年的第一次泄漏超出了限制,但也勉强超过了限制。鉴于基于五个值的限制的软弱性,我们可能会犹豫是否将第六点解释为明确的变化信号。然而,第七点已经远远超出了限制,可以安全地将其解释为一个明确的信号——今年泄漏水平有所增加。如果我们返回到图 1,我们会发现泄漏事件的间隔越来越近,但除非我们从计算罕见事件转向测量事件之间的机会窗口,否则我们无法检测到这种变化。

请注意,虽然图 1 和图 5 显示的是泄漏率,但图 1 和图 5 之间的变量发生了变化。在图 1 中,变量是每月泄漏次数。这里分子可能会改变(泄漏次数),而分母保持不变(一个月)。图 5 显示了瞬时泄漏率,其中分子保持不变(一次泄漏),但分母可能发生变化(两次泄漏之间的天数)。

不是使用图 6 中的瞬时泄漏率,而是使用泄漏之间的天数来构建 XmR 图表。该控制图是反向测量图。随着泄漏变得更加频繁,图 6 中的点向下移动。这种简单的倒置给那些必须解释该控制图的人造成了认知失调。虽然这不是一个不可逾越的障碍,但它仍然是一个不必要的障碍。图 5 中显示的瞬时泄漏率比图 6 中泄漏之间的天数更易于使用和解释。

稳定测量系统的可能误差

图 6. 泄漏间隔天数的 XMR 图表

除了事件之间的时间是相反的衡量标准之外,该图表的敏感性不如瞬时泄漏率图表。在图 5 中,每当泄漏率超过每年 2,066 次时,就会发现泄漏率增加。图 6 中的下限对应于每年 2.714 (365 x 1/134.475) 次泄漏的泄漏率。鉴于这些都是罕见事件方法,并且我们希望尽快检测到泄漏率的任何增加,因此图 6 中所示的如此低的灵敏度是不可取的。

尽管瞬时速度控制图通常是首选控制图,但在一种情况下事件时间图很有用。此时图 5 的下限低于零。发生这种情况时,瞬时速度控制图将不再显示改进。如果您正在采取行动来减少罕见事件的发生频率,因此检测改进很重要,那么您可能需要构建瞬时速率和事件之间时间的控制图。瞬时速率控制图将允许您检测罕见事件频率的增加,在这种情况下,事件之间的时间控制图将允许您检测高于控制上限的点的速度下降。这将通过以下示例进行说明。

概括

当一段时间内的平均计数低于 1.0(个)时,您正在处理罕见事件。当这种情况发生时,p图、np图、c图和u图将变得非常不敏感。同时,稀疏数据问题将阻止您使用具有元素计数或事件计数的 XmR 图表。发生这种情况时,您应该停止对一段时间内的事件进行计数,而是测量罕见事件之间的范围。这是您不再每次都获取值的地方,而是每次发生事件时都获取值。 (收集数据方式的这种转变反对使用这种方法,除非在极少数情况下。)

使用事件间时间时,您可以计算每个事件的瞬时速率并将其放置在 XmR 图表上,如图 4 和 5 所示,也可以直接使用事件间时间,如图 6 所示。当这些控制图变得片面时,您可能需要使用两种类型的控制图来识别改进和恶化。

Sergey P. Grigoryev:例如,为了分析紧急航天发射的数据,可以使用定义域——紧急发射之间成功发射的次数,其中紧急发射被用作罕见事件。作为紧急发射的速度,可以使用1次紧急发射除以前一次紧急发射的成功发射次数所获得的值。或者您可以直接使用两次失败之间的成功启动次数。