一個(gè)分布要么是對(duì)稱的,當(dāng)高的值和低的值相互平衡抵消;要么有偏斜,當(dāng)非對(duì)稱并且在高值和低值間不平衡。要判定一組數(shù)據(jù)的形狀,我們必須比較均值和中位數(shù)。如果這兩個(gè)值相等,CTQ或者X被認(rèn)為對(duì)稱的(零偏斜)。如果均值小于中位數(shù),變量被稱為負(fù)偏斜,又叫左偏斜。如果均值大于中位數(shù),變量被稱為正偏斜,又叫右偏斜。因此:


均值>中位數(shù):正偏斜(positive),又叫右偏斜。

均值<中位數(shù):負(fù)偏斜(negative),又叫左偏斜。

均值=中位數(shù):對(duì)稱的(symmetry),又叫零偏斜。


當(dāng)均值由于某些非正常的大數(shù)值而增加時(shí),正偏斜會(huì)發(fā)生。當(dāng)均值由于某些非正常的小數(shù)值而減少時(shí),負(fù)偏斜會(huì)發(fā)生。當(dāng)分布為對(duì)稱形狀時(shí),是沒(méi)有某一極端方向特別的數(shù)據(jù)出現(xiàn)的(見(jiàn)圖1)。


什么是數(shù)據(jù)分布的形狀

圖1 三組數(shù)據(jù)的分布形狀比較


圖1a中的數(shù)據(jù)是負(fù)偏斜的,又叫左偏斜。在此圖中,有一個(gè)由于某些特別小的數(shù)據(jù)引起的長(zhǎng)尾和偏向左側(cè)的彎曲。這些特別小的數(shù)據(jù)將會(huì)使均值減小以致均值小于中位數(shù)。圖1b中是對(duì)稱的,曲線兩側(cè)部分和對(duì)方對(duì)稱,大小值相互平衡,均值等于中位數(shù)。圖1c為正偏斜,又叫右偏斜。在此圖中有一個(gè)由于某些特別大的數(shù)據(jù)引起的長(zhǎng)尾和偏向右側(cè)的彎曲。這些特別大的數(shù)據(jù)將會(huì)使均值變大以致均值大于中位數(shù)。


在下表中,Minitab計(jì)算偏斜統(tǒng)計(jì)量等于0.10,因?yàn)榇藬?shù)很接近于零,我們可以得出如下結(jié)論:訂單完成時(shí)間是對(duì)稱的。


什么是數(shù)據(jù)分布的形狀

使用Minitab計(jì)算完成時(shí)間的描述性統(tǒng)計(jì)


為了判定一組數(shù)據(jù)是對(duì)稱的或者有偏斜的,我們可以考慮在樣本值分布中是否有超過(guò)一個(gè)的集中值(concentrations)。有兩個(gè)集中值的分布被稱為雙峰的(bimodal)。雙峰分布的存在常常意味著這組數(shù)據(jù)是由兩組數(shù)據(jù)被不合理的結(jié)合在一起的。


為了說(shuō)明雙峰分布,有一家銀行收集了200個(gè)在高峰期抵達(dá)的客戶的樣本數(shù)據(jù)來(lái)判定客戶的原意等待時(shí)間。圖2為用Minitab直方圖表示的等待時(shí)間:


什么是數(shù)據(jù)分布的形狀

圖2 等待時(shí)間的Minitab直方圖


在等待時(shí)間的分布上有兩個(gè)波峰,一個(gè)在3.5和4.5之間,另外一個(gè)在6和7.5之間。事實(shí)上,這些數(shù)據(jù)是來(lái)自一家銀行的兩個(gè)不同分行的。第一家分行的等待時(shí)間數(shù)據(jù)是來(lái)源于周五中午12點(diǎn)到下午2點(diǎn)(這家分行位于城市的中心商業(yè)區(qū))。第二家分行的等待時(shí)間數(shù)據(jù)是來(lái)源于周五下午5點(diǎn)到下午7點(diǎn)(這家分行位于居民區(qū))。


圖3為兩家分行等待時(shí)間的Minitab點(diǎn)圖:


什么是數(shù)據(jù)分布的形狀

圖3 顧客等待時(shí)間的Minitab點(diǎn)圖


從圖3我們可以發(fā)現(xiàn)兩家分行的顧客等待時(shí)間分布是不同的。第一家分行的顧客等待時(shí)間分布集中于3~4分鐘,而第二家分行的顧客等待時(shí)間集中在7~8分鐘。

查看更多請(qǐng)點(diǎn)擊-->:六西格瑪工具

上一篇:什么是變量?

下一篇:什么是箱線圖?

六西格瑪工具相關(guān)文章
精益六西格瑪培訓(xùn)課程