實驗室間比對數據統計分析方法的探討

來源：濟南蘭光機電技術有限公司劉開鳳郝文靜周偉芳 | 日期：2014-10-30

摘要	目前，常用的實驗室間比對數據統計分析方法有穩健（Robust）統計法、格拉布斯檢驗法（Grubbs）及科克倫(Cochran)檢驗法。基於濟南蘭光組織的2014年春季塑料薄膜阻隔性實驗室間比對活動，本文對穩健統計法、格拉布斯檢驗法及科克倫檢驗法進行分析比較，探討了三種數據評價方法在計算過程、離群值判斷等方面的區別。
關鍵詞	阻隔性，實驗室間比對，穩健統計法，格拉布斯檢驗法，科克倫檢驗法
文檔	文檔下載

　　近期，Labthink蘭光2014年春季塑料薄膜阻隔性實驗室間比對活動已圓滿落幕，本次實驗室間比對活動采用CNAS-GL02《能力驗證結果的統計處理和能力評價指南》中推薦的穩健（Robust）統計法對數據進行統計分析評價。而在國外，實驗室間比對常用的數據統計分析方法為ISO 5725.2-1994《測量方法與結果的准確度(正確度與精密度) 第2部分確定標准測量方法重復性與再現性的基本方法》中推薦的格拉布斯檢驗法（Grubbs）和科克倫(Cochran)檢驗法。三種統計方法在計算過程特別是離群值判斷方面存在較大差異。基於本次實驗室間比對活動，筆者對三種統計方法進行詳細介紹與分析。

1. 數據統計方法簡介

1.1穩健統計法

　　采用穩健統計法進行統計分析的前提是假設分析的結果服從正態分布。在開始進行統計分析之前，應確保所采集的數據是正確、合理的，並對數據中的粗大誤差和潛在問題進行識別。通常在數據統計過程中需要統計結果數、中位值、標准四分位間距（標准化IQR）、穩健CV、最小值、最大值和極差七種統計量。這些統計量的計算是進行實驗室結果統計評價的基礎。其中最重要的統計量是中位值和標准化IQR，它們是數據集中和分散的量度，屬於穩健統計量，不受數據中離群值的影響。

　　對實驗室檢測結果應使用基於穩健總計統計量的Z比分數（中位值和標准化IQR）進行評價。對於分割水平對樣品a和樣品b應統計計算兩個Z比分數——實驗室間Z比分數（ZB）和實驗室內Z比分數（ZW）。它們分別基於結果對的標准化和（S）和標准化差（D）來進行計算，標准化和（S）和標准化差（D）的計算公式如下：

　　通過計算每個實驗室的標准化和（S）和標准化差（D），可以統計出所有參加實驗室的S和D 的中位值和標准化IQR，再根據公式（3）和公式（4）即可計算實驗室間Z比分數（ZB）和實驗室內Z比分數（ZW）。

　　實驗室結果依據Z比分數（包括ZB和ZW）進行評定。的結果為離群值，時為可疑值。正的實驗室間離群（即ZB≥3）表明該樣品對的兩個結果太高，負的實驗室間離群值（即ZB≤－3）表明其結果太低，而實驗室內離群值則表明其兩個結果間的差值太大。

1.2科克倫檢驗法

　　科克倫檢驗法應用於所有標准差都是在重復性條件下，且由相同數目（n）的測試結果計算得出的情形。實際中由於數據的缺失或剔除，測試結果數可能不同。所以假定在正常組織的試驗中，每個實驗室的測試結果數目不同所造成的影響是有限且可以忽略的，科克倫檢驗中所用的n可取多數實驗室的測試結果數。

　　該統計方法是對標准差的最大值進行評定，屬於單側檢驗。統計過程為先將全組實驗室檢測結果標准差從小到大排列，然後根據標准差的最大值計算科克倫檢驗的統計量，見公式（5）。查閱科克倫檢驗臨界值表，通過比較相同顯著水平下的臨界值來判定該最大標准差是否為離群值。如果標准差的最大值是離群值，則將該值捨去後對剩餘的標准差重新計算科克倫檢驗的統計量。

其中，s_i為實驗室的標准差，s_max是s_i中最大值。

離群值的判斷：

a）當統計量小於等於5%的臨界值時，認為該值是正常值；

b）當統計量大於5%的臨界值且小於等於1%的臨界值時，該值為可疑值；

c）當統計量大於1%臨界值時，認為該值是統計離群值。

1.3格拉布斯檢驗法

　　格拉布斯檢驗法適用於判定一組檢測結果中最大值或最小值是否為離群值，此方法通過計算平均值和標准偏差SD然後再計算統計量（G），見公式（6）、公式（7）。通過查閱Grubbs檢驗臨界值表獲得一定顯著性水平（α）下的臨界值，比較統計量（G）與查到的臨界值。當統計量（G）大於臨界值時，此數據即為離群值，並對剩餘數據繼續檢驗，直到數據中無異常值為止。

Grubbs檢驗的統計量計算公式為：

其中，X_p為一系列數據x_i（i=1,2，…，p）中的最大值；為平均值；SD為標准偏差。

最小值x₁的統計量計算公式為：

其中，x₁為一系列數據x_i（i=1,2，…，p）中的最小值；為平均值；SD為標准偏差。

離群值的判斷：

a）當統計量小於等於5%的臨界值時，認為該值是正常值；

b）當統計量大於5%的臨界值且小於等於1%的臨界值時，該值為可疑值；

c）當統計量大於1%臨界值時，認為該值是統計離群值。

2.實驗室間比對結果分析

　　本次塑料薄膜阻隔性實驗室間比對活動采用“分割水平”的樣品設計，氧氣透過量的樣品分為A、B兩組，水蒸氣透過量的樣品分為C、D兩組。在對實驗室檢測能力進行評定時，不出具“合格”與否的結論，而是使用“滿意”、“可疑”或“離群”的概念。如果一個結果被評定為離群值，這意味著從統計上看它明顯地不同於同組的其他結果。

2.1采用穩健統計法評定結果

　　用穩健統計法計算各參加實驗室的實驗室間Z值（ZB）和實驗室內Z值（ZW）。通過對檢測結果進行統計分析，本次氧氣透過量檢測項目發現實驗室間離群1家，實驗室間可疑2家，實驗室內離群0家，實驗室內可疑6家；對於水蒸氣透過量檢測項目，此次有實驗室間離群2家，實驗室間可疑1家，實驗室內離群7家，實驗室內可疑9家。將實驗室Z值（ZB和ZW）合並統計，本次氧氣透過量項目共有94%的實驗室結果滿意，5%的實驗室可疑，1%的實驗室離群；水蒸氣透過量項目共有84%的實驗室結果滿意，8%的實驗室可疑，8%的實驗室離群。

　　由統計數據可見，實驗室內的離群與可疑明顯多於實驗室間離群與可疑，說明實驗室內部檢測過程中的隨機誤差比較多，而實驗室間的系統誤差要少一些。

2.2采用科克倫檢驗法評定結果

　　用科克倫檢驗法進行數據統計時，需要計算統計量C，再與臨界值進行比較判定離群值。科克倫檢驗法是對檢測結果的標准偏差進行統計以剔除離群值。經過統計計算，本次實驗室比對活動中，樣品A的可疑值有1個，離群值有9個；樣品B有可疑值1個，離群值8個；樣品C有可疑值2個，離群值13個；樣品D有可疑值5個，離群值12個。

　　根據科克倫統計原理，采用此方法時，參與實驗室數量越多，其對應的臨界值越小，即要求標准偏差的離散程度要小。參與實驗室數量少時，對應的臨界值大，那麼對於數據標准偏差離散程度的要求就不是那麼嚴格。因此，在此次實驗室間比對活動參與實驗室較多，而數據的離散程度偏大的情況下，科克倫檢驗法評定剔除的離群值相對較多。

2.3采用格拉布斯檢驗法評定結果

　　在此次實驗室間比對中，對同一種樣品的檢測結果呈兩端離散的形式，所以在采用格拉布斯檢驗法進行數據統計時，需要同時對最大值和最小值計算統計量G_p和G₁，再與臨界值G（α）比較。如果G_p＞G₁且G_p＞G（α），則評定最大值為離群值；如果G₁＞G_p且G₁＞G(α)，則評定最小值為離群值。對於樣品A，經計算沒有發現可疑值和離群值；對於樣品B，經計算發現可疑值2個，離群值1個；對於樣品C，計算發現可疑值2個，離群值2個；對於樣品D，計算沒有發現可疑值和離群值。

　　格拉布斯檢驗法是對實驗室檢測結果的平均值進行統計，從而剔除離群值。在數據量較少時，其對應的臨界值越小，那麼剔除離群值的概率就較大。在數據量較大時，其對應的臨界值越大，那麼剔除離群值的概率就較低。因此，在此次實驗室比對活動中，采用該方法計算時發現的離群值較少。

2.4不同統計方法實驗室比對結果評定的比較

　　對於本次實驗室間比對樣品的參考值，不同的統計方法依據不同的統計量來反映。穩健統計法采用中位值反映樣品的參考值，而科克倫檢驗與格拉布斯檢驗則采用總平均值。總平均值並不是對一組數據計算其平均值得到的，而是首先通過科克倫檢驗法對標准偏差進行評價剔除離群值，然後通過格拉布斯檢驗法剔除平均值的離群值，之後再對剩餘的數據計算平均值即為總平均值。

通過對本次實驗室間比對數據的計算，得到的參考值與離群情況見表1、表2：

表1：實驗室間比對參考值比較

統計方法	樣品A（cm³/m²·24h·0.1MPa）或ml/m²·day	樣品B（cm³/m²·24h·0.1MPa）或ml/㎡·day	樣品C（g/m²·24h）	樣品D（g/m²·24h）
穩健統計法	58.429	17.611	5.433	2.859
科克倫檢驗+格拉布斯檢驗	59.770	17.879	5.368	2.987

表2：實驗室間比對結果統計

統計方法	樣品		滿意（個）	可疑（個）	離群（個）	備注
穩健統計法	ZB	樣品A+B	101	2	1	樣品A、B用於氧氣透過量測試；樣品C、D用於水蒸氣透過量測試。
	ZB	樣品C+D	108	1	2
	ZW	樣品A+B	98	6	0
	ZW	樣品C+D	95	9	7
科克倫檢驗+格拉布斯檢驗	樣品A		95	1	9
	樣品B		96	3	9
	樣品C		96	4	15
	樣品D		99	5	12

　　由表1、表2可以看出，雖然通過穩健統計法判定出的可疑值與離群值數量與通過科克倫檢驗法和格拉布斯檢驗法剔除的可疑值與離群值數量有較大的差別，但是兩種統計方法計算的樣品參考值是很接近的。由此可以看出，穩健統計法和由科克倫檢驗法與格拉布斯檢驗法組合檢驗這兩種檢驗方法的統計參數受極端值的影響都不大。

3. 總結

　　通過對此次實驗室間比對數據的分析統計，可以看出，穩健統計法不受數據量多少的影響，而且受極端值的影響也不大。而由科克倫檢驗法與格拉布斯檢驗法組合檢驗的統計方法，受數據量多少的影響較大，而受極端值的影響較小。不過兩種統計方法相比較，穩健統計法在數據處理和計算程序上更加科學、直觀和簡潔方便。

實驗室間比對數據統計分析方法的探討

按檢測項目選擇

按應用材料選擇

按檢測標准選擇