此篇論文之出處如下:
Title : Statistical errors in medical research – a
review of common pitfalls.
Author : Alexander M. Strasak Qamruz Ezman, Karl P.
Pfeffer, Georg Gobel, Hanno Ulmer.
Source : Swiss Med. Weekly 2007, 137 : 44-49.
這篇文章共有6名作者,都是來自醫學統計的專業科系:Department
of Medical Statistics, Medical University Innsbruck。
由於醫學統計的使用方法無標準,在大多數的醫學期刊上其統計錯誤使用的例子也不斷的出現。在此篇論文中,這些作者對於醫學期刊論文常見的統計錯誤加以整理。範圍自試驗的規則開始,包括數據的統計分析,統計方法的使用,統計數據的表示,研究結果的解釋。針對上述問題,總共提出了44個常見的錯誤。作者建議在研究規劃的初期作業,應該與具有統計背景的同行學者加以討論。因為試驗統計的問題將來影響了以後的研究結果。在進行論文撰寫時,也應該與統計專業人員討論。
在此篇文章,以五部份討論醫學研究論文在統計應用上常見的錯誤:1.
Study design、2. Data analysis、3.
Documentation、4. Presentation、5.
Interpretation。
關於統計技術與醫學研究的關係,6名作者引用來自統計期刊的一段文章,用以提醒醫學研究人員對於執行研究計劃與撰寫研究論文應有的慎重態度。
"The use of statistics in medical diagnoses and
biomedical research may effect whether individuals live or die, whether
their health is protected or jeopardized, and whether medical science
advances or gets sidetracked. [….]. Because society depends on sound
statistical practice, all practitioners of statistics, whatever their
and occupation, have social obligations to perform their work in a
professional, competent, and ethical manner" [Ethical Guidelines for
Statistical Practice, American Statistical Association, 1999.]
I. Study design
適當而且完備的實驗規劃是醫學研究的基礎。在實驗設計階段發生的誤差與缺點將持續性的延續於整個研究過程。
自初期試驗至最後的試驗,使用的統計假設與科學性假設都要預先確定。試驗所需樣本數量必須預先以檢定力分析計算。
取樣過程中儘量為隨機取樣,雙盲試驗以避免產生偏差。許多統計技術是否有效都與樣本大小有關。
如果採用雙群以上的對照試驗,每一試驗群組的最初狀況要保持相同。要確認無異質性的樣本,以避免無法比較。如果對照群組與試驗群組之內部樣本又有差異存在,就必須採用多變方分析等統計技術。
有關Study
design階段,常見到的統計錯誤:
1.
研究目的與初期研究量測結果並未說明或是說明不明確。
2.
對於樣本數目未加報導(參加試驗的人數或觀察的數目)。
3.
對於研究過程中取消不用的數據其量測結果未加報導,取消原因未說明。
4.
對以觀察數目並未進行檢測力計算(power
calculation)。
5.
對於觀察對象的虛無假設並未有詳細敘述。
6.
並未採用隨機取樣以取得數據。
7.
隨機取樣的方法並未敘述說明。
8.
並未使用盲目試驗或是盲目試驗但是未描述其內容。
9.
對於研究對象的最初狀態並未說明。
10.
使用的控制族群並不恰當。
11.
對於樣本的基本特性是否相等,並未有適當的測試証明。
Ⅱ、Data
analysis
在進行統計數據分析與及應用統計技術進行顯著試驗或估計,必須注意每個統計技術的假設條件。然而以最簡單的t
test與卡方分析而言,在醫學統計上還是經常發生錯誤。主要的原因在於應用之前並未評估統計假設的有效性。例如每一處理內其樣本數目如果低於5,不要使用卡方分析。
如果需要執行多重比較,常犯的錯誤為第一型錯誤。無論參數分析或非參數分析,都不可以以兩兩成對方式進行比較。醫學研究論文常見的錯誤如下:
12.
使用錯誤的統計試驗。
13.
使用的統計技術與數據的型態不相符合。
14.
成對數據卻使用非成對方法測定。
15.
不適當的使用參數統計。
16.
對於統計檢定進行不適當的檢定作業。
17.
第一型錯誤過度擴大。
18.
多重比較時對臨界值未加調整。
19.
對於群組內部之群組影響性未再進行檢定。
20.
執行t檢定並未驗証其假設條件。
21.
進行成對t檢定,但未留意樣本數目是否相等。
22.
典型的卡方分配檢定錯誤在於樣本數目太小。
23.
以虛無假設進行檢定,未說明其狀態。
Ⅲ、Documentation
在論文撰寫時,對於統計技術常見的錯誤如下:
24.
對於檢定方法並未清楚的說明。
25.
對於試驗樣本數目未報導。
26.
未說明是成對檢定或是非成對檢定。
27.
統計檢定之名稱撰寫錯誤。
28.
使用不常見的統計技術但未敘述理由。
29.
有一組以上的試驗數據但未說明統計檢定是針對那一組數據。
Ⅳ、Presentation
在統計檢定之表達常見的錯誤如下:
30.
對於基本數據以不適當的圖表表示。
31.
只有報導平均值,未表示數據之變異量。
32.
以標準差(SE)代替標準偏差(SD)以描述樣本。
33.
以平均值與標準偏差(SD)描述非常態分配的數據。
34.
表示數據變異性未使用"±"符號,或是對於誤差值未加以標示。
35.
檢定結果只有顯示p值,未敘述信賴區間。
36.
以兩組數據檢定(X,Y),只有各自表示X與Y之信賴區間,未表達差異量(X-Y)之信賴區間。
37.
未報導真實之p值,而以"p
= ns"或"p<0.05"取代。
38.
對數據之精密性(precision)無任何報導。
Ⅴ、Interpretation
科學研究的最後階段是對數據分析之結果提出解釋。常見的解釋錯誤介紹如下:
39.
非顯著(No
significant)解釋成為無影響(No
effect)或是無差別(No
difference)。
40.
結論無任何數據支持。
41.
宣稱顯著性,但是無數據分析,或是未曾提及統計檢定。
42.
報導"無顯著的影響",但是未考慮第二類誤差影響。
43.
進行多重顯著試驗,但是報告內容未加討論。
對於試驗數據可能的偏差與混淆的因子未加討論。 |