黃晨,袁平戈,張大志
(重慶醫科大學附屬第二醫院/重慶醫科大學病毒性肝炎研究所/中華肝臟病雜志編輯部,重慶400010)
現代醫藥衛生2013年8月15日第29卷第15期J
Mod Med Health,August
15,2013,Vol.29,No.15
【摘要】目的分析醫學期刊中常見統計學錯誤。方法選取2012
年自然來稿中決定刊用的涉及統計學處理的論文,分析其統計學方法描述、科研設計、樣本品質控制、統計描述、統計學分析及結論與結果分析,探討常見錯誤類型。結果共納入論文186
篇,無明顯統計學錯誤者僅58
篇(31.2%),統計學錯誤類型以樣本品質控制不符合要求(42.2%,54/128)、統計描述有(28.1%36/128)及統計學分析不準確(57.8%,74/128)為主。結論醫學期刊統計學仍然存在較多問題,加強編輯人員的統計學水準和進行統計學審稿非常有必要。
醫學統計學是應用概率論和數理統計的基本原理和方法,結合醫學實際闡述統計設計的基本原理和步驟,將研究資料或資訊進行收集、整理與分析的一門學科,已成為醫學科研中不可缺少的一種分析和解決問題的重要工具[1-2]。醫學論文中臨床研究結果是否經由正確的統計學分析得出結論與科研論文品質密切相關[3-4]。中國醫學科研中,統計學的誤用率平均約為80%,國家級基金資
助的科研課題統計學誤用率約為50%[5-6]。中華醫學會系列雜誌中也存在較高的統計學誤用率[7]。在長期的編輯工作中作者發現,作者稿件中統計學錯誤應用是一個普遍性問題。所以,本刊在審稿過程中增加了統計學審稿這一環節,邀請統計學專家對擬刊用論文的科研設計、資料收集與整理、資料表達與描述、統計分析、結果解釋和結論陳述等統計學相關內容進行審核。本研究對近期統計學審稿中出現的幾種典型錯誤進行分析,希望對醫學論文的撰寫有所幫助。
1
資料與方法
1.1
一般資料選取本刊2012
年自然來稿中經“三審”後決定刊用的論文。入選標準:選取治療療效評定、診斷方法比較等臨床、動物及細胞實驗方面的論著性稿件。排除標準:排除經驗性總結、模型構建、病例報導及綜述等資料無需進行統計學處理的稿件。
1.2
分析內容按照中華醫學會系列雜誌審讀中對科研設計與統計學方面的要求對稿件進行分析,其內容符合臨床科研設計專著有關統計學處理的規定,從以下幾方面進行資料採集並分析歸納:(1)統計學方法描述;(2)科研設計;(3)樣本品質控制;(4)統計描述;(5)統計學分析;(6)結論與結果分析。
1.3
資料分析由3
名資深編輯按上述分析內容對入選稿件進行分析,按完全符合、部分符合、不符合情況將統計的各項資料進行匯總分析。
2
結果
2.1
一般情況本研究共納入論文186
篇,無明顯統計學錯誤者僅58
篇(31.2%),其中來自醫學院校及其附屬醫院的文章占79.3%(46/58)。統計學錯誤類型中統計方法描述有誤占14.1%(18/128),科研設計有誤占4.7(6/128),樣本品質控制不符合要求占42.2%(54/128),統計描述有誤占28.1%(36/128),統計學分析不準確占57.8%(74/128),結論與結果分析不嚴謹占3.9%(5/128)。
2.2
統計學方法描述
2.2.1
統計學處理軟體未交代論文統計學處理所使用的軟體或沒有交代清楚軟體版本。
2.2.2
無描述或部分描述在方法部分對論文中統計學方法描述過於簡單、籠統或僅對部分使用的統計學方法進行了描述。
2.2.3
隨機方法未交代清楚部分研究中僅簡單出現“隨機”兩字,未具體寫清楚隨機的具體方法。
2.3 科研設計
2.3.1
四原則不正確實驗設計違反隨機、對照、重複和均衡原則,其中隨機和重複原則出現的問題不多,少數論文存在缺乏對照或對照不全的情況,較常見的是違背均衡原則,沒有基線均衡性結果的呈現或明顯存在組間的不均衡。
2.3.2
偏倚控制不力部分論文中偏倚控制不力,尤其某些療效評價的文章,嚴重欠缺。
2.3.3
其他大多數論文中未注明研究設計類型。
2.4
樣本品質控制
2.4.1
無納入、排除標準或標準不完整,部分論文中缺乏樣本的納入和排除標準,且不對被剔除樣本進行任何描述。
2.4.2
缺少倫理審查及知情同意。
2.4.3
樣本量不符合設計要求,主要問題是樣本量是否充足。
2.5 統計描述
2.5.1
統計指標不合理,分母過小而採用率表示,多見於動物實驗中。
2.5.2
統計結果闡述不規範,仍有許多論文將“差異有(無)統計學意義”錯誤地表述為“顯著升高”、“明顯下降”、“二者間有顯著性差異”等,同時,還應注意統計學上有意義不代表在專業上就一定有意義。
2.5.3
統計表中資料的含義表達不清楚。
2.5.4
統計圖中,橫、縱坐標軸上的刻度值不準確,等長的間隔代表的數量不等。
2.5.5
在率與構成比的應用中常把二者互用,率表示在一定時間和範圍內某事件的發生次數與該事件可能發生的總數之比,屬於強度相對數;而構成比是反映某事物內部各組成部分在總量中所占的比重,是構成相對數。
2.5.6
在表達多組定量資料時,即使定量資料偏離正態分佈很遠,仍採用“x±s”表示。
2.5.7
部分論文的統計處理結果只有P
值,缺乏相對應的統計量值。
2.6 統計分析
2.6.1
定性資料χ2
檢驗是計數資料常用的假設檢驗方法,可用於檢驗2
個和2
個以上的計數資料(比或率),論文中常出現將χ2檢驗當作是處理定性資料的萬能工具。問題出現最多的是在兩組或多組間計數資料的分佈比較時,對每個類型單獨進行χ2
檢驗。
2.6.2
定量資料常見的問題是不檢查定量資料是否具備獨立性、正態性和方差齊性,盲目套用t
檢驗或單因素設計資料的方差分析;也有文章不管定量資料對應的實驗設計類型是什麼,一律套用單因素兩水準(或叫成組)設計定量資料的t
檢驗或單因素多水準設計定量資料的方差分析。部分論文中,配對t
核對總和兩獨立樣本的t
檢驗混淆使用的情況也常見。
2.7
結論與結果分析該類錯誤僅見於極少部分論文的結果中,即使在結果不能支援結論的情況下,死硬地將結論往結果上靠。
3
討論
提高醫學期刊中論文的統計學品質是一項艱巨而又持久的系統工程, 需要各界人士(作者、編輯、審稿者、讀者、期刊管理者等) 的共同努力[8]。鑒於統計學在醫學論文中的重要性,長期以來,統計學專家及雜誌編輯群體在提高論文的統計學水準方面做了大量工作,眾多文獻對醫學論文中的統計學錯誤進行了分析並提出正確方法對照比較[5,9-10]。然而,在實際工作中發現論文統計學錯誤依然廣泛存在。近年來,總體的統計學應用錯誤率正在降低,且錯誤構成正在發生變化,技術性、規範性錯誤正在減少,而概念性、適用條件等方面的問題依然很突出[11]。本研究結果與前面敘述的一致,統計學錯誤主要集中在樣本品質控制不符合要求、統計描述有誤及統計學分析不準確。
本研究中,68.8%(128/186)文章存在明顯統計學錯誤,這還是在經過“三審”定稿,相對水準較高的文章,如果在所有來稿中進行統計學分析,相信這一比例還會更高。同時作者也發現,來自醫學院校及其附屬醫院的文章中,統計學使用正確率更高,充分說明加強統計學教學的重要性。同時,對於醫學期刊而言,加強編輯人員的統計學水準,增加統計學審稿環節,對於減少刊出文章的統計學錯誤是一個十分有效且切實可行的方法。
|