近年來,統計技術越來越受重視。在醫學的期刊,有越來越多的的文章介紹如何應用統計技術於醫學研究。在農業領域的學術期刊,也開始重視統計技術應用於農業研究。在AFST(Animal
Food Science and Technology)期刊(2006年,129卷1-11頁),有篇編輯群所完稿的文章,篇名如下:〝Some
experimental design and statistical criteria for analysis of studies in
manuscripts submittal for consideration for publication〞。這篇文章內容對於農業科技的研究統計應用有極佳的介紹。
一、
導論(Introduction)
對許多動物與植物科學家而言,要求他們在期刊論文內容具有統計分析,那幾乎是一種邪惡。但是對於量測數據,以一種適當的統計模型進行分析,可以使得實驗的結果解釋得更完全、更準確。相反的,不適當或是不完全的統計設計反而導致不正確與不準確的結論,代表研究的結果解釋錯誤。以研究工作的成本考量,需要所有的研究人員,對於其研究結果要有正確的結論。
此篇文章的目的是由編輯群提供一項指引,以AFST期刊之立場提出說明,論文能夠被期刊接受之實驗設計與統計的要求標準。
二、
統計模式之使用
所謂統計模式代表實際上應用於數據分析之統計技術。一個表格最多只是以矩陣表達一些不同處理下的平均值,有時平均值附有標準差。但是這種表格並未列出統計模式。雖然此種表格列舉方式偶而可能適合,但是少有能力加以判別不同的處理是否有真正的影響力。
數據如果僅以表格呈現而未進行任何統計分析,對於試驗結論並未有助益,如果研究結論是〝A牧草的NDF成份高於牧草B〞,作者必須對於此結論提供統計推論。在試驗過程中必須藉由適當的試驗設計收集足夠的數據,再進行統計分析。另一個例子,如果結論〝A成份的澱粉量高於B,但是與C與D無差異〞。在實驗中需要以相同的程序收集數據,再比較其差異顯著性是否存在。
在進行數據分析時,必須描述所使用的統計模式。例如如果採用A與B兩種處理,每處理各有不同溫度,結果顯示A×B之交互效應並不顯著,不可以在結論說明中忽略此結果,只有說明A因子與B因子是否有顯著影響。
對於統計分析所採用的〝顯著水準〞,或是稱為p值,在材料與方法之章節必須事先說明。例如:〝differences
among means with p<0.05 where accepted as representing statistically
significant differences〞。如果p值略高於0.05
,代表可接受。這種情況也需要預先說明〝differences
among means with p<0.010 were accepted as representing tendencies to
differences〞。有些論文期刊則只是預先以p<0.05為顯著水準,p值表達至少要有三位數,例如p=0.023。如果p值小於0.001,則直接以<0.001表示,不需要列出實際之p值。
進行研究中,數據收集與原先設定的統計模式要能相互一致。不是經由統計檢定的結果論述是無學術價值的。例如以下之描述〝there
was a numerical difference between treatment A and B〞是無價值。
三、
試驗單位
對動物學家或是統計學家而言,對於試驗單位的意見往往不一致。例如在一個獸欄內飼養幾隻動物。最小的試驗單位可以為一個獸圈(內有幾隻動物)或是一隻動物。
動物研究者對在同一獸圈內的所有動物視為一個單位。量測數據為此一獸圈所吃掉的飼料。但是如果每隻動物是分別給飼料,那食用的飼料量就是以每一隻動物為單位。
以每隻動物為單位或是以一個獸欄內所有動物為一個單位,取決於試驗之內容。
四、
將〝時間〞納入統計模式
在一個固定時間週期(例如每週一項,每月一次)進行試驗,都應該將時間納入影響參數。包括時間的影響,或是時間與其他因子相互乘積之影響。例如對一飼料之成份減少量,可以以y=a+b
Exp(-kt)加以量化描述。而且一些特定參數,例如t1/2,對於試驗結果之比較十分有用。
在不同時間的重複試驗數據,如果沒有考慮時間此因子,則容易引起第二型錯誤(實際上沒有顯著差異,但是統計結果反而顯示有差異)
五、
常態分佈
對於生物性的試驗,都認為數據本身是常態分佈。藉由現代的統計軟體,可以檢定是否為常態分布。如果不是常態分佈,也可以經由轉換,使得數據成為常態分佈。pH量測值可以為常態分佈,但是飼料顆粒大小,就是ㄧ種對數常態分佈(log-normal
distribution)。
對於非常態分佈之其他分佈,例如Poisson或是Binomial分佈,以GLM(generalized
linear models)最為合適。
六、
重覆數據之定義
有兩種重複數據經常被混淆:Laboratory
replicates 與
experimental replicates。Experimental
replicates
代表對於有問題的試驗材料有其重複次數,Laboratory
replicate是樣本的處理過程。例如在一項研究中,自田間收集玉米,分成四部分,每一部分以不同的酵素處理,樣本前處理是貯在5個小樣本盒,在此小樣本盒內樣本加以乾燥並取三份子樣本加以分析成份。在此過程中,經過的5個小樣本盒只是Laboratory
replicates,對統計分析無影響。但是如果整批玉米被分成20批小樣本,每5批小樣本以相同酵素處理,共有四種酵素。處理後每批小樣本貯存於小倉之內。每一小盒即是一個重複數目。
七、
實驗設計
1.
Factorial design在生物性研究是一種普遍性之試驗設計,但是需要留意不可超過三因子,否則試驗結果不容易解釋。
2.
Latin squares
Latin squares design
對於處理之比較十分有效。但是每一處理內樣本數目如果不同,試驗結果則難以分析。
八、
檢定力試驗(Power
tests)
檢定力試驗是用以決定試驗中所需要的樣本數目。在完成試驗後,要以檢定力試驗重新檢定試驗樣本其數目是否合理。
九、
生物性、實際性與統計性的差異
統計結果顯示有顯著差異。以生物性或實際性考量,此差異性不見得有實際上之意義。
十、
使用的統計軟體
在AFST期刊通常被使用的軟體有SAS、GENSTAT(general
statistics)、SPSS、Minitab與Microsoft
Excel。但是在不同條件下,應該使用正確的統計方法。例如試驗設計下每組數據相同,則使用ANOVA,GLM與MIXED/REML等方法。如果有遺失數據(missing
values),或在每一處理內又有重複的動物樣本,建議使用MIXED/REML模式。
十一、對於相同數據使用數種統計方法
例如對於相同之試驗數據,使用ANOVA,GLM,MIXED/REML等方法都得到相同的結果。在投搞稿件一一列舉,對研究結果毫無意義。此在科學稿件應該先避免。 |