AFST期刊對於論文稿件中實驗設計與統計標準之建議

最新消息 :

數字分析 - 中國於非洲農業報導之破解

生醫研究之統計方法

AFST期刊對於論文稿件中實驗設計與統計標準之建議

中興大學生物系統工程研究室陳加忠

近年來，統計技術越來越受重視。在醫學的期刊，有越來越多的的文章介紹如何應用統計技術於醫學研究。在農業領域的學術期刊，也開始重視統計技術應用於農業研究。在AFST(Animal Food Science and Technology)期刊(2006年，129卷1-11頁)，有篇編輯群所完稿的文章，篇名如下：〝Some experimental design and statistical criteria for analysis of studies in manuscripts submittal for consideration for publication〞。這篇文章內容對於農業科技的研究統計應用有極佳的介紹。

一、導論(Introduction)

對許多動物與植物科學家而言，要求他們在期刊論文內容具有統計分析，那幾乎是一種邪惡。但是對於量測數據，以一種適當的統計模型進行分析，可以使得實驗的結果解釋得更完全、更準確。相反的，不適當或是不完全的統計設計反而導致不正確與不準確的結論，代表研究的結果解釋錯誤。以研究工作的成本考量，需要所有的研究人員，對於其研究結果要有正確的結論。

此篇文章的目的是由編輯群提供一項指引，以AFST期刊之立場提出說明，論文能夠被期刊接受之實驗設計與統計的要求標準。

二、統計模式之使用

所謂統計模式代表實際上應用於數據分析之統計技術。一個表格最多只是以矩陣表達一些不同處理下的平均值，有時平均值附有標準差。但是這種表格並未列出統計模式。雖然此種表格列舉方式偶而可能適合，但是少有能力加以判別不同的處理是否有真正的影響力。

數據如果僅以表格呈現而未進行任何統計分析，對於試驗結論並未有助益，如果研究結論是〝A牧草的NDF成份高於牧草B〞，作者必須對於此結論提供統計推論。在試驗過程中必須藉由適當的試驗設計收集足夠的數據，再進行統計分析。另一個例子，如果結論〝Ａ成份的澱粉量高於Ｂ，但是與Ｃ與Ｄ無差異〞。在實驗中需要以相同的程序收集數據，再比較其差異顯著性是否存在。

在進行數據分析時，必須描述所使用的統計模式。例如如果採用Ａ與Ｂ兩種處理，每處理各有不同溫度，結果顯示A×B之交互效應並不顯著，不可以在結論說明中忽略此結果，只有說明A因子與B因子是否有顯著影響。

對於統計分析所採用的〝顯著水準〞，或是稱為p值，在材料與方法之章節必須事先說明。例如：〝differences among means with p<0.05 where accepted as representing statistically significant differences〞。如果p值略高於0.05 ，代表可接受。這種情況也需要預先說明〝differences among means with p<0.010 were accepted as representing tendencies to differences〞。有些論文期刊則只是預先以p<0.05為顯著水準，p值表達至少要有三位數，例如p=0.023。如果p值小於0.001，則直接以<0.001表示，不需要列出實際之p值。

進行研究中，數據收集與原先設定的統計模式要能相互一致。不是經由統計檢定的結果論述是無學術價值的。例如以下之描述〝there was a numerical difference between treatment A and B〞是無價值。

三、試驗單位

對動物學家或是統計學家而言，對於試驗單位的意見往往不一致。例如在一個獸欄內飼養幾隻動物。最小的試驗單位可以為一個獸圈(內有幾隻動物)或是一隻動物。

動物研究者對在同一獸圈內的所有動物視為一個單位。量測數據為此一獸圈所吃掉的飼料。但是如果每隻動物是分別給飼料，那食用的飼料量就是以每一隻動物為單位。

以每隻動物為單位或是以一個獸欄內所有動物為一個單位，取決於試驗之內容。

四、將〝時間〞納入統計模式

在一個固定時間週期(例如每週一項，每月一次)進行試驗，都應該將時間納入影響參數。包括時間的影響，或是時間與其他因子相互乘積之影響。例如對一飼料之成份減少量，可以以y=a+b Exp(-kt)加以量化描述。而且一些特定參數，例如t_1/2，對於試驗結果之比較十分有用。

在不同時間的重複試驗數據，如果沒有考慮時間此因子，則容易引起第二型錯誤(實際上沒有顯著差異，但是統計結果反而顯示有差異)

五、常態分佈

對於生物性的試驗，都認為數據本身是常態分佈。藉由現代的統計軟體，可以檢定是否為常態分布。如果不是常態分佈，也可以經由轉換，使得數據成為常態分佈。pH量測值可以為常態分佈，但是飼料顆粒大小，就是ㄧ種對數常態分佈(log-normal distribution)。

對於非常態分佈之其他分佈，例如Poisson或是Binomial分佈，以GLM(generalized linear models)最為合適。

六、重覆數據之定義

有兩種重複數據經常被混淆：Laboratory replicates 與 experimental replicates。Experimental replicates 代表對於有問題的試驗材料有其重複次數，Laboratory replicate是樣本的處理過程。例如在一項研究中，自田間收集玉米，分成四部分，每一部分以不同的酵素處理，樣本前處理是貯在5個小樣本盒，在此小樣本盒內樣本加以乾燥並取三份子樣本加以分析成份。在此過程中，經過的5個小樣本盒只是Laboratory replicates，對統計分析無影響。但是如果整批玉米被分成20批小樣本，每5批小樣本以相同酵素處理，共有四種酵素。處理後每批小樣本貯存於小倉之內。每一小盒即是一個重複數目。

七、實驗設計

1. Factorial design在生物性研究是一種普遍性之試驗設計，但是需要留意不可超過三因子，否則試驗結果不容易解釋。

2. Latin squares

Latin squares design 對於處理之比較十分有效。但是每一處理內樣本數目如果不同，試驗結果則難以分析。

八、檢定力試驗(Power tests)

檢定力試驗是用以決定試驗中所需要的樣本數目。在完成試驗後，要以檢定力試驗重新檢定試驗樣本其數目是否合理。

九、生物性、實際性與統計性的差異

統計結果顯示有顯著差異。以生物性或實際性考量，此差異性不見得有實際上之意義。

十、使用的統計軟體

在AFST期刊通常被使用的軟體有SAS、GENSTAT(general statistics)、SPSS、Minitab與Microsoft Excel。但是在不同條件下，應該使用正確的統計方法。例如試驗設計下每組數據相同，則使用ANOVA，GLM與MIXED/REML等方法。如果有遺失數據(missing values)，或在每一處理內又有重複的動物樣本，建議使用MIXED/REML模式。

十一、對於相同數據使用數種統計方法

例如對於相同之試驗數據，使用ANOVA，GLM，MIXED/REML等方法都得到相同的結果。在投搞稿件一一列舉，對研究結果毫無意義。此在科學稿件應該先避免。