Source:
HortScience 51(9):1073-1078, 2016
Title:
Statistics in a Horticultural Journal: Problems and Solutions
Authors:
Matthew H. Kramer, Ellen To paparazzi, Walter W, Stroup.
三位作者檢查了在2014年1月至2015年1月,JASHS期刊(Journal
of the American society for Horticultural Science)出版之論文,有關其統計的問題。此篇評論(Review)起源於期刊編者希望對於目前的作者指示(Instructions
to authors)內容相關的統計問題加以修正。為了達到此要求,此文三位作者針對了論文作者對於他們的發現,他們收集的數據,他們對數據分析的進行方式等所使用的統計方法加以確認。在此之後,這三位作者描述園藝期刊作者常犯的統計錯誤,並對這些經常發生的統計錯誤加以描述。
{方法錯誤}
園藝研究中最嚴重的問題是由單一對象量測許多獨立變數(例如自一個果實量測甜度、酸度…等為數值)。這些變數同時進行分析,而未考慮這些變數的相關性,對於測試誤差也未加以控制。
在重複比較中也常發現此問題,在一棵果樹同時量測產量與甜度,兩個量測值無法同時以α=0.05
進行獨立檢定,必須考慮其相關性。一棵樹如果缺氮,那麼產量與甜度都會受影響,因此變數相關性十分重要。
表一.86篇論文出現之統計問題
問題 |
出現次數 |
多重獨立變數,需求更佳實驗控制 |
30 |
不正確分析 |
24 |
平均值分離參數問題 |
20 |
知識不完整 |
10 |
其他 |
8 |
Table 1
.Summary of identified statistical problems found in 86 articles
published in the Journal of the American Society for Horticulture
Science. One article may have more than one problem identified.
problem |
Count |
Need experiment-wise control/multiple dependent variables |
30 |
Incorrect analysis |
24 |
Means separation |
20 |
Missing information |
10 |
Miscellaneous |
8 |
表二.24個不正確的分析方法
問題 |
出現次數 |
變異數為平均值的函數 |
11 |
任意性影響被視為固定性影響或被疏忽 |
7 |
忽略空間變異性 |
1 |
忽略重覆測量性 |
1 |
重覆測量之共變結構不正確 |
1 |
不同處理被整合 |
1 |
忽略終檢性 |
1 |
以三個觀察值進行迴歸 |
1 |
Table 2
.Summary incorrect analysis methods found in 24 of 86 articles published
in the Journal of the American Society for Horticulture Science.
problem |
Count |
Variance a function of mean |
11 |
Random effect treated as fixed or ignored |
7 |
Ignored spatial variability |
1 |
Repeated measures variability |
1 |
Wrong repeated measures covariance treatments |
1 |
Poole different treatments |
1 |
Ignored censoring |
1 |
Regression with three observations |
1 |
表三.平均值分離參數測定之問題
問題 |
出現次數 |
平均值分離參數測定之使用Duncan’s |
8 |
未述明平均值分離參數檢定之技術 |
5 |
多重比較未調整(例如使用t檢定) |
4 |
多重比較之前未使用PNOVA |
2 |
|
|
使用未重疊性之信賴區間代替平均值分離參數測定 |
1 |
Table 3
.Summary with means separation procedures found in 20 of 86 articles
published in the Journal of the American Society for Horticulture
Science.
Problem |
Count |
Duncan’s used for means separation |
8 |
Undisclosed means separation technique |
5 |
No adjustment for multiple comparisons (e. g, used t tests) |
4 |
Means comparisons without oriole ANOVA |
2 |
Used nonoverlapping confidence intervals as means comparison
|
1 |
表四.統計知識不完整
問題 |
次數 |
不具備需要的統計知識 |
7 |
未說明使用之統計軟體 |
1 |
未公開其測定方法 |
1 |
主成分迴歸結果未適當解釋 |
1 |
Table 4
.Problems due to missing information in 10 of 86 articles published in
the e Journal of the American Society for Horticulture Science.
Problem |
Count |
Missing necessary statistical information |
7 |
Not clear what statistical software was used for |
1 |
Undisclosed tests |
1 |
PC results
not explained adequately |
1 |
rinciple
component analysis.
表五.其他統計問題
問題 |
次數 |
根本數目未說明 |
3 |
變異數量測值未報導 |
2 |
使用SAS
PROC MIXED,未進行 |
1 |
逐次變數選擇 |
1 |
圖示有問題 |
1 |
Table
5.Miscellaneous statistical problems found in 8 of 86 articles published
in the Journal of the American Society for Horticulture Science.
Problem |
Count |
Sample sixes not given |
3 |
Measure of variability not reported |
2 |
SAPROC
MIXED does not do stepwise variable selection |
1 |
Show just fitted curves |
1 |
Figure issues |
1 |
S
Institute,Cary,NC.
表6.使用之統計軟體
分類 |
使用軟體 |
次數 |
通用 |
10 |
62 |
專用 |
29 |
42 |
未知 |
? |
7 |
未說明 |
- |
10 |
Table 6.
Categories and counts of the particular statistical software packages
used in 86 articles published in the Journal of the American Society
for Horticulture Science. One article may identify more than one
program.
|
Unique software |
Count |
Category |
programs |
(articles with) |
Category use |
10 |
62 |
Specialty |
29 |
42 |
Unknown |
? |
7 |
None |
- |
10 |
?=From
the description the author presented, it was hard to tell if the
software was unique.
表七.經常使用之統計軟體
Table 7.
Frequency of general and specialty statistics programs used in 86
articles published in the Journal of the American Society for
Horticulture Science. One article may identify more than one program.
All software packages can be conducting a web search for the identified
program.
General |
Count |
Company |
Specialt |
count |
Company |
SAS |
35 |
SAS Institute Cary, NC |
MEGA software |
4 |
Biodesign Institute , Tempe , AZ |
JMP |
8 |
SAS Institute |
NTSYS-PC |
4 |
Exeter Software , Setauket , NY |
SPSS |
5 |
IBM Armonk , NY |
Structure-software |
4 |
Pritchard Laboratory , Stanford University , Stanford , CA |
R |
4 |
R Core Team <https://www.r-project.org/> |
ASReml |
3 |
VSNi Hemel Hempstesd , UK |
GenStat |
3 |
VSNi , Hemel Hempstead, UK |
GeNorm software |
2 |
Schlotter et al. (2009)<https://genorm.cmgg.be/> |
CoStat |
2 |
CoHort Softare <http://www.cohort.com/> |
NormFinder |
2 |
Molecular Diagnostic Laboratory , Aarhus University Hospital ,
Aarhuuusss N , Denmark |
Statistica |
2 |
Dell , Round Rock, TX |
|
|
|
Minitab |
1 |
Minitab , State College , PA |
|
|
|
Statgraphics |
1 |
StatPoint Technologies , Warrenton , VA |
|
|
|
InfoStat |
1 |
National University of Cordoba , Cordoba , Argentina
|
|
|
|
作者對於園藝學者提出三項建議以改善其統計能力:持續教育、合作與溝通。
一、
持續教育
在研究所教育時,園藝學生不可能接受所有的統計學理,但是必須終身學習。持續教育,應該成為研究人員終身之事。對於初學者,有數項實務工作可以進行。每年年會更新統計技術,合作評估(auditing),統計設計與分析,在可認可機構參預,邀請統計學者對於園藝統計方法參加專題討論,或是進行教學班(tutorials),拜訪統計軟體之網站,觀看最新統計技術之video等。許多大學已針對特別的統計技術製作教學錄影帶。作者建議美國園藝學會與USDA資助的機構North
central coordinating(NCCC)-170合作得到其資源。
二、 合作
在進行試驗之前,進行試驗計畫。在收集數據之前,以統計的想法以進行試驗計畫。無論是試驗設計,調查,或是觀察研究,都應該如此。在拜訪統計專家之前,要再思考試驗的目的。因而在試驗結束後其試驗結果才能如同試驗設計之預期結果。再將試驗數據與統計專家進行討論。
有關統計學的教育,要求園藝學者在其終身研究生涯,曾修習所有統計學課程,這是不切實際,儘管如此,還是鼓勵持續性教育。這種方式稱為自家修理模式(home
repair model)。現代的科學研究十分複雜,而且需要多重學門知識。而主要的關鍵問題是人力資源。
在完美的世界,一個統計專家對於每一種研究計畫都可參與研究。這是一種理想,但是不切實際。作者鼓勵園藝學界與統計學界共同指導培育博士學位的學生。不但可以改進園藝學界對於統計學之應用品質,也改進統計學者對於園藝學的文盲式陌生感。
三、
溝通
第一步驟為園藝期刊先行建立作者統計指引(Statistical
guidelines for Authors)。對一篇研究論文稿件,作者至少要求要有足夠知識以對於試驗設計(區集之程度,任意取樣的限制性,變數是否有相關性,各處理的單位等),處理設計(處理因子,其程度或題型),與分析之方法等。因此審查者(reviewer)才能進行公正評論。稿件要附上原始數據與足夠資訊,因而審稿者才能重複進行所有重要的統計分析。論文稿件中量化數據,如果未加附著,此稿件將加以退還。
作者建議,園藝學會應考慮對審稿者與編輯對於統計學至少要有一定的認知。審稿者應該參加統計學短期課程或訓練課程(short
course, workshop, tutorial)。為了達到此效果,美國園藝學會(ASHS)可以針對會員提供持續教育。例如在地區性或是全國性的會議舉行訓練班(webinar)或其他訓練課程。對大學而言,在招募新的助理教授時,也可以鼓勵其兼有統計學背景。
(結論)
本文作者針對JASHS2014年1月至2015年1月的論文進行分析,發現許多統計問題,但是這不是新發現。在1991年Gates先生的評論文章已提出相近問題。[Gates,
C.E. 1991. A user’s guide to misanalyzing planned experiments.
HortScience 26:1262–1265.]。這些統計問題自1991至2016年仍然持續存在。此代表目前表園藝期刊報導統計的方法需要重新思考。對統計學與園藝學兩個學門而言,各有其扮演的角色。以統計學的觀點,能夠進行的方法是針對生命科學的研究生開授統計方法等課程。本文作者支持這種作法,對現在的研究人員,也鼓勵進行統計學的持續教育,尤其網路線上教育如此方便。在此作者提出三個建議:持續教育,合作與溝通。園藝學與統計學正在快速的改變,也是持續的改變,終身學習十分重要,園藝學者應該多方參加統計學的進修課程(workshop,
tutorials)。現代的研究需要多學門配合。目前園藝期刊之出版論文仍有許多統計錯誤。統計專家只是偶然相詢,需要有實質的合作,此種合作最具體的方式是培養雙學門(統計學與園藝學的博士學生)。而在期刊審稿過程更需加強統計技術,許多不正確的結論或是建議都是因為使用不正確或是過時的統計知識。期刊的審稿者與編者都需要統計學的持續教育。
[注]
以下文章為2017年的期刊文章,統計技術是否有問題?大家自行判斷!
Flora
230 (2017) 66–74
The
velamen of epiphytic orchids: Variation in structure and correlations
with nutrient absorption
Correlations were found, although rather weak, between the rates of
absorption of rubidium and the cross-sectional area of the velamen (r2=
0.33, p < 0.01), with the number of protoxylem strands (r2= 0.28, p <
0.02), with the number of passage cells of the endoderm is (r2= 0.21, p
< 0.05), and are represented in
Fig. 4.
No correlation was observed between any anatomic variable and the rates
of phosphorus absorption.
|