logo821.gif (10572 bytes) 首頁          新增資料與公告

   

最新消息  :

數字分析 - 中國於非洲農業報導之破解

索馬利亞的乾旱影響和解決方案建議

在非洲商業邊緣爭奪空間-本土企業與中資企業之間日益激烈的競爭

 

 

生醫研究之統計方法

首頁
上一層
BSE LAB 介紹
非洲產業研究中心
授課資料
人文關懷
無官御史台
武漢肺炎與產業
智能生物產業
活動公告區
數據分析與知識產業

 

 
統計的簡單介紹- 給Google工程師介紹統計學
 

中興大學 生物系統工程研究室 陳加忠

 
 

資料來源:

https://towardsdatascience.com/statistics-for-people-in-a-hurry-a9613c0ed0b

曾經希望有人會告訴你統計的意義是什麼?以及在簡單的英語行話中統計代表著什麼?

什麼是統計?這是混合我們數據的任何舊方法?對。在技術上100%正確的定義。現在讓我們看看統計學科的全部內容。

統計學是改變你想法的科學。

根據事實(參數)做出決定已經夠難了,但是有時我們甚至沒有我們需要的事實。相反地我們所知道的(我們的樣本)與我們希望我們知道的(我們的母群)不同。這就是有不確定性的意思。

 統計是在不確定性下改變主意的科學。你的想法可能是什麼?預設行為或先前的信念。如果你的大腦是一片空白怎麼辦?請閱讀以下此內容。

貝葉斯主義者改變了他們對信仰的看法。

貝葉斯統計是處理整合數據以更新您的信念的學派。貝葉斯主義者喜歡使用信賴區間(兩個數字,被解釋為“我相信答案介於此處和此處之間”)來報告結果。

頻率論者改變了他們對行動的看法。

頻率統計處理改變你對行動的想法。你不需要有一個預設行為的信念。如果你不分析任何數據,這只是你承諾做的事情。頻率統計(又名經典統計)是您更可能在野外和您的 STAT101 課程中遇到的統計,所以讓我們在本文的其餘部分保持討論經典統計。

假設是對世界可能是什麼樣子的描述。

虛無假設描述了執行預設操作是一種快樂選擇的所有世界;對立假設是所有其他世界。如果我用數據說服你!你並不生活在虛無假設世界中,那麼你最好改變主意並採取對立行動。

例如:“如果你通常在 15 分鐘內準備好(虛無假設),我們可以一起步行去上課(預設操作)。但如果數據證據表明時間需要更長(對立假設),你可以自己走路,因為我要離開這裡(對立行動)。”

簡而言之,測試:我們的證據是否使虛無假設看起來很荒謬?

所有的假設檢驗都是關於問:我們的證據是否使虛無假設看起來很荒謬?拒絕虛無假設代表著我們學到了一些東西,我們應該改變主意。不拒絕虛無代表著我們沒有學到任何有趣的東西。就像在樹林裡遠足並沒有看到人類並不能證明地球上沒有人類。這只是代表著我們沒有學到任何關於人類存在的有趣的東西。什麼都不學會讓你難過嗎?它不應該,因為你有一個可愛的保險單:你確切地知道要採取什麼行動。如果你什麼都沒學到,你就沒有理由改變主意,所以繼續執行原來的預設操作。

那麼我們如何知道我們是否學到了一些有趣的東西。一些與我們想要繼續執行預設操作的世界不一致的東西?為了得到答案,我們可以查看p 值或信賴區間。

在元素週期表上的 p 值:它是驚喜的元素。

 p值表示:“如果我生活在一個我應該採取預設行動的世界中,在我的證據要有多少不足為奇?” p值越低,數據就會越喊,“哇,這太令人驚訝了,也許你應該改變主意了!”

要執行測試,請將該p值與稱為顯著性水準的臨界值進行比較。這是一個旋鈕,用於控制您想要承受多少風險。這是您愚蠢地離開原來舒適的預設操作的最大可能性。如果您將顯著性水準設置為 0,則代表著您拒絕錯誤地保留預設值。不要分析任何數據,只需採取預設操作即可。但這代表著您最終可能會愚蠢地沒有留下錯誤的預設操作。

如何使用 p 值來獲得假設檢定的結果。信賴區間只是報告假設檢定結果的一種方式。要使用它,請檢查它是否與您的虛無假設重疊。如果它確實重疊,則什麼都學不到。如果沒有,請改變主意。僅當信賴區間與您的虛無假設不重疊時才改變主意。

雖然信賴區間的技術含義有點奇怪。它還有兩個有用的用途,分析師發現有助於描述他們的數據的屬性:(1)最好的猜測總是在那裡,(2)當有更多的數據時,它會更窄。請注意,它和 p 值都不是為了方便於討論而設計的,所以不要指望簡潔的定義。它們只是總結測試結果的方法。

重點是什麼?如果您按照我剛才描述的方式進行測試,那麼數學可以保證您犯錯的風險被限制在您選擇的顯著性水準這就是為什麼您選擇它很重要。數學可以保證您您選擇的風險設置,如果您不費心選擇它們,那將毫無意義。

數學就是建立虛無假設宇宙的玩具模型。這就是你獲得p值的方式。

數學都是關於製作和檢查此玩具宇宙。看看他們有多大可能產生像你這樣的數據集。如果您的虛無假設宇宙玩具模型不太可能為您提供與您從現實世界中獲得的數據一樣的數據,那麼您的 p 值將會很低,您最終會拒絕虛無假設,改變主意!

那些瘋狂的公式、概率和分佈是怎麼回事?它們是使我們能夠表達管理虛無假設宇宙的規則,這樣我們就可以弄清楚那個宇宙,是否是那種能產生類似於你在現實生活中得到的數據的地方。如果不是,你會大喊:“荒謬!砍掉它的頭!” 如果是,你聳聳肩,什麼也學不到。

現在只需將數學視為構建小玩具世界供我們測試,這樣我們就可以查看我們的數據集在其中是否合理。p 和信賴區間是為您總結所有這些的方法,因此您無需瞇著眼睛看對宇宙的冗長描述。它們是結局:使用它們來查看是否保留您的預設操作。任務完成!

我們做功課了嗎?這就是檢定力的衡量標準。

等等,我們是否做了功課,以確保我們確實收集了足夠的證據,讓自己有機會改變主意?這就是檢定力的概念。找不到任何改變思想的證據真的很容易。只是不要去尋找它。如果這是正確的事情,你擁有的檢定力越大,你給自己的改變主意的機會就越多。檢定力是正確地離開你的預設行動的概率。

如果它發生在強大的,當我們什麼都沒學到,並繼續做我們正在做的事情時,我們會對我們的過程感覺更好。至少我們做了功課。如果我們幾乎沒有任何檢定力,我們幾乎知道我們不會改變主意。最好不要費心分析數據。

在開始之前,使用檢定力分析來檢查您是否為足夠的數據進行了預算。檢定力分析是一種檢查給定數據量能有多少預期檢定力的方法。在開始之前,您可以使用它來計劃您的學習。

不確定性代表著即使你擁有世界上最好的數學,你也可能得出錯誤的結論。

為什麼統計此神奇的魔法能夠使確定性離開不確定性。沒有魔法可以做到這一點。你仍然可能犯錯誤。說到錯誤,您可以在頻率統計中犯兩個錯誤。

I 類錯誤是愚蠢地離開您的預設操作。

您說您對預設操作感到滿意,現在感謝您留下的所有數學。II 型錯誤是愚蠢地不離開您的預設操作。(我們統計學家在命名事物方面很有創意。猜猜哪個錯誤更糟。I型?是的。很有創意。)當你不應該改變主意時,I 型錯誤正在改變你的想法。

II 型錯誤使您應該改變主意的時候,沒有改變主意。

第一類錯誤就像判一個無辜的人有罪,第二類錯誤就像沒有給一個有罪的人定罪。這兩個錯誤概率是平衡的使有罪的人更容易被定罪,也使無辜的人更容易被定罪。除非你獲得更多的證據(數據!)。在這種有更多數據的情況下,兩個錯誤的可能性都會降低,一切都會變得更好。這就是為什麼統計學家希望您擁有更多、更多的數據!當您擁有更多數據時,一切都會變得更好。

更多的數據代表著更多的保護,防止得出錯誤的結論。

什麼是多重比較校正?如果您知道您打算針對同一數據集提出多個問題,則必須以不同的、經過調整的方式進行測試。如果你一遍又一遍地對無辜的嫌疑人進行審判(如果你一直在挖掘你的數據),最終某些事情會因隨機事故而顯得有罪。統計意義這個術語並不代表著在宇宙眼中發生了重要的事情。這只是代表著我們改變了主意。也許是錯誤的。詛咒這種不確定性!

不要浪費時間嚴格回答錯誤的問題。僅在需要時智慧地應用統計數據。什麼是III 型錯誤?這是一個統計笑話:它指的是正確地拒絕錯誤的虛無假設。換句話說,使用所有正確的數學來回答錯誤的問題。 

可以在決策智慧中找到解決問題的方法,這是一門著眼於應用數據科學解決業務問題和做出正確決策的新學科。通過掌握決策智慧,您將增強對 III 型錯誤和無用分析的免疫力。

總之,統計學是改變你想法的科學,存在有兩種思想流派。更流行的一個 - 頻率統計 - 是關於檢查您是否應該保留預設操作。貝葉斯統計就是要有先驗意見並用數據更新該意見。如果在開始之前您的大腦真的一片空白,請查看您的數據並按照您的直覺行事。