logo821.gif (10572 bytes) 首頁          新增資料與公告

   

最新消息  :

數字分析 - 中國於非洲農業報導之破解

索馬利亞的乾旱影響和解決方案建議

在非洲商業邊緣爭奪空間-本土企業與中資企業之間日益激烈的競爭

 

 

數據分析與知識產業

首頁
上一層
BSE LAB 介紹
非洲產業研究中心
生醫研究之統計方法
授課資料
人文關懷
無官御史台
武漢肺炎與產業
智能生物產業
活動公告區

 

 
操作統計的八大技巧
 

中興大學 生物系統工程研究室 陳加忠

 
 

資料來源:

https://www.shortform.com/blog/manipulating-statistics/

說謊者如何操縱統計數據以使其更有利?硬性數字怎麼可能出現偏差?

操縱統計數據並不像人們想像的那麼困難。儘管統計數據是硬性數字,並且對它們撒謊是不合法的,但這並不代表著它們不能被歪曲或以某種方式使演示者看起來更好。

騙子如何操縱統計數據

在尋找真相時,統計數據很有吸引力,它們看起來是硬性的、可信的數字,而且它們對於表達某些資訊(例如人口普查數據)是必要的。操縱統計數據似乎是不可能的,對吧?錯誤的。

統計數據並不像看起來那麼客觀。這些人,廣告商、公司、任何有個機巧的人,通常甚至不必真正撒謊。統計是一個足夠靈活的領域,可能會說謊的人可以用暗示、遺漏和分心來證明他們的觀點,而不是徹頭徹尾的謊言。

以下是任何有機巧的人都可以用來操縱統計數據的前八種技術:

技巧#1:引用誤導性的平均值

第一種技術是使用平均值這個詞,而不指定一個數字代表什麼樣的平均值。每種類型的計算方式不同,並提供有關數據的不同資訊和不同的印象:

平均類型#1:平均。這個數字是所有樣本數相加然後除以樣本數的結果。

對於說謊者來說,這是一個有用的平均值,因為它允許他們:

§  讓數字看起來更大更好。如果一所大學想要吸引學生,其畢業生的平均收入越大,它對未來學生的吸引力就越大。即使只有少數高薪,數字也會使平均值看起來高於其他任何平均值。

§  隱藏不平等。如果一家公司 90 名員工的年薪為 20,000 美元,而老闆的年薪為 200,000 美元,則平均值為 ((90*20,000 )+ (1*200,000))/91=21,978。平均值並不表明一個人的薪水比其他人高很多。

反過來,通過簡單地使用更一般的平均值來描述數字來隱藏他們正在使用平均值,通過掩蓋他們正在使用這種不可靠的計算這一事實使騙子受益。

技巧#2:給出精確的數字以顯得更有信譽

另一種數字偽造技術是包含一個小數,以使數字看起來更精確,因此更有信譽。 例如,讀到大多數人每晚睡 7.84 小時聽起來比大約8小時更令人印象深刻。

騙子可以通過對未量測到小數點的不精確數字進行計算(例如,計算平均值)來獲得小數。

技巧#3:使用百分比隱藏數字和計算

像小數點一樣,給出百分比而不是原始數字,可以使數字看起來比實際更精確和有信譽。

以下是說謊者操縱百分比及其相關術語以謀取利益的其他一些方式:

1. 隱藏原始數據和小樣本數量。百分比並不能說明原始數據的絕對值,因此說謊者可以使用它們來掩蓋不利的數字或可疑的小樣本數量。

2.使用不同的基準。因為百分比沒有給出用於計算它們的原始數字(基數)的任何指示,所以說謊者可以比較從不同基數計算的百分比來扭曲他們的結果。

騙子還可以結合百分比和平均值,同時操縱基準以進一步掩蓋真實數據。例如,如果牛奶從每品脫 2 美元降到 1 美元,但麵包從 1 美元漲到 2 美元,撒謊者可以根據他們的機巧選擇不同的基礎來證明生活成本上升下降為了顯示成本上升,他們可以決定以去年的價格為基數100%。牛奶的價格減半(50%),麵包的價格增加一倍(200%)。 50% 200% 的平均值是 125%,所以價格自去年以來上漲了 25%

為了顯示成本下降,他們可以決定今年是基準年100%)。有了這個基數,過去牛奶的成本要高出 200%,而麵包的成本要低 50%,你得到的平均成本是 125%,但由於基準不同,它比去年下降了 25%

3. 加起來百分比。百分比不是數字,你不能有意義地加減它們。

4. 用百分點代替百分比來迷惑人。百分點是兩個百分比之間的差異。例如,5% 7% 之間的差異是兩個百分點。如果一個騙子不想報告她的公司賺了多少錢,她去年的投資回報率是3%,今年是6%,她可能會說投資回報率上升了三個百分點。增加三點聽起來比增加一倍要小得多,儘管在這種情況下它們的含義相同。

技巧#4:使用最有利的形式

第四種技術是以最誇大或最小化它們的任何形式報告數字;無論哪一個會推進騙子的機巧。例如,銷售回報率、投資回報率以及利潤的增減都是報告公司賺了多少錢的方式。大多數人不會意識到,每種類型的衡量標準,都只講述了故事的一部分。例如,如果您每天早上以 99 美元的價格買入一隻股票,下午以 100 美元的價格賣出,那麼您的總銷售額僅佔總銷售額的 1%,這聽起來並不是一個很好的回報。但是,在 30 多天的時間裡,您將獲得總投資額的 30%,這是一個聽起來更好的前景。

技巧 #5:省略統計限定符

最後一種捏造數字的方法是忽略那些對其準確性提出警告或進一步解釋它們的資訊。說謊者經常將四種類型的資訊忽略包含在他們的數字中:

1. 可能的錯誤。可能誤差是衡量一個數字有多可靠的指標,表示為真實結果將落在其之間的範圍。 (不可能找到代表真實結果的單個數字,因為量測系統並不完全準確。)如果您看到一個數字,並且沒有任何跡象表明它的可靠性或可能的錯誤是什麼是,它可能根本不準確。

2. 顯著程度。顯著性程度是衡量結果是否偶然的可能性的量度。在大多數情況下,要使一個數字具有統計顯著性,該程度需要不超過 5%,這代表著 100 次中有 95 次結果是真實的,而不是偶然的。如果沒有給出證實數據,它可能會高於 5%,這代表著結果可能更多地歸因於機會,而不是其他任何事情。

3. 比較是什麼。一些統計數據承諾將產品的有效性增加三倍,或提供 25%”,但沒有說明它們的比較對象。燕麥棒的蛋白質含量比競爭對手的多 25%,而與燕麥棒的蛋白質含量比岩石多 25%,這是完全不同的兩件事。

4. 可以忽略不計。雖然數字之間可能存在數學差異,但有時,這些差異非常小,不會產生任何實際差異,但騙子沒有指出這一點。

技巧#6:引用半相關的數據

如果說謊者無法證明某事,有時,他們會證明其他一些聽起來與他們試圖證明的內容相同的東西。

在某些情況下,半相關圖實際上可以比直接圖更準確地描述情況。

技巧#7:將相關性歸因於因果關係

下一個技術涉及推動這樣一種觀點,即如果兩個因素之間存在關係,則其中一個因素導致另一個因素,而對說謊者的論點最有利的因素就是原因。

§  例如,一項研究發現,吸煙者在大學裡的成績較低。有機巧的不吸煙活動宣傳家可能會將此報告為如果你戒菸,你的成績會提高

這是誤導性的,因為:

1.通常不可能知道哪個因素是原因,哪個是結果。

§  例如,與成績差的壓力作鬥爭的人可能會被迫吸煙以緩解壓力。換句話說,成績差可能是吸煙的原因,而不是吸煙的結果。有時,這兩個因素是如此相互關聯,它們既是原因又是結果。

2. 這兩個因素都可能是其他原因的影響。雖然因素之間的關係真實的,但因果關係是不確定的。

§  例如,可能吸煙的人就是成績低的人,因為他們更喜歡社交而不是學習。

3.兩者之間的關係可能只是由於機會。

4。即使存在真正的因果關係,但這並不代表著它適用於所有人。

關性是趨勢。例如,雖然可以確定接受過高等教育的人比沒有接受過高等教育的人收入更高,但這並不代表著大學比不上大學賺的錢更多。

5. 相關性可能是由人和趨勢引起的,而不是你認為它們是由什麼因素引起的。

§   例如,與年輕女性相比,老年女性走路時往往腳趾分開更遠。這是因為多年來姿勢趨勢發生了變化,而不是因為女性的姿勢必然隨著年齡的增長而變化。

將相關性錯誤地歸因於因果關係的一種高級版本是假設相關性超出了數據範圍。例如,一項研究可能會發現更多的降雨會導致更好的作物,有人可能會假設這種相關性在所有情況下都成立:換句話說,越來越多的降雨總是會導致更好的作物。然而,這種關係不會永遠持續下去,如果雨太大導致洪水氾濫,作物就會受到影響。

技巧#8:處理圖形

1. 截斷圖表。為了使更改看起來比實際更大,說謊者會刪除圖表上的空白區域,以便數據佔據的部分是唯一顯示的部分。這將使線條的斜率看起來更陡峭,或者條形之間的差異看起來更大。

2. y 軸上添加更多的分區。像截斷一樣,這將明顯放大度量之間的差異。

3. 留下圖形標籤和數字。為了有意義,圖表和圖表需要標籤和數字,否則,不可能知道它們顯示的內容。

4. 在條形圖中,使用插圖而不是條形。在條形圖中,條形的高度表示量測值。當您用插圖替換條形時(例如,一袋錢),當您增加錢袋的高度時,所有其他尺寸都會按比例縮放。增加圖像的寬度和深度(如果是 3-D)會使兩個圖像之間的差異看起來更大。

5.在前後照片中,在拍攝前照片後更改主體的多項內容,以使更改看起來比實際更重要。

6. 在地圖中,使用許多變數來創造視覺錯覺。由於地圖包含許多特徵(圖例、邊界、不同大小的區域等),它們是很好的誤導工具。