#知識【數字是中立的,不會騙人?別鬧了,數字很愛騙人好不好…】|RULES CREATIVE

RULES CREATIVE/吾則創意
8 min readMar 21, 2022

--

中立的數字?|Photo by kavehmaghsoudii

「世界上有三種謊言:謊言,該死的謊言,統計數字。」

— 19世紀英國首相班傑明·迪斯雷利(Benjamin Disraeli

從睜開眼開始,我們每天都得接觸大量由「數據」所構成的資訊,顯性的如新聞上的死亡率、公司的報表和市場調查報告,隱性的則是Google、FB這些建構於演算法的資訊,可以這麼說:

我們生活在一個由數據組成的世界。

但不知道你有沒有想過,你讀到的新聞、閱讀的報表和Google的資訊,會不會有問題呢

一個常見的說法:「數字不會說謊,數字是中立的。」1是1、2是2、3是3…沒毛病,那…數據呢?

數據是中立的嗎?

經濟學家桑妮・布勞(Sanne Blauw)的新書《數字偏見 — 不再被操弄與誤導,洞悉偽科學的防彈思考》裡告訴我們一個殘酷的真相:

數據從來都不是中立的。

原因為何?我們如何避免落入被誤導的陷阱?這是我今天想要介紹這本書的原因。

(註:後面我會交替使用「數據」和「數字」,意思相同,都是只經過統計後的數字。)

《數字偏見 — 不再被操弄與誤導,洞悉偽科學的防彈思考》

一、數據來自的五種侷限

每天在讀市場報告時,我總在心中暗忖:「這數據可靠嗎?」

一般的做法是,我會找更多報告來交叉比較,找出共通點與差異性,再歸納出自己的判斷,簡直就像在抓賊一樣…(笑)

以智力測驗為例,布勞教授提出五點「這絕不是客觀選擇」的原因,分別簡述如下:

1. 你測量的目標,其實是人為選擇

如經濟上GDP與GNP的問題,將智商這類抽象概念量化評比,必有取捨。

2. 你測量的數值,其實基於價值判斷

測量每一個數據都有其背後的目的,有目的、就有價值區分,有價值區分、就有價值判斷。換句話說:

「我們受制於自己所創造的衡量標準。」

3. 你測量的,是你能夠計數的

如我們的生活經驗所示,聰明有很多種,數理能力的聰明可計數,很多抽象概念上的聰明無法,也因此在設計評量時,往往只能設計那些「能計數的」部分。

4. 你測量的最後,都會成為一個數字

這未必是缺點,卻肯定是侷限,每一類統計數字都得有定義,定義最終讓結果成為一個數字(許多時候是排名),而忽略背後的複雜與不同視角下的差異。

例如聯合國糧食組織,他們對飢餓的定義不止一套,其中一種方式、全球飢餓現象逐年提高;另一種方式下,則逐年下降。選擇哪一種呢?標準往往來自你認定的「道德。

換句話說,數字時常是道德決策,而非統計考量。

5. 你測量的,就是你追求的目標。

這是最常見的問題,我們時常容易因為先有了「目標」,而透過統計去讓目標成真,其中包含統計方式與對數字的詮釋。

*小結

布勞教授其實想透過上述五點提醒我們,不要對數字產生錯誤的期待,並錯誤地認為數字的定義就是客觀。

我們得理解,數字中永遠藏著價值判斷,數字不是真相,是協助我們理解真相的手段,因此…

「別讓數字成為我們停止思考的藉口。」

別停止思考。|Art by David Shrigley

二、抽樣調查時容易出現的六種錯誤

1948年鼎鼎大名的性學大師阿爾弗雷德・金賽(Alfred Kinsey)博士推出了名著,《金賽性學報告:男性性行為篇》,在當時風氣還保守的美國社會投下了一顆震撼彈,其中有許多數據在今天看來都相當不可思議,例如:

90%的美國男性在婚前就有性經驗;
50%的美國男性有過肉體不忠的經驗;
37%的男性曾與男性發生過性關係;
1/12的男性曾與動物發生過性關係;
每十位男性中就有一位是同性戀。

三位統計學家直覺這份報告有問題,於是他們開始調查,發現這份報告中存在六個明顯的錯誤,分述如下:

1. 有缺陷的環境或問題

他們發現金賽團隊在問券設計與問券調查的方式,會讓受試者因為面子或其他原因而改變答案。

2. 調查排除了特定團體

他們發現金賽在研究群體上,主要在同志酒吧、監獄及大學蒐集資料,抽樣調查的群體除了數量,似乎不具代表性。

3. 接受訪談的團體太小

他們發現金賽想討論的主題族群太多、樣本卻太少,導致抽樣的結果誤差極大。

4. 太少人願意參加調查

他們質疑金賽的隨機抽樣標準,金賽解釋「如果採用隨機抽樣,參與者會太少。」

5. 邊際誤差遭到忽略

標準差的概念現在很普及,當時統計學家們發現金賽的統計中,誤差範圍被忽略了。

6. 特定的結果對研究者而言非常重要

他們發現,金賽的研究背後的使命影響了他對數據的道德判斷:破除性規範。

*小結

這部分給我們的啟示是:

「我們永遠不應只在乎如何蒐集數據,也該關切是『誰』在蒐集數據。」

如果他懷有預設的目的,統計方法與數據的解讀上,時常也暗藏目的。

那我們又該怎麼辨別呢?

改變時代卻問題百出的《金賽性學報告:男性性行為篇

三、看見任何數據時,你該思考的六件事

假如你在新聞報導中看見了某些數字,想知道這些數字是否值得信任,布勞教授給了我們一個檢視的方法:請問自己六個問題。

Q1. 誰傳達這個數字訊息?

政治人物藉由提出統計數據,來表達政策有助經濟發展?某個研究結果證明巧克力有益人體健康,背後資助者有沒有巧克力公司?所以:

謹慎留意數字,尋找額外的數字來源。

Q2. 我有什麼感覺?

這數字讓你覺得快樂、憤怒或悲傷?請注意,不要毫無疑問地接納或拒絕。所以:

理解自己的感受,尋找不同觀點的資訊來源。

Q3. 這個數字如何標準化?

請注意這數字背後的主題是否是人為發明的概念?如GDP或智力測驗。測量數字時,測量者做出哪些選擇?

請記得我們應該採用不同的方法,測量相同的概念。

Q4. 數字如何被蒐集?

請想想蒐集數據的問題是否有誘導性?詢問的場境是否會影響回答者?被詢問者是否為特定族群?

倘若不是,請記得數計只能代表於研究的特定團體的意見。

Q5. 數字如何被分析?

曾經有一個駭人聽聞的數據在網路流傳:1999年到2009年間,尼可拉斯・凱吉推出的電影數與美國落水者人數呈現高度相關性。

這顯而易見的荒謬因果,告訴我們可以問自己三個問題:

1. 因果關係是否純粹偶然?

2. 是否有其他相關因素?

3. 因果關係顛倒結果是否也成立?

1999年~2009年,尼可拉斯・凱吉推出的電影數與落水人數呈現高度相關性。(?)

Q6. 數字如何被呈現?

五種特別需要注意的類別:

1. 平均值:有沒有會拉高或拉低平均數的離峰值?

2. 精準數字:與常識不同,加總統計數據時常不會是百分百精準,若看到無比精準的數字反而要當心。

3. 排名:排名相連者通常差異不大,可能有邊際誤差。

4. 風險:看到「罹病機率提高OO%」類的數據,請留心原本的數據與百分比為何。

5. 圖表:注意做圖者有沒有為了效果,偷偷延長或壓縮X軸或Y軸。

data bias

四、數字是故事

「數據同時是塑造世界模樣的起因和結果。」

對照過去兩年的疫情,上面這句話你想必非常有感,境內與境外、染疫與死亡、成長或持平,這些數據對你內心的感受差異巨大:

「當初讓全國人民陷入集體焦慮的每日10例確診,如今怎麼讓人如此放心呢?」

除了審美疲勞外,更重要的是「這故事怎麼說」,不禁想…

「人類啊,不是數字動物,而是故事的動物。」

關於敘事,可參考針對說故事能改變事態走向的舊文:「疫情間我們正在說的故事」。

最後,也祝你能逃脫數字的愚弄,成功掌握數字,讓數字成為你工作與人生的助力。

by 傑克小編

逃脫數字的愚弄。|Pic by grazianolocatelli

[ RULES CREATIVE/ 吾則創意]

獨立品牌代理商 RULES CREATIVE
~用策略和創意幫助你的生意~
業務洽詢:Jack Dai
[Phone: 02–25503158; E-mail:jack@rulescreative.com]
➡官網 — [ http://www.rulescreative.com/ ]
➡FB粉絲團 — [ https://www.facebook.com/rulescreative/ ]

「用策略和創意幫助你的生意。」 — RULES

--

--

RULES CREATIVE/吾則創意
RULES CREATIVE/吾則創意

Written by RULES CREATIVE/吾則創意

RULES CREATIVE/吾則創意是一間獨立品牌代理商,我們擅長用策略、創意與設計解決品牌客戶的商業問題。Logo「R」的缺口是20%的商業與創意出口,意義是我們懂到「真正懂創意的人,是最懂規則的人」和「創意不是顛覆,而是在規則中找出口」,基於此,我們的Slogan是「用策略和創意幫助你的生意」。

No responses yet