#知識【數字是中立的,不會騙人?別鬧了,數字很愛騙人好不好…】|RULES CREATIVE
「世界上有三種謊言:謊言,該死的謊言,統計數字。」
— 19世紀英國首相班傑明·迪斯雷利(Benjamin Disraeli)
從睜開眼開始,我們每天都得接觸大量由「數據」所構成的資訊,顯性的如新聞上的死亡率、公司的報表和市場調查報告,隱性的則是Google、FB這些建構於演算法的資訊,可以這麼說:
我們生活在一個由數據組成的世界。
但不知道你有沒有想過,你讀到的新聞、閱讀的報表和Google的資訊,會不會有問題呢?
一個常見的說法:「數字不會說謊,數字是中立的。」1是1、2是2、3是3…沒毛病,那…數據呢?
數據是中立的嗎?
經濟學家桑妮・布勞(Sanne Blauw)的新書《數字偏見 — 不再被操弄與誤導,洞悉偽科學的防彈思考》裡告訴我們一個殘酷的真相:
數據從來都不是中立的。
原因為何?我們如何避免落入被誤導的陷阱?這是我今天想要介紹這本書的原因。
(註:後面我會交替使用「數據」和「數字」,意思相同,都是只經過統計後的數字。)
一、數據來自的五種侷限
每天在讀市場報告時,我總在心中暗忖:「這數據可靠嗎?」
一般的做法是,我會找更多報告來交叉比較,找出共通點與差異性,再歸納出自己的判斷,簡直就像在抓賊一樣…(笑)
以智力測驗為例,布勞教授提出五點「這絕不是客觀選擇」的原因,分別簡述如下:
1. 你測量的目標,其實是人為選擇
如經濟上GDP與GNP的問題,將智商這類抽象概念量化評比,必有取捨。
2. 你測量的數值,其實基於價值判斷
測量每一個數據都有其背後的目的,有目的、就有價值區分,有價值區分、就有價值判斷。換句話說:
「我們受制於自己所創造的衡量標準。」
3. 你測量的,是你能夠計數的
如我們的生活經驗所示,聰明有很多種,數理能力的聰明可計數,很多抽象概念上的聰明無法,也因此在設計評量時,往往只能設計那些「能計數的」部分。
4. 你測量的最後,都會成為一個數字
這未必是缺點,卻肯定是侷限,每一類統計數字都得有定義,定義最終讓結果成為一個數字(許多時候是排名),而忽略背後的複雜與不同視角下的差異。
例如聯合國糧食組織,他們對飢餓的定義不止一套,其中一種方式、全球飢餓現象逐年提高;另一種方式下,則逐年下降。選擇哪一種呢?標準往往來自你認定的「道德。
換句話說,數字時常是道德決策,而非統計考量。
5. 你測量的,就是你追求的目標。
這是最常見的問題,我們時常容易因為先有了「目標」,而透過統計去讓目標成真,其中包含統計方式與對數字的詮釋。
*小結
布勞教授其實想透過上述五點提醒我們,不要對數字產生錯誤的期待,並錯誤地認為數字的定義就是客觀。
我們得理解,數字中永遠藏著價值判斷,數字不是真相,是協助我們理解真相的手段,因此…
「別讓數字成為我們停止思考的藉口。」
二、抽樣調查時容易出現的六種錯誤
1948年鼎鼎大名的性學大師阿爾弗雷德・金賽(Alfred Kinsey)博士推出了名著,《金賽性學報告:男性性行為篇》,在當時風氣還保守的美國社會投下了一顆震撼彈,其中有許多數據在今天看來都相當不可思議,例如:
90%的美國男性在婚前就有性經驗;
50%的美國男性有過肉體不忠的經驗;
37%的男性曾與男性發生過性關係;
1/12的男性曾與動物發生過性關係;
每十位男性中就有一位是同性戀。
三位統計學家直覺這份報告有問題,於是他們開始調查,發現這份報告中存在六個明顯的錯誤,分述如下:
1. 有缺陷的環境或問題
他們發現金賽團隊在問券設計與問券調查的方式,會讓受試者因為面子或其他原因而改變答案。
2. 調查排除了特定團體
他們發現金賽在研究群體上,主要在同志酒吧、監獄及大學蒐集資料,抽樣調查的群體除了數量,似乎不具代表性。
3. 接受訪談的團體太小
他們發現金賽想討論的主題族群太多、樣本卻太少,導致抽樣的結果誤差極大。
4. 太少人願意參加調查
他們質疑金賽的隨機抽樣標準,金賽解釋「如果採用隨機抽樣,參與者會太少。」
5. 邊際誤差遭到忽略
標準差的概念現在很普及,當時統計學家們發現金賽的統計中,誤差範圍被忽略了。
6. 特定的結果對研究者而言非常重要
他們發現,金賽的研究背後的使命影響了他對數據的道德判斷:破除性規範。
*小結
這部分給我們的啟示是:
「我們永遠不應只在乎如何蒐集數據,也該關切是『誰』在蒐集數據。」
如果他懷有預設的目的,統計方法與數據的解讀上,時常也暗藏目的。
那我們又該怎麼辨別呢?
三、看見任何數據時,你該思考的六件事
假如你在新聞報導中看見了某些數字,想知道這些數字是否值得信任,布勞教授給了我們一個檢視的方法:請問自己六個問題。
Q1. 誰傳達這個數字訊息?
政治人物藉由提出統計數據,來表達政策有助經濟發展?某個研究結果證明巧克力有益人體健康,背後資助者有沒有巧克力公司?所以:
謹慎留意數字,尋找額外的數字來源。
Q2. 我有什麼感覺?
這數字讓你覺得快樂、憤怒或悲傷?請注意,不要毫無疑問地接納或拒絕。所以:
理解自己的感受,尋找不同觀點的資訊來源。
Q3. 這個數字如何標準化?
請注意這數字背後的主題是否是人為發明的概念?如GDP或智力測驗。測量數字時,測量者做出哪些選擇?
請記得我們應該採用不同的方法,測量相同的概念。
Q4. 數字如何被蒐集?
請想想蒐集數據的問題是否有誘導性?詢問的場境是否會影響回答者?被詢問者是否為特定族群?
倘若不是,請記得數計只能代表於研究的特定團體的意見。
Q5. 數字如何被分析?
曾經有一個駭人聽聞的數據在網路流傳:1999年到2009年間,尼可拉斯・凱吉推出的電影數與美國落水者人數呈現高度相關性。
這顯而易見的荒謬因果,告訴我們可以問自己三個問題:
1. 因果關係是否純粹偶然?
2. 是否有其他相關因素?
3. 因果關係顛倒結果是否也成立?
Q6. 數字如何被呈現?
五種特別需要注意的類別:
1. 平均值:有沒有會拉高或拉低平均數的離峰值?
2. 精準數字:與常識不同,加總統計數據時常不會是百分百精準,若看到無比精準的數字反而要當心。
3. 排名:排名相連者通常差異不大,可能有邊際誤差。
4. 風險:看到「罹病機率提高OO%」類的數據,請留心原本的數據與百分比為何。
5. 圖表:注意做圖者有沒有為了效果,偷偷延長或壓縮X軸或Y軸。
四、數字是故事
「數據同時是塑造世界模樣的起因和結果。」
對照過去兩年的疫情,上面這句話你想必非常有感,境內與境外、染疫與死亡、成長或持平,這些數據對你內心的感受差異巨大:
「當初讓全國人民陷入集體焦慮的每日10例確診,如今怎麼讓人如此放心呢?」
除了審美疲勞外,更重要的是「這故事怎麼說」,不禁想…
「人類啊,不是數字動物,而是故事的動物。」
關於敘事,可參考針對說故事能改變事態走向的舊文:「疫情間我們正在說的故事」。
#市場【 疫情間我們正在說的故事 】|RULES CREATIVE
今天稍早「未來流通研究所」發布了最新的分析報告《2021H1台灣消費&生活商品TOP…
rulescreative.medium.com
最後,也祝你能逃脫數字的愚弄,成功掌握數字,讓數字成為你工作與人生的助力。
by 傑克小編
—
[ RULES CREATIVE/ 吾則創意]
獨立品牌代理商 RULES CREATIVE
~用策略和創意幫助你的生意~
業務洽詢:Jack Dai
[Phone: 02–25503158; E-mail:jack@rulescreative.com]
➡官網 — [ http://www.rulescreative.com/ ]
➡FB粉絲團 — [ https://www.facebook.com/rulescreative/ ]