#冷統計 #冷閒聊 【為什麼這世界,總是沒辦法兩全其美?】
從一個科學宅的角度,我們來談一談!#柏克森悖論
嗨唷~讀者們不知道你有沒有想過,為什麼越讓人食指大動的食物,越是不健康(高油鹽與糖,就是讓你胖);反之,健康的食物通常很難吃。
身邊的人,怎麼好相處的都相貌平平;而「天菜」好像往往個性都很機歪不好相處?
還有啊,為什麼文組巨人就是理科侏儒,反之亦然?(好想偷偷問上理科太太一兩個歷史問題)
難道上天自有一把尺,自動收掉了那些太完美的人......讓這世界維持這種「有一好沒兩好」的平衡呢?,說來有些公平,但還是有點遺憾啊!自古紅顏多薄命,啊~~(關羽你不能死
等等,別急著認同按讚並分享。
你知道嗎?讀者你可能一直被一個致命的統計陷阱蒙蔽,才會以偏概全,認同這公平的幻影。就像科宅喜歡說的:世界是隨機的,但隨機不完全等於公平——它真的只是「隨機」而已。
各位好,歡迎來到深夜的日冷怪談單元,今天的主題不管從哪個方面來說都非常之恐怖。因為科宅編又想聊 #數學 了~每日一登冷。
但是一樣,先說好,整篇都白話文,沒有可怕的公式,看個圖表就收工。那我們開始囉!
話說,統計學是讓資料說故事的一門藝術,精確來說是把資料綑綁、鞭打、刑求,逼資料說人話的藝術。XD
一般來說,大部分的人都是靠「感覺」而不是靠「資料」過生活的。不過,我們的感覺也依據「資料」,就是一些腦海中容易想起來的例子,連貫起來做一個快速的判斷。統計學家聽到這種平民的玩意,非常之不置可否,並酸酸地說了句統計界名言:
「把軼聞(anecdote)湊在一起,算不上資料(data)。」
就是在批評說普通人沒經過統計學訓練,光憑感覺的過程中,不曉得犯了多少 #認知偏誤 。哪比得上白紙黑字又嚴謹的的統計學方法呢?
但話說回來,統計也不是沒有弱點的。科宅覺得用伍佰老大的歌〈真世界〉來描述統計學很貼切:
「關於這個真世界,不小心,你就會事與願違」
魔鬼就藏在細節裡,害你整個推論都出錯的根源,可能藏在一個細微的前提,甚至單單一個字裡唷。
今天的微冷開頭舉的食物好吃與健康的例子,容我把大家讀到那段話時,腦中迅速想的OS寫出來,類似這樣:
「這個判斷句是真的嗎?食物的範圍太廣,就只想我熟悉的食物吧......欸,【好吃但不健康】的食物可以舉出太多,【不好吃但健康】的食物似乎也有一些,【又好吃又健康】的食物嘛,不能說沒有,但很難想到(天山雪蓮之類的?)。我開始相信你了,似乎真的有一好沒兩好。」
第二句也很類似,講到人的顏值和性格的關聯性,我們腦中的資料庫也在運轉,二話不說,就開始把親朋好友分類成【顏值高又好相處】、【顏值不高但好相處】和【顏值高但不好相處】三組。然後覺得似乎這話有點道理。
只有一個小小的問題,為什麼是分成三組——應該是四組才對啊,兩個是非題,二二得四,各占平面一個象限。
嘿對,被遺漏的那一群正是問題所在:
【不健康又不好吃】的東西,即使存在,在我們考慮「食物」的時候也不會刻意想它吧。
而【顏值不高又很難相處】的人,在列舉「朋友」的時候,往往是不會列入考慮的QQ。(對不起正在看這篇的讀者不是在說你
等於說,我們考慮這類命題時,常常自動把「抽樣」的範圍限制在「A或者B」,四個象限中第三象限「既不A也不B」就塗黑掉不考慮。那麼,剩下的三個象限就非常可能自動形成了「負相關」,有著從左上角畫到右下角的趨勢(線),好像把「A不B」和「B不A」連起來。 #甜不辣 #申不害 #阿不拉 #好不鬧
原來魔鬼藏在「或」這個字上啦。#或或或或或或或或
這個平常思考上,也是統計學上的可怕陷阱,起初是一位研究醫學流行病學的專家提出的。並以他的名字命名為「柏克森悖論」(Berkson's paradox),或者「入院率的偏誤」。
例如說,某院醫生很高興的把病患抓來研究......我是說統計研究,才不是縫起來做成人體蜈蚣呢,千萬不要誤會。
很可能,醫師們會發現一些離奇的結論,例如「蛀牙的人,更不容易得到高血壓(呈負相關)」,難道冥冥之中真的注定,上天是公平的嗎?
但事實上兩者根本無關。
會得到這個結果,說破了就只是因為——沒有蛀牙也沒有高血壓的人,不容易出現在醫院,就醬而已 。因為來醫院的人,大致滿足「身體至少有一種病」的前提,等於是「A或B」,咻,一條原本不存在的趨勢線就平空出現了。
嚴格的統計學得出的結論,卻因為過程中隱藏的謬誤而不能跟它認真了。幫QQ。
柏克森悖論的威力超強,它甚至可以讓明明整體上明明是有正相關的族群,因為我們只觀察了其中某一小群人,反而看起來有強烈的負相關。
血淋淋的例子就是文組理組之永恆的(沒來由的)互相鄙視。
如留言中的圖二,假設橫軸是「文科綜合成績」,縱軸是「理科綜合成績」,我直接假設了一個蠻合理的狀況:一個人腦筋越靈光,應該同時越擅長文科和理科(但程度可能各有高低)。整體圖像是一個左下到右上傾斜(正相關)的分布,代表魯鈍到天才。
但只要增加一個簡單的機制,我們就能非常容易地獲得斬釘截鐵「學生的文科和理科能力呈負相關」的結果。
我們只要依照文科和理科的【總分】把學生分成一群一群的,也就是「能力分班」或者「志願落點升學制」。那麼(一點都不)神祕的事情就會發生:光看同一個「程度」或同一個學校的學生,必定看到左上右下的負相關!
原理是醬,依照總分分割,等於在圖上畫出一條條左上到右下的分隔線。而高中數學課有記載,【X+Y=總分】的圖形斜率是負一嘛。原來,這個人為的分組過程,才是引進了那個負相關的罪魁禍首啊。
(破功惹,還是寫了一個公式~~)
最後再厭世一下,人看世界覺得公平,可能純粹是由於我們習於看世界的眼光折射出來的幻影。畢竟公平是人造的概念,自然並不懂什麼是公平。嘛,我們下次見。
Search