2018年11月9日 星期五

貝氏定理(精準預測)

奈特.席佛,當代最受矚目的統計與預測鬼才,首次公開精準預測的黃金法則,告訴你為什麼有些預測會成功、有些會失敗?本篇只介紹「貝氏定理」。

如果貝氏定理的哲學基礎豐富得出人意料,那定理的數學則是單純得令人震驚。定理最基本的形式只是一組代數表達式,有三個已知的變項,一個未知的變項。但這個單純的公式可以導出非常有預測力的洞見。其公式如下:

貝氏定理=xy/xy+z(1-x)

貝氏定理與條件機率有關。也就是說,這個定理會告訴我們如果某些事件發生之後,某個理論或假設為真的機率有多少。

例如911的恐怖攻擊,假設在第一架飛機撞上之前,我們估計曼哈頓的高樓遭受恐怖攻擊的可能性只有大約兩萬分之一,或是0.005%。然而,我們指派給飛機因意外而撞上世界貿易中心的機率也非常低。這些數字是真的可以用經驗估計出來的:

911事件之前的兩萬五千天之中,曼哈頓上空的航空狀況出現過兩次這樣的意外,一次是1945年的帝國大廈,加一次是1946年在華爾街40號。這樣在任何特定的一天,這種意外發生的機率就是一萬兩千五百分之一。如果你用貝氏定理來運算這些數字,第一架飛機撞上的那一刻,我們分派給恐怖攻撃的機率就會從0.005%增加到38%。


然而,貝氏定理背後的概念不是要我們只要更新一次機率的估計就好。而是說,隨著我們看到新的證據出現,我們就應該不斷地這樣做。因此,在第一架飛機撞上之後,我們恐怖攻擊的後驗機率:38%,在第二架飛機撞上之前,就變成也我們的先驗機率。而要是你再次計算這個算式,來考慮第二架飛機撞上世貿中心的狀況,那我們遭受攻擊的機率就變成幾乎確定——99.99%。

我們都會驚恐的推論,在豔陽高照的紐約發生一次意外已經夠不可能了,第二次幾乎是真的完全不可能。

而貝氏定理還可運用在其它方面。例如40多歲的女性出現乳癌的狀況:女性在40多歲時得到乳癌的機會很幸運的相當低——大約1.4%。但是如果乳房攝影檢查結果是陽性,那機率又是多少?

研究顯示,如果女性沒有罹患癌症,而乳房攝影錯斷言她有癌症的機率大約只有10%。另一方面,如果她確實有癌症,有75%的機會會偵測出來。你看到這些統計數字的時候,陽性的乳房攝影結果似乎的確是非常糟糕的消息。但要是你把貝氏定理用到這些數字上,你就會得到不同的結論:假定40歲的女性乳房攝影為陽性,她得乳癌的機率還是只有大約10%。

這些假陽性的結果會比這個等式看起來地位更高,是因為年輕女性本來就很少會有乳癌。因為這個理由,所以許多醫生建議,女性要到50歲以後再開始做定期乳房攝影,那時得乳癌的先驗機率要高得多。

貝氏定理不是什麼神奇公式,它確實是要求我們要用機率來看待這個世界,就算是談到我們不願意認為是機率問題的事情也一樣。這定理沒有要求我們採取立場,去認為這個世界本質上、形而上是不確定的——拉普拉斯認為從星球的軌道到最小分子的行為,一切都是受一絲不苟的牛頓定律所支配,然而他在貝氏定理的發展上有助益。說得更確切些,貝氏定理處理的是認識論上的不確定——我們知識的限制。

結語
因為有許多的預測專家都會使用「貝氏定理」,所以我很早就對它很感興趣。這本書是我目前看到解釋和說明「貝氏定理」最清楚的一本書。

對於有豐富的統計資料來說(因為有較可靠的先驗機率),所以使用「貝氏定理」會更加準確。在美國有些專業的運動賭徒,像是賭職棒、職籃等,也會運用「貝氏定理」,預測出機率較高者才下注。但我目前好像還沒有聽過有人把它運用在投資股票上。

PS. 其公式是怎麼計算的,書翻譯的可能有誤,我試算了第一個例子,如下:
xy÷(xy+z(1-x))=0.005×1÷(0.005×1+0.008×(1-0.005))=0.385

有關書籍的介紹,請參考:作者、出版社、內容簡介
更多的理財書目,請參考:汪汪書架的書–理財書籍