2024年4月17日 星期三

隨機散佈資料的評估(社會菁英必備的數學素養)

面對現代資訊、金融社會各式各樣的數字轟炸,能夠運用數學思維和資訊統計工具,以簡馭繁、排除雜訊、擺脫偏見,從數據中獲得洞見,這才是各行各業的社會菁英,都應當具備的數學素養。本篇只介紹「隨機散佈資料的評估」。

想像你繼承了1,000英鎊的遺產,想要讓這筆錢變得更大。你可能會選擇投資股市,希望找到績優股低買高賣;你也可能選擇下注運彩,或許你支持的球隊正在和地主隊比賽,又或許有一匹賽馬的名子很有趣;或者你比較喜歡純粹遊戲,在賭場中將遺產全部押注在輪盤、骰子或紙牌遊戲上。

坦白說,以上三種方法都無法像存錢在固定利率的儲蓄帳戶般,能保證增加財富,因為三種方法皆涉及程度各異的隨機性。大家應該都清楚明白,許多賭場遊戲都是純機率遊戲,本質上完全無法預測。

我們先來討論股票市場,股市的行為似乎完全無法預測。從理論層面來看,股價行為隨機到何種程度,依然頗具爭論。有些證券的價格較容易確定,如追蹤特定指數的基金,投信會利用發行量控制市場供需,讓基金價格符合特定指數的基金。

然而,有些證券的價格基本上無法預測,例如某個股市大亨可能出於未知原因的個人喜好,決定買賣特定股票而造成股價漲跌。當然,如果有人真能預測股價變化,就能夠獲得巨大財富,似乎還找不到任何人,能夠完美預測短期的市場走向。

關於機率的評估很類似「大數法則」,它告訴我們,如果不斷重複結果獨立實驗,則特定結果出現的次數比例,會愈來愈接近該結果理論上應當出現的機率。例如,如果丟了許多硬幣,我們可以期望不約一半的硬幣會丟出正面。

另外,大數法則透露了「平均」的直觀概念,也就是告訴我們如果重複實驗愈多次,實驗結果的數值就會愈集中。例如,一個骰子的平均值為(1+2+3+4+5+6)/6=3.5,因為它1到6的數字,出現的機率皆一樣,這表示,若你丟骰子10次,其總數有很高的機率會接近3.5×10=35。

接著,若我自己試丟一下,結果為:1、5、3、2、2、6、1、4、6、1,總點數為31。也就是說,十顆骰子的總點數最可能出現在30到40之間(靠近35),也就是樣本平均數落在3和4之間(靠近3.5)。

事實上,這樣的結果在眾多獨立實驗都成立。各種實驗都能夠找到某個「期望值)。一般來說,大數法則認為:無論是哪種重複實驗,結果的樣本平均數都很可能會十分接近期望值。因此,擲骰子的期望值為(1+2+3+4+5+6)/6=3.5。丟硬幣的期望值為(0+1)/2=0.5。

但是,結果並非隨機的話,計算期望值的方法就比較難了,需要乘上各自出現機率的權重。例如,假設丟的是偏差硬幣,2/3的機率丟出一正面,1/3的機率丟出反面,則丟出正面的期望值為(2/3×1)+(1/3×0)=2/3。

請注意,「期望」這個說法有些奇怪。例如,擲骰子,由於數子只有整數點,所以永遠丟不出3.5這個結果。因此,實際上根本無法期望能看到這個期望值出現。我們應該將期望值視為在重複足夠多次下長期結果平均值。

而不同的實驗也可能得到相同的期望值。例如,如果丟一枚公平硬幣,一面寫著3,另一面寫著4,則期望值為(3+4)/2=3.5,與擲骰子相同。但很明顯的,擲骰子結果的數值分布,會比丟硬幣的結果更分散。如下圖:


大數法則告訴我們,如果重複一個實驗足夠多次,樣本平均數就會接近期望值。另一個原則是「中央極限定理」:樣本平均數出現特定值的機率分布,都會接近常態分布(如上圖)。然而,資料數據也可能會產生其他曲線,不假思索就採用中央極限定理,很可能會錯誤解讀資料數據。

其中,另一個可能造成誤解的原因,就是鐘型曲線的對稱性。但並非所有資料都具備這種對稱性,瞭解資料的期望值(平均數)和中位數可能差異甚大,也十分重要。例如,英國的家庭所得分布一點也不對稱,曲線峰值偏左邊,平均數也高於中位數,因為一小部分高所得族群拉高了平均數。

中央極限定理明確告訴我們一點,低變異數實驗會產生集中的結果(較窄的鐘型曲線),而高變異數實驗則會產生較不確定的結果(較寬的鐘型曲線)。

不該低估極端事件發生率


金融市場模型的基礎版本,是假設股價波動為常態分布,然而每天的股價波動,有可能遠遠超出基礎模型的預測。事實上,將現實狀況錯誤假設為常態分布,曾經在2007年8月金融危機時,將我們引入歧途。

因此,瞭解一組資料的極端屬性與瞭解中心和散布,同等重要。採用標準但錯誤的模型假設,會讓我們對金融市場崩潰發生的極端值出現機率,產生錯誤的安全感。

結語

從本篇文章的觀點,在機率上,我們買進個股的價位,最好愈靠近「期望值」區間愈好。而在個股「期望值」區間的評估,可以參考我課程上所教的「便宜價」和「合理成長價」。如下圖:


例如,2021年我買中興電(1513)的價位為48.3元,就是在這區間當中。而前年(2022年)我買的漢科(3402),價位為46.5元,是更低於「便宜價」。但以今年股市大多頭的情況下,若想找出股價低於「便宜價」的個股,機率大大降低了。

另外,散戶(韭菜)最喜歡問的一個問題就是:某某飆股(已超漲的股票),還會再漲嗎?

但許多人並不明白,這其實也是機率的問題。就像一個連續都丟出6點的骰子,被問道:接下來會再繼續丟出6點嗎?若專家(名嘴)回答:會再漲。答案也並沒錯,只是機率並不高。

其實,反而應該擔心的是(若瞭解機率分布的話),追高後,骰子擲出的卻是1點該怎麼辦?就像昨天(2024-04-16)台股單日突然大跌547點一樣。

所以,有些讀者推薦的個股,我沒收。並不是其基本面不好,而是股價已經被炒過頭,機率已不站在我們這邊了。

然而,須注意的一點是:個股的「便宜價」和「合理成長價」之間的區間,並不是固定不變。每年都會應基本面的變化,而不同。

總而言之,最好找的個股是:股價落在「期望值」區間內,且該個股的「期望值」區間,每年都往右移(愈變愈高)。但這需要靠質化分析,而我在投資研討會上,會教各位我的分析技巧。

有關書籍的介紹,請參考:作者、出版社、內容簡介

更多的理財書目,請參考:汪汪書架的書–理財書籍