2024年6月26日 星期三

關於機率的預測技巧(平均數的誤解)

商業人士該如何解讀數據?什麼樣的數據才有參考價值?曾任歐洲最大連鎖電影院「歐典影城」營運長,世界級品牌的高階主管——伊恩.費帕德,教你如何正確解讀數據。本篇只介紹「關於機率的預測技巧」。

對了解企業數據而言,機率可謂極其重要。或更確切的說,機率論中的某些概念,對於企業而言至關重要。不妨設想這樣一個案例,在你的客戶中,有20%的客戶住在英國西南地區,有20%的客戶年齡在65歲以上,請問你的客戶中,65歲以上且住在西南地區的客戶比例是多少?

第一種情況,即是所有65歲以上的客戶恰好都住在西南地區。在這種情況下,答案是20%,因為這兩項統計數據實際上描述的是相同的一群人。

第二種情況,老年顧客是隨機分布在全國各地。在這種情況下,我們可以合理假設,在這20%的西南地區客戶中,有20%的人超過65歲。也就是說,在我們的客戶中,65歲以上且住在西南地區的客戶比例只有20%的20%,即4%。

當然,還存在更極端的情況。有可能所有65歲以上的客戶都住在別處。此時,65歲以上且住在西南地區的客戶比例為0%。

由此可見,上述不同的情況,可以得到截然不同的答案。這主要取決上述兩項統計數據是否相互獨立。「獨立」這個詞,對於理解機率的工作原理太重要了。如果兩項數據彼此完全獨立,意味著了解其中一項數據,對於了解另一項數據毫無幫助,我們可以透過將兩項數據機率相乘的方式得出答案。情況二得到的4%結果,就是這樣算出來的。

在計算拋硬幣的機率時,我們也用到相同的計算方法。在知道了拋一次硬幣出現正面的機率為50%後,將50%與50%相乘,就得出拋硬幣連續兩次出現正面的率機為25%。這種計算方法,就是建立在兩次拋硬幣的數據完全獨立的假設上。第一次拋出了硬幣的正面,對第二次拋硬幣的結果沒有任何影響。

那麼,我們對機率是否重疊的新理解,跟公司目標又有什麼關係?其實,在現實生活中就有這樣的例子,例如,公司該投放哪些手機廣告給客戶?

假設根據過去的歷史數據顯示,在投放手機廣告的所有用戶中,僅有1%的人點擊了廣告。不過,當我按瀏覽器類型劃分流量之後發現,使用Chrome瀏覽器的用戶中,有5%的人點擊了廣告,而使用Edge瀏覽器的用戶中,點擊人數僅占0.1%。這說明,打算購買手機的人群傾向於使用Chrome瀏覽器,就像前面提到的,年長的客戶傾向於住在西南地一樣。

那如何再提高機率的預測呢?如果我能掌握使用者訪問網站更多的數據,而其中每一種數據都指向該使用者打算購買手機,那我就更有信心。例如,在網站上閱讀相關手機技術文章的用戶,也很可能購買手機。

而我們使用的技巧是相關性的累加:若我發現某個用戶既使用了Chrome瀏覽器訪問網站,又閱讀了技術文章,那麼,他很可能會購買手機。所以,當你在預測某件事(如購買手機)時,如果你發現其他條件與預測結果,存在一定的偏向或偏離關係,就可以據此修正原先的預測結果,來提高預測的正確率。

總體來說,當我們嘗試預測一件事時(例如,預測市場參與者財務狀況的優劣),首先要確定的是根據哪些變數,將統計對象劃分到與預測相關的有序分組當中。在此過程中,我們用到的展示變數關係的樹狀圖,其實就是與貝氏定理有異由同工之妙。

而使用這種技巧,就能讓你透過充分分析自己熟悉的事,來預測自己不熟悉的事。

結語

而我會寫這篇文章,主要的原因是:我在預測未來股票會上漲的機率上,也是使用同樣的技巧。我總是建議讀者,把成長力資料和關鍵點記錄的數據,複製到價值線資料的總表中,利用相關性(價值線、成長力、關鍵點)的累加,來提高預測的機率。


有關書籍的介紹,請參考:作者、出版社、內容簡介

更多的理財書目,請參考:汪汪書架的書–理財書籍