汪汪財經隨筆集: 關於機率的預測技巧（平均數的誤解）

2024年6月26日星期三

關於機率的預測技巧（平均數的誤解）

商業人士該如何解讀數據？什麼樣的數據才有參考價值？曾任歐洲最大連鎖電影院「歐典影城」營運長，世界級品牌的高階主管——伊恩．費帕德，教你如何正確解讀數據。本篇只介紹「關於機率的預測技巧」。

對了解企業數據而言，機率可謂極其重要。或更確切的說，機率論中的某些概念，對於企業而言至關重要。不妨設想這樣一個案例，在你的客戶中，有20%的客戶住在英國西南地區，有20%的客戶年齡在65歲以上，請問你的客戶中，65歲以上且住在西南地區的客戶比例是多少？

第一種情況，即是所有65歲以上的客戶恰好都住在西南地區。在這種情況下，答案是20%，因為這兩項統計數據實際上描述的是相同的一群人。

第二種情況，老年顧客是隨機分布在全國各地。在這種情況下，我們可以合理假設，在這20%的西南地區客戶中，有20%的人超過65歲。也就是說，在我們的客戶中，65歲以上且住在西南地區的客戶比例只有20%的20%，即4%。

當然，還存在更極端的情況。有可能所有65歲以上的客戶都住在別處。此時，65歲以上且住在西南地區的客戶比例為0%。

由此可見，上述不同的情況，可以得到截然不同的答案。這主要取決上述兩項統計數據是否相互獨立。「獨立」這個詞，對於理解機率的工作原理太重要了。如果兩項數據彼此完全獨立，意味著了解其中一項數據，對於了解另一項數據毫無幫助，我們可以透過將兩項數據機率相乘的方式得出答案。情況二得到的4%結果，就是這樣算出來的。

在計算拋硬幣的機率時，我們也用到相同的計算方法。在知道了拋一次硬幣出現正面的機率為50%後，將50%與50%相乘，就得出拋硬幣連續兩次出現正面的率機為25%。這種計算方法，就是建立在兩次拋硬幣的數據完全獨立的假設上。第一次拋出了硬幣的正面，對第二次拋硬幣的結果沒有任何影響。

那麼，我們對機率是否重疊的新理解，跟公司目標又有什麼關係？其實，在現實生活中就有這樣的例子，例如，公司該投放哪些手機廣告給客戶？

假設根據過去的歷史數據顯示，在投放手機廣告的所有用戶中，僅有1%的人點擊了廣告。不過，當我按瀏覽器類型劃分流量之後發現，使用Chrome瀏覽器的用戶中，有5%的人點擊了廣告，而使用Edge瀏覽器的用戶中，點擊人數僅占0.1%。這說明，打算購買手機的人群傾向於使用Chrome瀏覽器，就像前面提到的，年長的客戶傾向於住在西南地一樣。

那如何再提高機率的預測呢？如果我能掌握使用者訪問網站更多的數據，而其中每一種數據都指向該使用者打算購買手機，那我就更有信心。例如，在網站上閱讀相關手機技術文章的用戶，也很可能購買手機。

而我們使用的技巧是相關性的累加：若我發現某個用戶既使用了Chrome瀏覽器訪問網站，又閱讀了技術文章，那麼，他很可能會購買手機。所以，當你在預測某件事（如購買手機）時，如果你發現其他條件與預測結果，存在一定的偏向或偏離關係，就可以據此修正原先的預測結果，來提高預測的正確率。

總體來說，當我們嘗試預測一件事時（例如，預測市場參與者財務狀況的優劣），首先要確定的是根據哪些變數，將統計對象劃分到與預測相關的有序分組當中。在此過程中，我們用到的展示變數關係的樹狀圖，其實就是與貝氏定理有異由同工之妙。

而使用這種技巧，就能讓你透過充分分析自己熟悉的事，來預測自己不熟悉的事。

結語

而我會寫這篇文章，主要的原因是：我在預測未來股票會上漲的機率上，也是使用同樣的技巧。我總是建議讀者，把成長力資料和關鍵點記錄的數據，複製到價值線資料的總表中，利用相關性（價值線、成長力、關鍵點）的累加，來提高預測的機率。

有關書籍的介紹，請參考：作者、出版社、內容簡介

更多的理財書目，請參考：汪汪書架的書–理財書籍

導覽列

2024年6月26日 星期三

關於機率的預測技巧（平均數的誤解）

2024年6月26日星期三