2017年11月10日 星期五

資料的偶像崇拜(決斷的演算)

本書把運算模型和人類心理學結合起來,且寫的淺顯易懂,讓所有讀者都能輕鬆理解掌控世界運作的電腦科學,更重要的是,了解電腦科學對我們的生活有何影響。本篇只介紹「資料的偶像崇拜」。

歷史上,宗教文本經常要求信徒破除偶像崇拜,也就是敬拜對象是神像、繪畫、遺物和其他有形的人造物品,而非物品代表的無形神祇。舉例來說,十誡中的第一誡就是禁止「雕刻偶像,也不可做什麼形像彷佛上天、下地、和地底下、水中的百物」。

而在《列王紀》中,上帝下令製作一條青銅蛇,但這條青銅蛇反而取代上帝,成為敬拜和焚香的對象(上帝顯然不大高興)。基本上,過度配適就是資料的偶像崇拜,原因則是我們只注意測量得到的資料,反而忽視真正重要的東西。

舉例來說,過度配適可以解釋飲食口味的矛盾之處。就演化而言,味蕾的功能應該是防止我們吃到不好的東西,但我們覺得最好吃的食物為什麼反而經常被視為不健康?

答案是:口味是人體對健康的替代指標。脂肪、糖和鹽都是重要養分。幾十萬年來,喜歡吃含有這些成分的食物,是攝取永續飲食的合理方法。然而,改變食物的能力打破了這樣的關係。現在我們能在食物中添加過量的脂肪和糖,而且只攝取這些食物,而不攝取人類自古以來常吃的植物、穀類和肉類。

換句話說,我們對口味過度配適。我們改變食物的技巧越高超(以及生活方式與祖先差距越大),基準口味就變得越不正確。因此這個替代指標反而成了缺點,使我們任意攝取自己想攝取的食物,包括對身體不好的那些。

運動也可能過度配適。西洋劍的原始目的是教人在決鬥中如何自衛,但電子計分設備問世後,改變了這種運動的性質,正式決鬥中缺乏實質用處的技術,在比實中反而成了重要的技巧。現代西洋劍選手使用彈性劍身,可以朝對手「輕彈」得分,所以攻擊時只需要輕輕施力,足以得分就好。

結果現在的西洋劍比賽看來不像在砍劈或突刺,反而像在揮舞金屬皮鞭。這種運動還是跟以前一樣刺激,但選手讓戰術過度配適得分技巧時,真實劍術技巧在比賽中就顯得無用武之地。

過度配適乍看之下就像完全符合現有資料的理論,所以往往很難察覺。我們手上的資料和我們希望提出預測之間,幾乎處處都有落差。我們做下重大決定時,只能考慮現在對我們而言最重要的因素,猜測那個決定能在日後讓我們感到高興。

進行財務預測時,我們也只能觀察過去與某種股票的價格有關的因素,而不是與未來股價可能有關的因素。同樣的,在大眾意見調查中,我們生活的資料通常有很多雜訊,最多只能當成替代指標來衡量我們真正想探討的問題。

因此,不斷增加考慮的因素,投入更多心力來產生模型,反而可能使我們陷入最佳化目標失當的錯誤,就好像朝著資料的青銅蛇祈禱,反而忽略了它背後更大的力量一樣。

交叉驗證
我們該怎麼看出真正的好模型和過度配適的模型之間有什麼差別?例如,在教育場合中,我們該如何分辨一群真正了解某個主題的學生,以及只是「很會考試」的學生?要釐清這些狀況確實很不容易,但不是不可能。機器學習研究已經提出幾項察覺過度配適的具體策略,其中最要的一項稱為交叉驗證。

舉例來說,在學校裡,標準化測驗有不少優點,包括一種特別的規模經濟:能以低廉成本評定幾千個學生的分數。然而除了這些測驗,學校還可使用另一種評估方法,隨機評量一小部分學生,當成輔助評量成績。

輔助資料則可用來交叉驗證,確認學生真的已經學到標準化測驗要評量的知識,而不只是會考試而已。如果學校的標準化分數提高,但「非標準化」表現朝相反方向發展,學校行政人員就可以明確地知道,已經出現「為考試而教學」的現象,而學生的技能開始過度配適測驗本身的機制。

結語
許多技術分析者常會犯過度配適「資料的偶像崇拜」。原本技術指標是你要幫助你思考,太依賴技術指標的買賣訊號,反而讓你喪失思考的能力。

常有讀者問我,每當關鍵點記錄發出突破買進訊號時,我會跟著買進嗎?我總是回答:「不會,我會參考成長力資料。」【請參考:趨勢是你的朋友】。因為成長力資料可當關鍵點買進訊號的「交叉驗證」。

同樣的基本分析者常常致力於觀察過去的資料,並以此為據預測未來。例如:每年第1季財報還未公佈時,許多讀者會問我如何評估今年的成長率,可用過去的數據來推估嗎?

我總建議是,「不要」。因為以我的經驗,成長比較偏向「比較」關係(今年跟去年比較),而不是線性關係。我總是回答:「我不會評估,我會等第1季財報公佈後才評估。」

但我還是會建議他們可以試試看,到時第1季財報公佈後,可以比較看看,他們利用過去的數據所推估的準確度如何。因為未來充滿不確定,其準確度都不會太高。

如同巴菲特所說的:「如果光是檢視過往的金融數據資料就能看得出未來致富的道路,榮登《富比士》四百大的富豪個個都是圖書館員了。」

同樣的之前常有讀者問我如何精確的預估「合理成長價」,我說過我都採用粗估法,再用關鍵點記錄來「交叉驗證」【請參考:請問:合理成長價使用的方式是在預估EPS,請問Wawa平常都是用什麼方法在預估?】。如同經濟學家凱恩斯的觀點:「寧願要模糊的正確,也不要精確的錯誤。」

技術分析者往往認為基本面沒用,同樣的基本分析者也認為技術分析是巫術,我倒是認為基本分析和技術分析是很好的「交叉驗證」。換句話說,基本分析者的判斷必須直接反映在市場的集體判斷中,才是最佳的。

有關書籍的介紹,請參考:作者、出版社、內容簡介
更多的理財書目,請參考:汪汪書架的書–理財書籍