最近在看 Daniel Kahneman 的新書 Noise(中譯《雜訊》)。Daniel Kahneman 是2002年諾貝爾經濟學奬得主,他的前作 Thinking Fast and Slow(中譯《快思慢想》)基於他跟拍檔 Amos Tversky 多年來的研究,介紹人類的兩大思考模式,引起很大迴響。如果没有看過該書,可以先看看 Kahneman 2011年在 Google 的演講。這次的新書,則主要介紹及說明決策過種由於各種原因出現的雜訊,導致人們在面對相同的問題時也可以給出完全不一樣的判斷。他指出,這種在決策中現的雜訊隨處可見,書中的例子更是令人大開眼界。
在美國有人曾經研究過法官的判刑決定,不同的法官對某一案件的判刑可以是一年到十五年,有些研究更指出法官的判決跟會受一些看來毫不相關的因素影響。例如,如果本地的足球隊在週末輸了一場比賽,法官們在接下來的星期一所作出的判決會比較重。在法國,如果判決當天是辯護人的生日,法官作出的判決會較輕。書中另一個例子發生在 Kahneman 自己接觸過的一家保險公司。他發現保險公司不同員工在估算同一保單的價格或賠償金額時所作的決定並不一致,差額更可以超過 50%,而公司的管理層卻一直認為不同員工所作的決定相差不會超過 10%。
更有趣的一項研究見於一位來自西班牙的行為心理學教授 Uri Simonsohn 發表的一篇論文,題為 “Clouds Make Nerds Look Good"。他發現天氣對大學入學申請的審批居然有明顯的影響: 天氣不好的時候,負責審批申請的人員會更看重學生的學術成績,而在天氣晴朗的日子,在其他非學術方面表現突出的學生會比較有利!
Kahneman 在書中指出,決策的錯誤來自兩個因素,一為「偏見」(bias),二為「雜訊」(noise)(更為正確的名稱應該是 variance,即判斷偏離平均值的程度)。一般情況下,人們更容易察覺到偏見的存在,而忽略雜訊,但修正偏見跟減低雜訊,對避免作出錯誤判斷的貢獻是一樣的。故此他認為我們不應對決策過程中出現的雜訊視而不見。
作為一個在工作中經常應用到各種機器學習技術的軟件工程師,這些概念一點都不陌生。其實,bias 和 variance 正是機器學習中非常重要的概念,主要用於分析一個模型是否準確描述數據之間的關係。
- 一個模型 bias 比較大時,說明它過份簡單,未能完全反映現實世界中事物之間的複雜關係。例如,當要預測一個人是否有心臟病時,如果模型只認為年齡越大,則有心臟病的機率越大,很明顯這個模型不會十分準確。換句話說,這個模型的「偏見」十分嚴重(過份簡單),因為它只參考一個人的其中一個特徴來作出判斷,而且只考慮此特徵跟結果的線性關係。
- 另一方面,一個模型的 variance 比較大時,說明它過份複雜,在學習數據之間的關係時,會把一些本來跟結果没有關係、只是偶爾出現在個別情況的特徵也納入考慮,導致模型在將來的應用中未能作出準確的判斷(因為它很容易被數據中的雜訊誤導),也就是在訓練模型時經常會提及的所謂 overfitting(過度擬合)。
一般人可能認為在作出各種專業判斷的時候,專業知識是最重要的因素,但 Kahneman 在這本書裡面明確指出決策過程中的雜訊跟專業知識是否全面没有必然關係。要避免錯誤的判斷,除了要排除「偏見」/擁有全面的知識外,更要關注作出判斷時的所出現的雜訊。