Wired:在書中你也用了些篇幅討論均值回歸的現象,我們大多數人都以為自己懂這概念,但卻常常出錯,究竟大多數人為什麼如此常用錯?
Mauboussin:沒錯,大多數人都自以為懂得均值回歸的概念,但實際上,從一個接一個活生生的例子,我們發現,人們並不依照這概念來做決定。
讓我舉個例子,投資者自行操作的投資報酬率,會比共同基金的投報率還低。好比說,標準普爾500指數(註)自過去20年來至2011年為止,年獲利約8%,而共同基金平均也有6-7%的獲利率(根據手續費和其他費用,獲利有些波動),但個人投資獲利平均少於5%。表面上來看,很難理解為何投資人獲利會比他們投資的基金還低,但細看就會發現,投資人常不理會均值回歸,在股價走高時買進,然後在股價跌時又賣掉,這種買高賣低的行為,就是造成投資報酬率低於平均的主因,在學術上,我們稱之為「愚笨錢效應」(dumb money effect)。(註:普爾500指數,S&P 500 Index,記錄美國500家上市公司的一項股票指數。)
均值回歸所顯現出來的表象,往往讓人掉入陷阱,其中之一是「因果的假象」,然而人們往往忽略均值回歸不需要因果來解釋,它只是一個統計各個結果求取平均值的概念。舉個著名的例子:我們都知道高大的父親會有高大的兒子,但其實兒子的身高往往比父親更接近同儕的平均身高,同樣地,矮小的父親會有矮小的兒子,他們的平均身高也比較接近他們的同儕,沒有人會對這感到大驚小怪。
既然均值回歸僅僅在表現各個並不是那麼緊密關聯的結果間的平均,時間因素就顯得不那麼重要。所以我們說,高大的兒子有高大的父親,而父親的身高是比較接近所有父親的平均身高,兒子顯然不會影響父親的身高,但我們仍可以運用均值回歸的概念。
其實重點在於探討均值回歸沒有錯,但我們的思考往往會陷入尋求因果關係來解釋整個事件。
Wired:如果我們瞭解均值回歸的觀念,這對我們的親職教育有幫助嗎?例如面對孩子在學校表現時,父母應該抱持什麼態度?
Mauboussin:沒錯,你提到了另一個大家常犯的錯誤,也是我書中所說的「回饋的迷思」。假定我們都同意,你女兒在校的數學成績是實力與運氣的總和,若她今天拿了高分回家,也就是她不僅學得好,運氣也好,一般來說,你的第一反應會是什麼?你可能會大力讚美她一番,再怎麼說,好成績值得嘉許,但下一次考試會如何?按平均來看,運氣相同,成績則會比較低。
現在你可能很自動想把你的正向回饋,跟負面結果聯想在一起,或許你會覺得,你說的讚美導致她下一次的鬆懈,但實際上,最簡單的解釋是,這一切不過是均值回歸,而你說的話並沒有什麼影響。
因為同樣的情況在你責罵時也會發生,倘若今天你女兒帶著很爛的成績回家,代表她運氣很差,你很可能唸她一頓,然後限制她上網的時間,而她下一次的成績很可能就會比較高,而這一切其實跟你的碎碎念與處罰都沒關係。
在此要記住的觀念其實是,均值回歸完全是隨機的,把原因與隨機的結果連在一起,沒有任何意義。但我不是在說均值回歸只有隨機這因素,因為很多因素也會造成影響,例如運動員的老化及商場上的競爭,我要強調的是,有時候光是隨機這因素,就可以導致結果。
Wired:你的書中把重點放在商業,體育及投資三領域,但顯然技術與運氣在其他領域也扮演重要角色,是否可以跟我們分享有哪些領域也需要應用這兩個概念,而常常被我們所忽略?
Mauboussin:其中一個有很大應用空間的是醫學。流行病學家John Ioannidis在2005年發表了一篇引起廣泛討論的文章:〈為何大部分已發表的研究都是錯的〉(Why Most Published Research Findings Are False),報告中指出,醫學研究的實驗操作過程不夠嚴謹,很容易操弄實驗結果。他也指出80%的觀察研究結果要不就是錯的,要不就是誇大結果得來,這是因為觀察研究容易製造話題,對科學家的職業發展很有利。
問題是,人們聽到這些觀察研究,還會信以為真,奉為圭臬,這讓Ioannidis很不以為然,自己是醫生的他,並不信賴這類的觀察研究報告。我在書中舉了一個例子,有份關於早餐吃營養穀片的婦女較易生男孩的報告,其實是媒體渲染出來的結果,統計學家之後深入分析資料,認為這很可能只是巧合。
Ioannidis的研究或許跟我所著重的實力與運氣的議題,並不全然符合,但其實我們都在強調一個共同的重點:機率。一旦事件中的機率因素讓你不容易看出,人們就容易錯認原因,即使我書中著重探討商業、運動和投資三方面,我仍希望讀者可以將這概念應用到其他領域。
Wired:可否說說當我們在看實力與運氣時,哪些取樣的方式,例如低取樣(取樣不足)、偏見取樣或其他,可能導致錯誤結論?
Mauboussin:讓我們看看低取樣與偏見取樣。在商場上,低取樣導致失敗,可說是典型的失敗類型。沃威克商學院教授Jerker Denrell在一篇報告中,舉了一個很貼切的例子:假定公司有兩種經營策略的選擇:高風險與低風險,選擇高風險經營的公司,要不就大成功,要不就一敗塗地;選擇低風險經營的公司,營收不如高風險的公司漂亮,但公司都沒倒。換句話說,高風險經營的結果變數大,而低風險經營的結果變數小。
假定今天有一間公司想要根據統計數字,來決定他們的經營策略。乍看之下,高風險經營策略的統計數字似乎表現出色,因為那些成功的公司營運良好,而失敗的那些公司早已倒閉,也就是說他們已經不在取樣的樣本中了;反觀採低風險經營策略的公司,全都還緩緩喘息,使得平均績效看似不那麼好,這種情狀就導致低取樣失敗。問題在於,分別採取這兩種策略的公司,全部的統計結果呢?
或許你覺得上述概念如此簡單,任何細心的公司或學者都不會犯這種錯誤,偏偏這問題在商業研究中到處都有。讓我們來檢視一下典型的拯救企業方法:找出成功的企業,以及他們的共通特質,然後建議其他公司仿效這些特質。這是許多暢銷書大力鼓吹的方式,甚至Jim Collin的代表作《從A到A+》(Good to Great)也提到這觀念。舉例來說,Collins在書中提到,成功的企業共通特質之一,是它們都像刺蝟般專注在他們的事業上,但我們該問的其實不是「所有成功的企業都像刺蝟嗎?」而是思考「所有的刺蝟都成功了嗎?」無疑地,後者得到的答案,將跟前者大不相同。
另一個常犯的錯是我提到過的:根據少許樣本就下定論。賓州大學教授Howard Wainer舉過一個學校規模的例子,中小學教育學者想知道如何提升學生的測驗成績,所以做了一個看似合理的調查,統計哪一所學校的測驗成績最高;結果發現,小學校的測驗結果比較高,這讓我們立刻聯想到合理的解釋,因為班級人數比較少等原因。
但這不知不覺就落入了一個陷阱,接下來我們提出的問題應該是:哪所學校的測驗成績最低?結果也是小學校。這究竟怎麼回事?其實就統計觀點,小樣本會有較大的變異數,以上的結果是可以預見的,也就是說小學校會有最高和最低的測驗成績,而大學校的成績較接近平均,今天如果研究者只看測驗最高分,當然就看不到全貌。
但這可不僅是統計課,看看美國的教育改革學者花了數十億,就為了把學校的規模縮小;西雅圖就有一所大校,硬被分成五所小校,結果那些縮小規模的學校反而產生了新的問題,例如無法提供學生專長課的選擇、進階選修課程變少等。Wainer稱這種取樣與變異數關係,為最危險的等同關係(most dangerous equation),因為多年來它已經讓許多研究者和決策者栽跟斗。
延伸閱讀:
從科學角度看成功:運氣與實力大揭密(上)
從科學角度看成功:運氣與實力大揭密(下)
from WIRED.tw http://wired.tw/2012/12/21/michael-mauboussin-2/index.html