(圖片取自網路免費資源。)
最普遍的統計失真在於「簡化」問題
前文"2019/01/25 個股分析(78)《挖掘潛力股》(2348)海悅"提到主計總處統計台灣房屋自有率高達 8 成 5 以上,這項統計就有很嚴重的問題使得有房族被高估,假如只是統計數據被高估那算還好,不幸的是相關政策也經常直接使用錯誤的數據,以致先是數據「失真」而後政策也跟著「走睛」(台語),導致無殼蝸牛(無房族)的權益被漠視了。
筆者認為這些統計數據會高度失真,最為普遍的原因就在「簡化」。怎麼說呢?如前述所說的房屋自有率,因為政府以往的定義是直接把「建戶」等同「家戶」來定義,且「自有」的定義是指「現住房屋所有權屬於戶內成員 1 人所有或其直系親屬所有」,則房子裡的人都被歸於「自有」。但是以「戶籍在家裡」但外地工作、或者「住在家裡」但需長期通勤、或兄弟兩戶同住但已是兩個家庭等等,這些有住房需求者卻被錯誤歸類為「有房」一族。因此,錯誤的數據,將會使得潛在的社會問題被過度淡化處理,例如以「房屋自有率」來看,沒有房的人不到 15%,很容易讓這些人的權益被政策喪失掉。例如長期的低房屋稅政策(房價以評定現值課稅)、很低的遺贈稅,以及縱容外國資金炒房等等,這些問題的根源可能都來自於對一些數據的「簡化」處理,造成後續蝴蝶效應的後果。目前,根據最新的報導,主計總處將把住宅普查的定義做改變,如原本以「房子」為單位改以「人」為單位,因此有學者預估,由於定義的改變,將使得房屋自有率下降至 7 成左右。
著名的諾貝爾經濟學獎得主及心理學家康納曼就在「快思慢想」這本書提到,當人們面對比較複雜問題的情況時,容易以「替代問題」來處理,這種方式就叫做「捷徑」,捷徑就是指將較好評估的「替代問題」去取代較難評估的「目標問題」。如同上例,以房屋自有率的問題來看,利用台灣的現有房屋數及家戶數的比例來相除,很容易就可以得到「房屋自有率」這個數值,但卻乎略了很多問題,如全台空屋數高達 100 萬棟,以及有錢人家容易有兩、三棟以上的房屋等等,利用簡單的計算來求解複雜的問題,不就是康納曼所說的「捷徑」?
「異常值」造成「平均值」的扭曲與假象
近幾年來,主計總處公布薪資數據總是引來媒體與民眾高度關切,而最新的例子就是去年行政院加開「我國薪資現況、低薪研究及其對策」的記者會上,當時的行政院副院長施俊吉就提出 2018 年最新一季的實質總薪資為 59,852 元,創下歷年同期的新高,此舉不但沒有引來民眾興高采烈的歡呼,反而引來各方的討論。原因在於,59,852 元是引入了「異常值」來造成「平均值」的扭曲,這個異常值即是「第 1 季」以及「總薪資」這兩項。由於薪資主要分為「經常性薪資」與「非經常性薪資」兩種,「經常性薪資」就是我們知道的月薪,包括本俸、固定津貼及獎金,而「非經常性薪資」就是加班費及年終獎金等,而因為第 1 季正好是年終獎金的發放季,因此才會有 59,852 這樣的平均實質總薪資數據出來。
另一個有關平均薪資的「異常值」就是高收入族群拉高了整體平均薪資,從下圖可看出「平均薪資」高過「中位數薪資」約 1 萬元,而領取中位數薪資者,佔比約為 87%。也就是說高達 8 成以上的人們,領的是相對較低的中位數薪資而非平均薪資。
(平均總薪資與中位數總薪資變化,圖片取自關鍵評論。)
(平均經常性薪資中位數與佔比,資料來源為主計總處。)
只看「量」而不看「質」
第 1 個例子,除了上述有關薪資爭議的討論外就是失業率,如去年公布平均失業率 3.91% 創六年來新低,以及就業人數年增率 1.7%,也是十二年來的次高水準。但其實細看其內容,在評估的 81 個細項行業中,卻有 39 個行業員工數不增反減,如人數萎縮最多的是零售業的「正式員工」,而人數增加最多的則是外包的「部分工時人員」及「派遣員工」。也就是說整體來看雖然「量」是增加了,但「質」卻是大大降低。
第 2 個例子就在幾天前的新聞,觀光局統計去年 2018 年來台的外國旅客突破 1100 萬人次,創下台灣史上新高。但去,反觀去年的旅宿業卻是業績冷颼颼,飯店、夜市一個一個倒、一個一個關。主因也是雖然外國旅客變多,但少的是比較高價值的外國旅客,且同時來台的日數也變少了,因此以觀光產業來看,旅客「量」雖增加了,但實「質」的貢獻卻降低了。去年的九合一選舉,高雄更以一句「貨出去、人進來」就讓選情翻天,可見數據與感受是如何嚴重的反差。
第 3 個例子以「財報」為例,「量」與「質」如果呈現在財報上,量就好比「營收」,而「質」就是指「毛利率」,稍微有點經驗的投資人都知道,財報如果只是看「營收成長」就貿然搶進,恐怕就有可能落入財報的陷阱之中,因為當營收成長但毛利率卻降低時,可能整體獲利反而下降。例如一家企業如果去併購一家經營不善的公司,併購後的下一期財報可能呈現高速的營收成長,但由於增加的營收可能是處於賠錢的商品,因此反而傷害自家獲利;但如果是併購比自已本益比還低的公司,則是比較屬於利多,因營收可望成長,且毛利率也能同步上升,因此如要判斷併購後的效益,就要從被併購方的財報一起分析才準確。
「小數原則」的迷思
「小數原則」就是指樣品數太小,沒法得到任何的推論結果。比如台股基金報酬率,在任何年度裡投資機構都會拿出前幾名報酬率最好的基金產品來說服投資人購買他們的商品,如 2018 年的 3 月統計最好的基金商品在半年內就創造了 37.5% 的報酬率。但事實上,這些績效最好的公司,都是剛好在那段時間持有「被動元件」,於是讓績效大幅度的飆升。這個例子就是說明,只靠單季、半年或者一年的績效就要證明這支基金經理人的操作績效良好,很容易陷入「小數原則」的陷阱之中,因為只要再看看隔壁完整的一年績效,則績效呈現的是大幅的下降。
(2018 年 3 月中小型股基金報酬,資料來源為經濟日報。)
上述所說的時間再推遲半年,來到 2018 年底時,另一篇報導說明平均 5 年的台股基金績效,可看出 2018 年全年的基金績效普遍都不好,僅 2018 年的上半年很好。而 5 年之中也僅 2017 年表現較為亮麗,績效勝過大盤,其餘年份就沒有贏過大盤很多。因此,從這邊的 5 年統計資料就可以看出先前所列出的前幾名基金的好表現,都是基於「小數原則」下所產生的謬誤。
(2018 年 12 月底 5 年台股基金報酬表現,資料來源為 Cmoney/工商時報。)
well said.
回覆刪除