先說一個在統計界流傳已久的笑話,也開一下政客的玩笑:
三位統計學家和三位政客準備搭火車去參加一場會議,三位政客各自買票,但三位統計學家只買了一張票。政客們好奇地詢問統計學家,查票員來時,你們怎麼辦?統計學家回說:「放心,我們當然有解決方法。」查票時,三位統計學家悄悄地躲進一間廁所裡。當查票員敲廁所門時,統計學家就從門底下遞出了一張車票,順利地通過檢查。
會議結束後,統計學家和政客們剛好又搭乘同一列火車離開。這次,三位政客依樣畫葫蘆,只買了一張票,但他們更訝異的是,三位統計學家竟沒有買車票!統計學家又自信地回答說:「沒問題,我們自有不同的方法來處理這種狀況。」當查票員來時,三位政客很快的溜進一間廁所裡,統計學家默默地走到政客們藏匿的廁所,並且權威地敲門,政客們從門底下遞出了車票,三位統計學家拿了這張車票,悄悄地躲進另一間廁所裡。
這個笑話絕非教人如何取巧,而是所有統計方法都有其原理與假設,亦即會有其限制。面對不同資料,會有其對應的不同統計分析方法;若僅是套著相同統計方法,去處理分析不同資料,是會造成誤導的。單是對資料特徵的敘述統計,平均數、中位數和眾數,及其他百分位數,都有不同的涵義與目的。
國際知名統計學家吳建福院士多年來在學界倡議「資料科學」比「統計」更能適切反映當前時代趨勢與潮流的資料分析想法;他認為中文的「統」為收集(Collecting),「計」為計數(Counting)。資料在大數據與AI的年代裡,是至為重要的關鍵。吾人在此將「統」定義為統整(Integration),「計」為計算(Computation)。因此統計學整合各種類型資料,運用適合的計算或演算法將其轉化為資訊,獲取對原始資料的深刻理解或洞察,藉以建立預測模型,以提供各種可能的應用與決策。
數學好不好,是相對的。面對統計專業裡的朋友同事,我的數學是不好的。我相信,目前政壇上很多政治人物,當年能考上大學,自然有一定的數學程度。我更深信,政府裡有非常專業的統計部門與優秀的統計官員;而且數字是無關顏色的。然而,當政治人物在引用政府統計資料或數字時,總令人懷疑他們對資料與統計分析該有素養,如何讓人民相信其施政品質。
英國首相班傑明.迪斯雷利(或馬克吐溫)曾說過,世界上有三種謊言:謊言、惡毒的謊言與統計數字。如果刻意去操作,或選擇性地使用統計數字,來支持令人質疑的分析結果,統計是有可能比惡毒的謊言更惡毒。
資料與數字若不是用來幫助施政的決策參考,而是各取所需的捍衛施政窘境、政黨利益或增加選戰、口水戰的子彈,就如同另一個有趣的說法:統計就像比基尼泳裝,好看雖好看,但重要的部分,都被巧妙的遮掩了。
一個獨立、超然的政府統計機構,在目前的政府組織結構與調整下,似乎很難期待。但我們至少期待統計素養能在國民教育裡深耕,政治人物能夠謙虛、謹慎的徵詢統計以協助決策分析的品質。