隨著人工智慧掀起熱潮,許多企業也想跟進,但這並非一蹴可幾。資料科學涵蓋了三個範疇,包括「大數據」、「機器學習」、「人工智慧」,其中大數據相當於原料,機器學習相當於處理器(processor),人工智慧相當於結果(outcome);也就是說,大數據加上機器學習,才能產生人工智慧。而以台灣企業目前的資料運用程度,顯然與人工智慧應用還有一段距離。
台灣企業資料運用現況,尚處於「描述」、「診斷」兩階段
如果將台灣企業運用資料的情況與描述、診斷、預測與指示四種分析階段對照。我們對於資料運用方法的認知,泰半還停在前兩個階段。
目前,金融業因為金融監理法規的要求累積了大量資料,科技業與部分傳統產業製造業因為要發展工業4.0,也積極蒐集製程相關資訊,電子商務零售平台則掌握大量交易資料。這些行業的在地領導企業,其中許多已經投資「商業智慧」(Business Intelligence)資訊平台,它們的日常管理已經可以監看關鍵績效指標(Key Performance Index)、資源儀表板(Dashboard),也可以產出動態決策報表,也就是說,企業可以掌握事情如何發生、為何發生的資訊,並據此進行管理;不過,許多企業仍仰賴人力判斷,來解讀產出的報表與資訊,因此資料價值的開發程度並不高,通常只有三成至五成左右。若要更有效地運用資料,就必須以電腦來解釋分析。
破除資料運用四大迷思,建立正確資料運用觀念
除了資料價值開發不足,企業的資料運用觀念也不一定正確。目前,台灣企業還普遍存在四項迷思:
迷思一:只要有數據,就是大數據。許多企業已體認到蒐集數據的重要,卻往往以為數據等於大數據。其實,具備了3V特性──大量(Volume)、高速(Velocity)、多樣(Variety)的數據,才是大數據。
迷思二:有數據就有價值。蒐集的數據,要經過處理、分析及開發最終產品(可能只是個影響決策的模型,也可能徹底改造營運流程),才能產生價值。以AlphaGo為例,它擁有的數據、棋譜,其實並不是什麼別的圍棋AI團隊沒有的資料。也就是說,好的資料固然重要,但分析模型的進步(最重要是深度自我強化模型的改善),才是提升AlphaGo能力的主因。
迷思三:將資料處理、機器學習,交給IT部門。很多企業認為與電腦、資訊相關的工作,都可以由IT部門負責,但其實資料科學家與IT人員的訓練,大相逕庭。資料科學家必須具備四大領域的知識:「數學與統計」、「程式設計與資料庫」、「領域知識與軟性技能」、「溝通與視覺化」,而IT人員通常著重於「程式設計與資料庫」的技能,普遍缺乏建立分析模型最需要的「數學與統計」訓練。因此,企業應避免誤用兩種不同的專才。
迷思四:資料分析,就是分析ERP、CRM系統中的資料。企業普遍認為,資料分析僅限於分析資料庫中的結構化資料(這也是為何企業常誤用管理資料庫的IT人員,來做資料分析)。但其實非結構化的資料,例如影像、錄音、視頻、文字等等,蘊含更多價值,卻往往被忽視。而且這種資料的分析門檻更高,更需要專業的資料科學專家來處理。...【閱讀全文】 |