大數據這個關鍵字從去年紅到今年,早已成為科技業的重要趨勢,研調機構IDC便預測2015年將有超過25%的企業導入巨量資料方案,而美國專業招聘公司羅致恆富(Robert Halt)公布的《2015薪資指南(2015 Salary Guide》更把大數據工程師列為今年薪資漲幅最大的六大行業之一,預計薪資年成長率9.3%,平均年薪119,250美元至168,250美元。
台灣從企業到政府也人人高喊大數據,連向來對新科技接受速度最慢的政府都開始動作。行政院長毛治國甫上任祭出的科技三箭,就有兩箭跟數據息息相關,一個是開放資料,一個是大數據,新北市政府日前也推出全國第一個「傳統產業大數據應用示範計畫」,希望導入大數據分析,幫助金屬、機械和紡織等傳統產業轉型,還在日前的新北大數據論壇活動中請來美國大數據分析與儲存技術公司Teradata首席技術長寶立明(Stephen Brobst)來分享大數據趨勢。
寶立明此次來台除了出席新北大數據論壇分享大數據趨勢,更受邀至行政院與毛治國暢談開放資料政策,分享美國政府開放資料的經驗以供台灣借鏡。寶立明去年被ExecBank選為全美排名第四的CTO(前三名分別是亞馬遜、特斯拉和英特爾),在2500名頂尖CTO中脫穎而出,他不僅是全球一流的數據專家,更曾成功創立三家提供數據服務的公司,後來陸續被IBM、NCR等大廠併購,他也是歐巴馬的創新科技顧問委員會的一員。
身為全球頂尖的大數據專家,寶立明在接受《數位時代》專訪時卻說,他認為大數據這個詞將會在五年內消失,並認為從物理學家到社會學家都會是優秀的數據科學家,以下為寶立明專訪的內容摘要:
(圖說:Teradata首席技術長寶立明認為,以後數據是每家企業的DNA,大數據這個詞將會在五年內消失。照片來源:李欣宜攝。)
1. 大數據這個詞近年來非常火紅,但也有人認為大數據已處在泡沫期,您怎麼看這種人人高喊大數據的現象?
我承認現在整個社會上瀰漫著一股大數據熱潮,但我認為這不失為一種好現象,因為這讓大家注意到這個世界上還有許多尚未被挖掘,並且充滿價值的資料,我認為在這股熱潮當中,其實是有黃金的,但就像你說的,其實還是有很多人不知道大數據是什麼意思,更不知道怎麼用他。
他們以為大數據就是指大數目的數據,事實上,我認為這是大數據中最無趣的部分,我們真正在尋找的是非傳統的、而且未曾被挖掘過的資料,並且從這些資料中去提煉出價值,我相信在五年內我們就不會再使用「大數據」這個詞了,到頭來大數據就只是資料而已,不是嗎?資料是很重要,但是這個世界上還有一大堆以往根本不被視為是資料的資料在那邊等著我們挖掘,到最後,人們會開始回頭分析這些資料,他們會發現,大數據不過就只是數據的一種,大數據、小數據、結構化、非結構化的資料...這些稱呼通通都不重要,因為這些都是資料啊,這是我認為為什麼到最後大數據這個詞彙將會退燒的原因。
2. 你認為數據經濟以後將會成為每個企業的DNA嗎?
是的沒錯,人們將會依據一家公司是否有效地運用數據,來定義這家公司是否成功。大數據這個詞也許是三年前才出現的,但其實它早在十年前就有了,概念比名詞出現得更早,在八年前發生了一個比較重大的轉變,人們從研究一筆交易變成研究互動,我們開始往下鑽研,不只研究一筆交易,更研究真實的顧客體驗,因此我認為雖然不是每一個,但許多大數據應用必須要能夠更妥善了解顧客的行為和體驗。
我認為大數據發展可以分成三階段:
第一階段是.com時期,人們研究log資料,蒐集人們的Cookie和搜尋行為等等,這類分析已經存在很久了,我們不只知道使用者買了什麼東西而已,而是更深層地去分析行為,一筆交易只告訴我價值,但沒有告訴我顧客體驗,大數據想要去分析的是顧客體驗。
第二階段是社交網站,這也是我們現在正在經歷的階段,我們分析Facebook、Twitter、部落格文章...等等等,這可以幫助我們進一步了解顧客行為。
第三階段是物聯網,這是我覺得最有趣的階段,有些企業已經開始分析來自感測器的數據了,在這邊我說的物聯網不只是穿戴式裝置或智慧家庭而已,我說的是機器與機器之間的溝通,這些資料的價值很值得被研究。現在製造業都會訂下一些規矩,例如我們的汽車每半年就要進廠維修,就跟人每年都要去做健康檢查一樣,我認為這是非常過時的想法,一旦我們用感測器去蒐集引擎、汽車和生理數據,我們就可以精確知道何時需要進廠維修或做健康檢查,這就叫做預測性維修(condition based maintenance),這個概念對於促進顧客體驗、效益和健康保險等領域非常重要。
3.你對大數據的定義是什麼?
一般來說我們用3V定義大數據,容量(Volume)、快速(Velocity)與多樣性(Variety),其中我認為最重要的是多樣性,資料不只來自那些傳統管道,有更多來自非傳統管道的非傳統資料產生,我認為價值(Value)是第四個V,人們常常忘了這件事,他們專注於技術,卻忘了創造價值,但這卻是一個大數據計畫能否成功的關鍵:這不只關乎技術,而是你能用技術創造出什麼價值。...More |