【寂天英語學習充電報】提供英語會話及實用會話句型,讓你脫口說出流利的英語,不再「看的懂」卻「說不出口」! 想與全世界競爭,孩子該培養哪些能力?父母又該如何協助?更多精彩內容詳見【下一代國際力】!
無法正常瀏覽圖片,請按這裡看說明   無法正常瀏覽內容,請按這裡線上閱讀
新聞  專題  理財  追星  社群  Blog  哇新聞  書籤  電子書  
2010/04/14 第80期
訂閱/退訂看歷史報份直接訂閱:
封面故事 TechMining完全掌握哈燒議題
延伸閱讀 閱讀4合1創新模式
活動快遞 訂閱優惠
TechMining完全掌握哈燒議題
文/李珞
找不到適合的報導主題,是媒體工作者最擔心的問題之一。即時的網際網路資訊, 可作為汲取靈感的重要管道;但面對浩瀚的網路訊息,要從何下手,才能有效精準篩選出質、量均符合所需的資訊?

財團法人資訊工業策進會創新應用研究所與清華大學服務研究所合作研發的TechMining技術,將會是新世代媒體工作者的議題搜尋好幫手。TechMining可針對英語新聞網站、部落格作全天候監測觀察,一旦有新文章pose上網,就能馬上對文章進行關鍵字拆解、判讀,依關鍵字特性作統計分析;根據分析的數據結果,可判別在一定的時段中,最熱門的議題是哪些公司、技術、產品等。

讓研究主題不落伍

「這項技術的雛型,原來是為了配合我們的研究工作而來,」資策會創新應用研究所技術觀測與應用分析組組長徐毓良說,因為經常關注應用技術的研究,必須了解最新的市場發展,而與鑽研資料探勘領域的清華大學服務科學研究所所長林福仁教授合作開發TechMining網路服務技術。

藉著TechMining之助,研究團隊可掌握目前市場最熱門的議題,讓研究主題不致於過於冷門或落伍;另一方面,一旦偵知某個產品的議題熱度統計排名有了變化,也就可以推測市場應該是出現了一些值得關注的事件,可以直接點擊該關鍵詞的最新網路報導文章,看看發生了什麼事。

運用TechMining,可以設定自己希望「盯住」的目標網站,如目前資策會研究團隊便設定這項技術定期偵測如美國商業週刊《BusinessWeek》等11個英文新聞網站(表1),執行全天24小時的監測觀察,所有新上線的文章皆納入統計,並直接探勘關鍵字,進行統計分析。可依年、月、星期分期區間,按話題熱度排行(表2)。查詢入榜關鍵字時,相關新聞圖片與文章便直接秀出來,同時顯示關鍵字的關聯詞組圖示,要追索相關新聞,就容易得多。

Web 2.0 資訊大爆發

協助開發TechMining技術的林福仁教授說明,社會網路(Social web)相關知識的研究,至少已有10年的歷史,但當年計算技術仍受限,所以還停留在小型的組織實驗階段,無法處理大筆的資料關聯情況。但進入Web 2.0時代後,開放的資料、高速的運算,詳細掌握各種資料的關聯性成為可能。「過去對實驗的描述,我們都稱為Sample(樣本),但現在都直接稱為Population(母體)了!」林福仁笑著說。

林福仁解釋,Web 2.0提供了資料探勘的一道巧門,能為每個人的需求,打造出專屬的資訊服務系統。如目前手機已相當普及,就可以透過網路,在手機上打造一套完全符合個人興趣需求的即時剪報系統,運用電子設備的運算、判讀能力,就能將搜尋與過濾的成本節省下來,整理出有效率的資料,並能進一步累積運用。

有了標籤 資料就能被分類

「為資料訂標籤(Tag)很重要,只要有了標籤,資料就能被分類、推薦,」林福仁說,無論是文字或圖形檔,有了標籤描述,即可進行比對;當然,在比對過程中,電腦難免會對一些同義詞混淆、誤判,這時操作者即可另作人工比對,視情況將類似的關鍵詞重新定義統一,以提升資料的準確度。例如推薦口碑,因為探勘的結果為眾多網友認同,所以這個口碑的可信度應該就很高。有些網站就是運用資料探勘所得的網路推薦數據,成為集結同類網站資訊的另一個資訊中心,如某些介紹旅遊景點的網站,本身並不直接採訪旅遊景點,而是依網路口碑,引用各景點的網頁,或旅人經驗分享的網站資料,相互連結分享。如同前述的手機行動新聞剪報站,就是一個引用各大新聞台資料的個人新聞站。

「後知後覺」勝於「不知不覺」

林福仁指出,進入雲端時代,企業的各種營運交流需求日益增加,對於客戶關係管理(CRM)、供應商往來等服務的的管理,勢必更仰賴資料探勘技術的協助。如美國中情局(CIA)就具有自動監測重點國家與組織相關資訊的科技與機制,一旦發現通信或資料狀況異常,便能及時反應;又如世界衛生組織(WHO)也一直密切探勘各國的新聞資料,藉此監測各國的傳染病、污染發生狀況。

TechMining的原理與目的也相似,使用者可設定各種資訊監測範圍,協助找出最火紅的話題,秀出原始報導,並描繪出相關產業鏈與關係,讓使用者可以繼續跟追發展。在第一時間掌握熱門話題的轉變,了解產業的變動,可以視為配備靈敏新聞鼻的監測「烽火台」,即時掌握議題,就能領先同業競爭者,這項探勘工具可望成為媒體出版業的新寵兒。

不過,林福仁說,雖然資料探勘可以同步抓到新資料,但還是要等資料公開上網才抓得到,嚴格地說,比起早期投入的「先知先覺」者,還算是「後知後覺」,但絕對可以避免「不知不覺」的窘態。

目前TechMining的功能限於英文資料的處理,主要是英文字詞的正負向意涵與副詞程度較容易判定,中文的文法比英文複雜,所以中文資料探勘技術發展的應用起步較晚,但也蘊含更大的商機。林福仁說,未來TechMining可配合雲端運算架構,提供行動化、模組化、有機化的客製服務,企業在開放的Web 2.0環境中運用資料探勘服務,可以建立起屬於自己的有價、有系統的資料庫。

 
閱讀4合1創新模式
文/楚知
從智慧手機到小電腦與閱讀器,一直到最近新推出的平板電腦等各種新的載具都在詮釋新的閱讀行為、閱讀環境以及閱讀的內容格式。

上一季舉辦的「電子書高峰論壇」中,美國歐萊禮(O'Reilly Media)的數位部門副總安德魯薩福克斯認為,數位出版的世界並非傳統出版的延伸,而是一個全新革命性的景觀,並大膽預測多元內容與行動載具將是一體兩面的新浪潮。

所以,電子書如果只是將傳統的印刷內容放到電子紙上面是不夠的。當然像Kindle與iPad的做法是立即翻新了原來那些書本與報紙的流動通路與閱讀方式,但這樣的革命其實只是初期的現象,因為電子書或數位閱讀不會局限於「新型印刷術」或「新型書本」這樣的變種角色,而會很快的找到他自己原生基因的品種與專屬的形貌。

就像攝影剛發明時就被看成「很準確的繪畫」,社會也把它看成是「繪畫的變種」。而電影發明時就被社會看成「可以拍連續動作的東西」等等,看成攝影的變種,但後來的發展證明這些都是文化發展上具有新基因的新品種。每個新品種都為人類社會展開一波革命性的文化景觀與社會生活。

從數位出版到數位閱讀,我們可以預見它們將是互為因果的創新過程,我們注意到傳統書本變成數位載具的內容,看到歐美報紙進入平板電腦閱讀器……這些創新熱鬧現象似乎只屬於歐美主流國家,我們的關切也是這一波趨勢之下產業訂單與消費熱潮的焦點。

但在深度的文化觀察上,大家可能忘記還有一環的革命浪潮也正在靜默而激烈的翻動中,那就是數位寫作的方式也將超越舊日狹義的「寫」,而在數位工具與網路的環境中邁入廣義的「網路書寫」,或是「網路論述」的新格式中。

同樣的,傳統的寫作、出版發行、銷售、閱讀這四段工作一直被視為書本產銷的的標準流程,現在其實都在進行一場靜默革命,只是還沒找到正式的產業新格式而已。

這四合一的革命與行動載具的發展同步地展開,在即將到達的網路3.0基礎上,會讓書本的內容包含了互動文字與多媒體,而行為則包含了遠距同步與即時社群,資料流動包含了雲端與行動運算等等……。它將繼承了「書」的嚴謹架構(有別於一般搜索與對話),接收了遠距互動與超連結的「網路」性格,以及多媒體與視訊的豐富體驗感……。

這樣的書本(或稱論述內容),我們可以跳開產業熱潮眼前的景觀,而在文化視野上預測它的面貌嗎?這是本專欄這個月的探討與實驗的主題。

把書本論述活動放到Web3.0世界

我們設計了一個網站稱作「散步書房」,準備對寫作、出版、閱讀、展銷等四者,發展某種創新的活動格式。

針對「書本」這物件,嘗試要在網路世界中創造新格式之前,我們先把印刷術的外衣褪去,也先省略繁複的現代行銷手法,直接著手觀察人類社會中關於著作、出版、閱讀這三種現象的原點。

我們會發現其實與所有著作活動一樣,這三合一的活動顯然是從作者將思維見識與體驗精煉化開始,進行某種可以再現的紀錄(至此為著作),其次是為訊息準確傳送而進行的精心編排型式與進入載具(至此為出版),最後是讀者在這種精心編排的形式中學習,思維與使用的過程(此為閱讀)。

這樣的定義即使在後現代大師的多重閱讀理論中(如羅蘭巴特德的「作者已死」等論述)或是網路2.0交織混合了讀者與作者,重疊了讀與寫的世代現象中,我們只要把上述三者的描述看成一組相互參透的領域,那麼針對「書本論述」這種文化產物而言,這樣的定義仍然可以成立,而且可以在行動網路時代找到許多新的出路。

從以上原點三段元素出發,再把它們放到Web3.0時代的科技與社會環境裡,會發現它們可以被投影到一個全新的活動空間中。

a. 互動性:

這三要素可以互動地進行,而且可以有多回合,多層次地互動嗎?不是網路留言對話的互動,而是著作,出版,閱讀這三種分別代表了思維創作。傳播形式與思維體驗的三種活動格式因此都可以互動,而又因為互動而變得多層次地循環進行?

也就是說,原來屬於上下游的關係保持互動,這上中下游的接力會變成許多小漩渦般非常多回合,多層次,這時創作與閱讀還能保持多少獨特性?

b. 行動性:

行動代表隨身、隨時,所以也代表同步與應用。因為隨身的載具如智慧手機把網路能力(帶出電腦桌之後)帶進了人類所在的種種社會環境。所以,在真實現場環境中的「應用」成為極大需求。

書本可以進入行動載具已無庸置疑,但書本可以應用在許多行動時刻與行動環境(情境)?這應該是無法避免的要求。

c. 動態性:

多媒體視訊、即時視訊、動態化的內容,這些傳統書上沒有的東西都會整合進入。

動態內容的邏輯挑戰著上述論述流程的三種活動。

動態性的媒體豐富動人,與傳統圖文有不一樣的體驗與表現空間,動態同時也意味著此時此刻的動態,真實即時的注視……若加上互動與連結性,此時的動態就是雙向的,此時的遠距空間就被結合。

d. 連結性:

跨地理的連結在內容互動與同步效果之外,還有更長期而全面的影響。連結的格式從手機、環境、載具、貨品、感測器、晶片卡,也把人與社會的(土地)基礎改變。

「書本」連結的時代裡,可以變成一件神奇的入口,連結整個世界嗎?其實大家都知道答案,但是「產品格式」還沒有被市場化而已。其實我們放寬想像力,可以發現「連結整個世界」的產品不一定為Kindle或iPad,普通的紙本書也可以的。那麼如果上述三種活動(著作、出版、閱讀)都加上連結性,會是怎樣的格式?

e. 空間性:

從超連結與多媒體出發,我們發現數位內容可以多向多元地動態呈現,進入行動運算時代,我們發現真實而豐富的世界才是資訊處裡真正的對象,但這兩者也提出一個隱形的重要訴求,就是「數位內容的空間性」。對前者而言,空間性才能讓人在多向通路裡著作與閱讀,對後者而言,真實世界的資訊並非傳統的文字圖片甚至錄影等可以記錄與表達……。

散步書房首先要邀請一位作家,為他(她)設計一套無學習門檻的網路工具系統。

藉這工具系統讓他可以在書房中,在道路上,在球場或用餐會客等各種日常活動的空間中都可以進行「寫作」的活動,或者說是傳統寫作前的「視野」活動。

散步作為一種寫作,同時也是出版與閱讀

我們如果放寬對於書房寫作的定義,其實即使傳統的作家在書房桌前稿紙的書寫活動之前他在散步、旅行、聚餐聊天或巷弄觀察等日常活動中,早已進行寫作前的寫作(或是手記寫作),即使完全沒有文字或筆記的活動,但是在種種視野焦點搜索轉換的思維與論述著作的活動也早已展開了。

回到網路與多媒體時代的今日,我們可以將作家日常活動的視野與體驗,思維與觀察都同步地記錄到網路上,有時只是無名或不確定的視覺注視,有時是視野觀察附帶獨白或思維的紀錄,有時又是文字描述提煉,延伸到更大的象徵與想像世界。

文本到這個段落為止,我們在技術上完成這工具之後,還不能進一步設計它的呈現與傳播格式,因為要先思考一個問題:

這些都是寫作或著作嗎?或許真要問的是「這些可以讓人有意義有組織地閱讀嗎?」這個問題要把載具與閱讀者同步放進來,三合一地才能找到答案。

但從這個起點開始,我們要進行多回合的循環流程,在其中導入互動、行動、動態、連結、空間等五種Web3.0要素的格式。

例如對地理空間的同步記錄,與讀者即出版者的同步,行動寫作、應用、與閱讀,動態媒體與遠距同步視訊,還有社群活動等等。最後要導入傳統編輯與製作的嚴謹流程,真正照顧到讀者的閱讀、理解與應用的品質,這是網路時代中很需要保留的,作為「一本書」的精神。

(因為專欄篇幅所限,後續內容與實作活動的工具將在4月下旬的ideas.org.tw公開,歡迎讀者參與並提出意見。)

 
訂閱優惠

慶祝《創新發現誌》2周年,續訂一年12期NT$299再送隨行涼風扇及日本進口紫外線偵測手機吊飾2項創意小物!限量100名,完整內容請見《IDEAS創新發現誌

編輯小語

【IDEAS創新發現報】自即日起更名為【IDEAS創新發現誌電子報】,感謝讀者的支持。

 
蜘蛛絲是從肛門排出來的?
蜘蛛網是怎麼出現的呢?如果仔細觀察蜘蛛築巢的情況,將會看到,蜘蛛網是從屁股部位源源不絕的排出。那麼,蜘蛛網是從肛門排出來的嗎?

活動》訂哈佛商業評論電子報 送當期雜誌!
歡迎訂閱【哈佛商業評論電子報】,與世界一流的管理接軌!現在訂閱還有機會獲得當期雜誌一份,快來訂閱,GO!


本電子報著作權均屬「聯合線上公司」或授權「聯合線上公司」使用之合法權利人所有,
禁止未經授權轉載或節錄。若對電子報內容有任何疑問或要求轉載授權,請【
聯絡我們】。
免費電子報 | 隨身行電子報 | 著作權聲明 | 隱私權聲明 | 聯絡我們
udnfamily : news | video | money | stars | paper | reading | mobile | data | city | blog | job