| 聯合電子報代理發行 |
![]() |
|
![]() |
![]() |
|
|
2002/11/15 第 105 期 |
★直接訂閱 |
| ˙本次主題:我國現代文學史料數位化典藏與服務 ˙重要公告:91年海華獎優良華語文教學軟體選拔初審入選 ˙國學入門:吳稚暉的科學人生觀、一馬當先、非同小可的艷遇 ˙下回主題:吞吐之間,蓄意無窮--留白的表達策略 |
||||
|
|
||||
| 我國現代文學史料數位化典藏與服務 |
|
傳統中國文學電子報第一三九期2002/11/15 壹、前言 臺灣地區現代文學發展歷程坎坷,一般說來,打從日據時代開始,臺灣新文學已經開始萌芽,此一時期代表作家有賴和、吳濁流、蔡秋桐、王白淵、謝春木、楊守愚、楊逵、楊華、楊雲萍、吳新榮、王詩琅、郭水潭、楊熾昌、張文環、龍瑛宗、巫永福、呂赫若、林芳年、鍾理和、吳瀛濤、王昶雄等人,其作品無論是漢詩、白話詩、民謠、散文、小說等,往往傳達著濃厚的殖民文化,從宿命、鄉愁、悲情的鄉土情感到抵抗、挑戰等嚴肅主題,象徵著臺灣人精神苦悶的年代。 臺灣光復後,國民政府接收臺灣,臺灣人民正準備回歸戰後安定的日子,孰料國語的強制推行及二二八事件的歷史悲劇,使得臺灣文學遭逢斷層的不幸,例如呂赫若、張文環、楊逵、王白淵等人,分別遭到程度不一的政治迫害,有些作家因此封筆退隱,文學作品銳減〈註一〉。此後臺灣地區文學發展主流以外省籍作家為主,例如散文家琦君、王鼎鈞、夏元瑜、林海音等,約至1970年代本省籍作家對國語的文字處理較為成熟,逐漸進入所謂「鄉土文學」時期,此一時期文學作家不分省籍,偏好描述周遭的生活環境與景物,或為市井,或為鄉村,或為社會,就地取材,關懷各階層生活百態。 到了1980年代以後,臺灣本土文學再興,新的台灣現實意識也開始萌芽,潛伏的本土論者在有利的客觀環境中,開始探出再出發的腳步。80年代,台灣社會的歷史主體意識普遍覺醒,台灣人又開始在台灣座標尋求台灣的出路,本土論因此受到重視而得到普遍的認同。〈註二〉從上述臺灣現代文學的發展歷程,不難想像此一時期之文學史料不容易徵集與典藏,一方面是殖民時代距今年代久遠,資料典藏條件較差,且出版品目錄不完整,文學史料徵集實難齊全,另一方面由於政治主權轉換,有些文學家擔心政治迫害,不輕易發表作品,因此有部分作品僅剩孤本手稿,其保存條件與環境令人憂心,最後往往僅能從其遺稿中找到若干創作,而文學家家屬如果不知如何保存這些珍貴文學史料,最後恐也流落廢紙廠或垃圾堆中,殊為可惜,因此早期臺灣現代文學史料之庋藏,除了倚重文學家家屬外,圖書館及文學社團的參與典藏,也是非常重要的一環。 由此可知早期臺灣現代文學史料的徵集與典藏都不容易,更遑論其閱覽服務,因為讀者不知道有那些史料可以參考,也不知道典藏於何處,常需耗費時間,奔波於各大圖書館或文學相關資料室,因此政府刻正進行的「臺灣地區地方文獻典藏數位化」計畫是非常有意義的工作,如能儘早完成,對於各領域研究者,助益匪淺。 本文作者依其在文學史料領域多年來之實務工作,淺談臺灣地區文學史料數位化經驗,先從文學史料數位化之定義說起,再敘述文學史料之發展背景,進而簡述文學史料數位化之特徵及數位化典藏服務與數位化規劃要點,最後再論及文學史料數位化發展現況與未來趨勢,尚祈各界不吝指正。 貳、文學史料數位化的定義 「文學」一詞根據《正中形音義綜合大辭典》一書所載:「近世所謂文學,有廣狹二義:廣義泛指一切思想之表現,而以文字記述之者;狹義則專指偏重想像及感情之藝術作品,如詩歌、小說、戲劇等屬之,亦稱純文學。 「史料」一詞在前書中則定義如下:「研究或編纂歷史的材料,有實務、紙面、口傳三種。」另在《中文大辭典》一書,則解釋為「史材也,歷史之參考資料也」。 「數位化」一詞在《英漢計算機百科辭典》一書之解釋如下:「將物理變數的類比量度轉換為數字值,而以數位形式改變該量。簡單的說,通信系統中的數位化通常是指將語言或圖形信號變為二進碼。實際上任何形式的資料在計算機能接受它們之前都要被數位化〈註三〉」 ;另在陳俞妏在其文章中將數位化一詞解釋為「將文字或圖像經由數位掃描器、數位照相機的轉換,而成為電腦所能處理的數位數據〈註四〉。」 綜合上述定義,「文學史料數位化」應該可以解釋為「泛指將一切文學活動的紀錄以電腦格式儲存,包括文學創作、評論、人物傳記、圖片、手稿、聲音、視訊等各類型媒體予以數位化,然後可以再經由電腦介面將上述文件或資料以其原貌呈現。」 參、文學史料數位化的歷史背景 文學史料數位化的歷史比起其他領域科學似乎稍微落後一些,這是可以輕易理解的,因為資訊科技發展之初,原來是以軍事用途為導向,後來才逐漸使用於科學、商業與教育等領域,但這並不減損文學史料之重要性,在網際網路蓬勃發展10年後的今日,學術界有一個共識,那就是”Contents”的充實才是全球各學科領域目標一致的方向。「資料內容(Contents)」將是未來網路持續發展的主要條件,那些內容貧瘠、資料不完整、不具權威性、專業性,或無特色的網站,將很難在下一個世代存活於學術網站領域之中。 文學史料數位化的歷史首推美國現代語文學會(Modern Language Association,簡稱MLA)的摘要系統,這個已經有40年歷史的資料庫,收錄1963起,有關文學、語言及語言學、民俗學等學術領域之期刊、叢刊、專書、論文、會議論文集及書目等,編製成索引摘要資料庫(MLA International Bibliography),以供蒐尋相關資料來源,是研究西方語言、文學不可或缺的重要參考工具,也是語言文學領域最權威的資料庫,唯至今尚未推出全文連結服務。
圖一:美國現代語文學會(MLA)首頁(http://www.mla.org) 「古騰堡計畫」(Project Gutenberg)是美國伊利諾大學於1971年開始進行,將屬於公共版權的文學資料如「愛麗斯夢遊仙境」、「莎士比亞全集」、「羅傑辭典」等全文輸入電腦,供網路上讀者閱讀。這是文學史料數位化的重要里程碑,目前全球有好幾個網站免費提供該計畫建置的數位化書籍之下載服務。
圖二:古騰堡計畫首頁(http://promo.net/pg/) Contemporary Authors 是另一個著名的作家作品與人物評介工具書,也有超過50年的編纂歷史,是該領域重要之參考書。原本是以印刷式書本發行,目前是改以光碟版發行,收錄1960至1996年間約10萬位當代作家資料,包括小說家、詩人、劇作家、報界人士及非小說類文學作家。 DiscLit 系列光碟,則包括American Author、British Author、World Author等文學系列叢書共約500冊之全文資料,是研究美國文學、英國文學及世界文學之入門參考書。 Essay and General Literature Index 收錄美國、英國及加拿大地區所出版發表的英文論文及文章,重點強調在人文及社會科學。所包括的主題有:經濟、政治、歷史、戲劇、電影、文學作品的評論等。每年約收錄 300 冊書籍及 20 多種年刊及期刊中的文章。 文學類資料在我國圖書資訊界的數位化歷史,似乎略佔優勢,以國家圖書館為例,文學史料是館內第一個數位化成功的領域,其原因有四:一則原先收錄之資料已具備數位化之基礎,因為該館曾於民國74年5月辦過一次「當代文學史料展」;二則它的學術領域範圍較明確,資料蒐集時較易掌握;再則國家圖書館擬先小規模試作數位化工程,以汲取、累積經驗,再擴大範圍至資料龐雜的期刊報紙、學位論文、善本古籍等類別資料;最後,也是最重要之因素,則是該館正好搭上「六年國建」專案計畫列車,獲得行政院的專款經費補助,使得該計畫得以順利推展成功。國家圖書館於民國83年順利推出「當代文學史料影像全文系統」,確實具有先導性及指標性之重大意義,該系統收錄五十年來臺灣地區當代文學作家約兩千餘位之基本資料及其生平傳記、手稿、照片、著作年表、作品目錄、評論文獻、翻譯文獻、名句及歷屆文學獎得獎紀錄,每年平均有20萬人次上網使用該資料庫,頗受文學界人士喜好,是國內文學網站之重鎮,對文學研究學者及熱愛文學之民眾,提供便利之檢索功〈註五〉。
圖三:當代文學史料影像全文系統首頁(http://lit.ncl.edu.tw) 中央研究院自1984年起開始建置「漢籍全文資料庫」,至1998年止先後完成「二十五史」、「十三經」、「諸子」、「古籍十八種」、「古籍三十四種」、「大正新脩大藏經」等文獻之數位化工作,超過兩千萬字的臺灣史料、一千萬字的大正藏以及其他典籍,合計字數一億三千四百萬字,並以每年至少一千萬字的速率,持續成長,是當今國內最具規模的中文古籍資料庫〈註六〉。 元智大學的「網路展書讀」是以古典文學多媒體服務為目標之網站,1993年起即開始中國古籍數位化的研發工作,目前已完成中國古籍數位研究系統包含:《詩經》、《全唐詩》、《宋詩》、《唐宋詞》、《紅樓夢》等,累計達一千五百萬字。已完成的網路教學系統包含:倚聲填詞格律自動檢測索引教學系統、依韻入詩格律自動檢測索引教學系統、唐詩三百首、網路對聯習作系統等。該網站在網際網路崛起之初即推出,又能持續建置與推廣,因此獲得不少嘉評,並對往後文學網站製作者具有催化作用〈註七〉。 「四庫全書電子版」是兩岸三地合作開發之電子資料庫,收錄文淵閣四庫全書共3480種典籍,36,000冊圖書,470萬頁影像,8億漢字之中華文化巨著,四庫全書電子版以Unicode內碼儲存資料,並補充自建造字檔,方便處理與顯示中文罕用字,而其全文檢索功能更讓研究人員津津樂道,除了可節省時間之外,更不會遺漏任何一則相關訊息,也不必再像從前,往往為了某一句話或某一特定主題,翻遍了整部四庫全書,還不一定找得到資料。電子版四庫全書之售價又比原書便宜,並可節省圖書館書架空間,是學術圖書館數位化的重要資源。 「康熙字典」光碟是根據「同文書局」出版的石印版《康熙字典》為底本製作而成,共收錄47,035字,分為214個部首,內容極為豐富,但其編輯體例對於今日之一般讀者查詢使用卻顯得有點不便,其電子版採用先進的電腦檢索技術彌補此一不足,提供單字、部首、筆畫、筆順、注音、拼音等多元化的檢索欄位查詢,讓讀者能夠輕鬆使用此一漢學研究中重要的工具書典籍,還可透過『瀏覽原書』的功能,直接翻閱《康熙字典》的原文圖像。 「故宮【寒泉】古典文獻全文檢索資料庫」,由陳郁夫教授製作,將多年來自行開發之古籍文獻,免費提供學界使用,目前已完成十三經、先秦諸子、全唐詩、宋元學案、明儒學案、朱子語類、資治通鑑、廿五史等古典文籍,刻正進行古今圖書集成數位化工程〈註八〉。 「傳記文學」光碟收錄該雜誌第1期至第433期(1962.6-1998.6)間整本雜誌全文內容,共15,000篇文章,一億餘字數,錄製於10張光碟資料中。內容包括自傳、評傳、年譜、回憶錄、名人日記、重要手蹟、珍貴史料、史事研究等傳記文學與民國史料,提供各篇文章的日期、期號、標題、副標題、作者、專欄、人物、機關團體等項目的查詢,使用者可透過全文檢索軟體,針對任一欄位、跨欄位或所有檢索項目,輸入任意字詞進行查找,即可查獲相關書目資料並同時瀏覽內文影像。 「文訊雜誌紀念光碟」收錄該雜誌第1期至200期(1983.07-2002.6)之間所有雜誌的全文內容,製作於DVD光碟片之中,共約三千萬字,六千餘幅圖,提供雜誌篇目、專題、作者、被評論者、專欄、卷期的瀏覽與全文檢索功能,預計於2002年底發行。
圖四:文訊雜誌光碟版畫面(圖片由文訊雜誌社提供) 大陸地區由政府部門建置的現代文學網站尚未多見,但是民間網站卻有不少全文型文學網站,例如木子書屋(http://library.muzi.com/)、天一書樓(http://www.cnool.net/tianyige/)、網絡圖書(http://www.gotobook.net/)、亦凡公益圖書館(http://www.shuku.net/)等,都可在這些網站上輕易取得部分文學作品的全文內容,唯這些網站是否已取得文字著作權上網之授權,似乎還有待確認。例如有些網站將臺灣地區作家之作品,如瓊瑤的《庭院深深》、龍應台的《野火集》、三毛的《撒哈拉的故事》、李敖的《北京法源寺》等作品,毫無保留的公開於網路上,雖然方便網友與讀者利用,但仍應尊重智慧財產權。這些網站大都小規模經營,既無網站設立或服務宗旨,又無網站負責機構,且非正統資料庫管理架構,較難期望網站經營的長遠性。唯有半官方「超星數字圖書館」(http://www.ssreader.com)才是有計畫有規模的經營各學科史料數位化工程,這網站是由中國國家圖書館與北京世紀超星有限公司合辦,目前已有近十餘萬冊圖書上網,全部可以在線上瀏覽(需加入會員),號稱是大陸地區目前最大的網上圖書館。收錄的學科領域涵蓋哲學、宗教;法律、政治、軍事、經濟、教育、體育等社會學科;數學、物理、化學、天文、生物等自然科學;建築、資訊、電機等應用科學;世界史地;文學藝術等。目前的服務方式是採會員制,會員需先購買一定金額之「讀書卡」,待閱讀書刊時,系統會自動扣除儲值點數,非會員只能預覽數位化書刊之部分影像資料,約10來頁。
圖五:超星數字圖書館首頁(http://www.ssreader.com) 香港地區的文學資料庫,則以香港中文大學之「香港文學資料庫」為代表,該資料庫收錄之資料以香港地區發表之現代文學創作或評論著述為主,資料收錄時間可追溯自1930年代,部分資料提供全文閱讀服務,但僅限於校園內使用,是研究香港文學作家的重要資源〈註九〉。
圖六:香港文學資料庫(http://hklitpub.lib.cuhk.edu.hk) 肆、文學史料數位化的特徵 當我們欲討論文學史料數位化的特徵時,應先明瞭傳統圖書報刊之典藏與服務困難: 一、分類編目耗費人力; 接著我們再進一步分析文學史料數位化有哪些特徵?是否可以解決傳統圖書館的服務限制: 一、數位化典藏服務軟硬體投資成本極高:毫無疑問的數位典藏投入之人力與經費,是相當可觀的。 伍、文學史料數位化的規劃 當吾人開發一套文學史料數位化系統前,必須先思考下列課題: 一、該文學史料有無數位化的必要? 在評估以上課題後,如果答案是肯定的,則可再進一步規劃下列需求:人力需求、技術需求、資金需求。 一、在人力需求方面:數位化過程必定會增加人力成本,包括人員培訓、系統觀摩、規格書制訂、軟硬體採購發包、書目資料建檔、影像資料掃瞄、影音資料建置、系統測試等。這是維持一個系統運作的必要人力需求,如果機構內尚無建置數位典藏的經驗,應儘早進行人才培訓,才能應付系統建置所需之專業知識。儘量避免以”急就章”或”撿現成品”方式規劃人力,以免將來系統完成後,還需面對現實的考驗,萬一人力資源無法掌控整個系統時,狀況輕者,會造成系統停頓,嚴重者,恐怕還需重新設計或調整作業,徒然浪費寶貴的時間與經費。文學史料數位化的人力基本需求有三種,第一要有文學素養者,第二要有資訊素養者,第三要有行政能力者,前兩者負責規劃文學專屬系統,後者爭取預算與行政作業,三者缺一不可,相互支援與合作,才有可能在競爭的環境中順利完成任務。 二、在技術需求方面: 甲.軟硬體規劃:在技術需求方面,首先需規劃軟硬體相關設備,在硬體方面,需先計算文件數位化所需之儲存空間及使用人次,才能規劃主機等級及硬碟儲存空間大小,自大型主機到小型伺服器皆無不可,端看資料的重要性與使用率。系統軟體方面,如採用套裝軟體,價位較低,建置時程較短,唯系統功能一般僅能符合基本需求;或考慮開發專屬軟體,費用通常較高,開發時程較長,但較能符合建置單位之功能需求。另外還需依據作業平台,搭配資料庫管理系統(Database management system, DBMS),大型主機大都採用Oracle、Informix、Sybase等資料庫管理系統,小型主機可使用SQL或MYSQL等,前者價位較高,後者價位較低,有些還是免費使用。 丙.數位化格式〈註十〉: 數位化典藏內容規格大致需考量下面四種資料格式 :
經由上述之分析比較,可知資料內容如不涉及全文檢索時,採影像掃瞄方式儲存資料較節省時間、人力與經費,例如國家圖書館之「當代文學史料影像全文系統」、「中華民國期刊論文索引」及「傳記文學」光碟資料庫即採此一模式建檔;而當文件內容需要做提供檢索之功能時,唯有採用純文字格式建檔方能解決,例如中央研究院之「二十五史資料庫」、香港迪志文化公司之「四庫全書電子版」之文字建檔格式。 2.圖像資料(Pictorial Materials) 目前在國內外,對於文件的保存方式,大都參酌美國國會圖書館的作法,將一份圖像同時儲存成三種格式: 3.聲音資料(Sound recordings) 4.視訊資料(Audio-Video Materials) 三、在資金需求方面:建置一套數位化系統,除了上述人力需求與技術需求外,經費的來源也是非常重要的,這三者其實缺一不可。資金方面的取得,以政府單位為例,大多經過需先提出計畫書,再透過預算之編列、審查與核定後,才能正式執行計畫,這中間約需兩年以上的作業程序,等到系統正式上線完成後,應該才是困難的開始,這時候如何再去申請經費,維持系統正常運作,也是一門學問,或可考慮再以相同名義申請第二期發展計畫,但得看上級單位支不支持該項計畫,否則就只有想辦法自籌經費,勉力維持系統運作。這也就是我們在網路上經常看到一些網站,網頁內容無法定期更新的主要原因。其他可以考慮的運作方式,譬如以產品發行來自籌經費、尋找廠商合作建置、委託開發、尋求金主(基金會)、商品化行銷等方式皆可,端看其數位化產品有無市場經濟價值,例如故宮博物院的文物複製品與光碟產品,在市場上反應較熱烈,就不難尋求合作開發的對象,而文學史料就沒有這麼樂觀了,除了金庸的小說,或少數熱門作品外,一般都很難有創收,筆者日前在一家量販店無意中發現整套文學電視劇「人間四月天」10卷錄影帶,只賣199元(原價2990元),心中感觸良多,文學工作者的酬勞,應該是不大穩定的。 陸、文學史料數位化的服務 文學史料數位化服務是未來全球資訊服務的一環,它可以結合電子商務,也可以是圖書館館內服務的延伸,也可能轉型為個人化圖書館型態,也可能結合PDA或手機業者的加值服務。 我們先從傳統的圖書館服務說起,以前在圖書館尚未收藏數位化資料前,讀者必須先到圖書館,利用各種目錄索引來尋找資料的出處,來後再到書架上找尋書刊,然後才能將資料複印,以便研讀。例如我們如果要找尋有關作家「林海音」的相關報導與作品評論,在還書目索引還沒有自動化之前,必須很辛苦的找尋各月份的文學雜誌與各報紙副刊及圖書目錄,才能尋獲部分資料,不但沒有效率,資料蒐集也不完備。現在我們只要在電腦前面鍵入「林海音」三個字,就可以快速的尋獲資料,甚至可以馬上閱讀雜誌或報紙上的內容,只要該份文件已數位化掃瞄或建檔。 目前從事文學研究者在蒐集資料時,應該可參酌下列步驟取得目錄或全文資料: 一、文學圖書:可使用「當代文學史料影像全文系統」、「國家圖書館館藏目錄系統」、「全國圖書目錄系統」,大部分的國內文學圖書,應該都會收錄在這三個系統內。 柒、文學史料數位化技術與服務的困難 文學史料數位化是一個頗具挑戰性的工作,它將面臨許多困難等待資訊技術去克服,且數位化服務觀念也是不斷地改進,因而服務人員必須自我提昇,才能應付資訊時代的潮流,底下分別簡述數位化工作可能需要面臨的困難: 一、作業平台:作業平台的選擇是一項困難的決定,因為大多數的文史資料工作者,並不清楚Unix、Linux、NT的優缺點,以及各家資料庫管理系統的差異性,在選擇作業平台時容易受到軟硬體廠商的左右,或者遷就預算多寡。基本上Unix與Linux作業系統相似,Linux使用在中小型主機較多;NT作業系統操作介面與Windows98較雷同,管理介面較親切,操作上較熟悉,軟體工程師比較容易尋獲,軟體開發費用相對較低。在資料儲存的安全上,Unix 、Linux及NT作業系統可以使用磁碟陣列,保護資料的安全,當有一顆硬碟故障時,可以在不關機的狀態下,更換硬碟。在使用層面上,Unix及Linux的主機比較能容許較多瞬間上網人潮,NT作業系統則對於使用人次有較多的限制。但無論如何,建議資料庫主機置放於機構之網路防火牆內,網頁服務主機則置於防火牆之外,較能保護主機的安全。 二、字碼問題:目前國內的網路使用者,其電腦大都使用BIG5碼,只能處理13,461個中文字,再加上預留的造字區,頂多只能增加到19782個中文字,因此肯定無法滿足文字工作者的用字需求,單就文學家的名字當中就有許多BIG碼無法顯示的字,如 ?弦、?涵等,而文學史料經常需要處理日文或韓文的文獻,這時候如果主機內碼是BIG5碼者,就無法存入日韓文字,讀者的電腦自然無法顯示這些字碼,字碼不足問題一直困擾圖書資訊界,國內圖書館界自動化系統大都使用CCCII碼為內碼,可以處理53,940個字,雖然大部分的中文字都可輸入,並解決日韓文資料的建檔,但一般的使用者是以BIG5碼電腦連結圖書館自動化系統,因此也無法顯示畫面上的這些字。使用「國家中文標準交換碼(CNS11642)」,可以處理48,027個漢字,雖然已能處理大多數中文字,唯一遺憾的是一般讀者使用的電腦,並無該內碼,必須自行政院主計處電子處理資料中心下載「CNS11643中文標準交換碼全字庫」,才能使用或顯示該字集,目前這個字集使用較多單位的是戶政機關。近來資訊界比較推薦使用Unicode當內碼,它是一個國際標準碼,可以容納70,000字以上的漢字,並且可以處理多國語文,且在國際上已經普遍使用,因此讀者端的電腦只要使用Windows 2000以上作業系統(部分Windows 98作業系統也可使用),其電腦就可以輸入並顯示中文簡繁體字與日韓文字,雖然有些讀者的電腦不能鍵入BIG5碼以外的字,但是能接收主機端傳來的Unicode字碼,至少已能解決BIG5碼無法顯示中文字的問題。國內主要的入口網站或新聞網站如「PC Home」或「東森新聞網」等,已採用這種模式服務網友,只要在自己的電腦輸入「游錫」兩個字就可以找到行政院長的資料,這時如果網頁如能正確顯示顯示「游錫?」三個字者,大致上可以肯定該服務主機是採用Unicode內碼。 三、同義字:當我們在網路上查詢資料時,如果系統主機沒有建置同義字對照表時,使用者將會有些資料無法查到,例如「台與臺」、「豐與丰」、「莊與庄」等,最常見的例子是當我們鍵入「臺灣」一詞查詢時,有些系統查不到以「台灣」著錄的資料,因此如果系統能自動處理同義字,對於一般使用者將有其便利性。 四、參照詞:參照詞表是針對自己開發的資料庫,建置一個可以相互指引的對照詞,例如將「愛滋病」、「愛死病」、「後天免疫不全症後群」、「AIDS」設定為參照詞時,則不論讀者輸入那一個詞彙,系統都會去查詢所有的相關詞彙,這樣才能節省讀者之時間,又不會遺漏資料,但是系統維護人員經常必須維護這個參照詞庫,才能順利達成服務讀者的美意。 五、權威記錄:權威記錄檔是通常是使用在圖書館的圖書自動化系統,它可以針對個人作者、團體作者、題名、標題等款目進行權威控制,舉作家「小野」為例,所有他發表的作品,不論是用筆名「天牛」、「湯新」或者本名「李遠」等,都可以透過權威記錄的控制,將其所有的作品一次檢索出來,雖然讀者或許不知道「小野」還有其他的筆名,但是系統可以透過權威記錄檔,提供較完整的檢索服務,讓讀者可以查獲這位作家的全部作品。再舉一個團體作者的例子,例如「行政院文化建設委員會」「文化建設委員會」、「文建會」、甚至於將來如改制為「文化部」,都是指同一個單位,如果資料在建置時已經將其權威記錄關係著錄,則日後查詢資料時不但可將這一單位不同時期的資料一起檢索出來,而且日後果真升格為「文化部」時,也不需要逐筆去修改原先已建檔的資料。 六、著作權:數位文件著作權的問題,可能比其他資訊技術更難克服,尤其目前國內並無文字仲介團體可以負責著作權授權與著作權費用分配事宜,因此大多數的數位資料只能在圖書館內提供讀者服務,無法公開於網路上,讓所有的民眾使用。這一兩年開始,出版社或雜誌社才開始注意著作權的問題,有許多雜誌在邀稿時就聲明,該文件投稿後的著作權屬雜誌社或出版社,或者要求作者同意讓該文件公開網站上,於是網路上的電子書及電子雜誌如雨後春筍般的大量出現,至於較早期的出版品,即便是原是發行單位,也無法任意將書刊內容公開於網路上,這些早期的書刊,如果無法直接在網路取得,將使電子化服務的成效打折,因此盼望文字仲介團體能早日成立,才能解決授權問題,而將數位化文獻提供於網路上,當然屆時將會是有償的資訊服務。 七、電子媒體保存:由於資訊技術發展速度超乎想像,資料設備與儲存媒體都有一定之壽命,舉例來說早期的5又1/4軟式磁碟片,現在幾乎已經無法使用了,而當初如果有重要的資料存放在磁片上,應該儘早複製於新的媒體,如CD-ROM或DVD上;再者一般大型主機大概的壽命大概不會超過10年,個人電腦的壽命約5年,CD-ROM光碟片得壽命大約只有10年,不管是主機的更換或是儲存媒體的轉載,都是非常耗費人力的,尤其是主機的更換成本更高,如果主機的作業系統或中文內碼必須更換,更需耗費人力撰寫程式進行資料的轉出與轉入。前面提到資料備份的異地典藏觀念,也是近年來資訊界較認真去執行的觀念,以前各機構資訊單位通常將備份資料存放於機房或資訊室,但這種作法不一定保險,萬一遇上水災、地震、火災或其他意外時,這些主要資料與備份資料統統毀於一旦時,試想不知該如何補救,如果這些資料與民眾的權益有關,該機構將不容易善了,且不知要虛耗多少人力、經費與時間,才能將資料重建起來,因此各機構應該要有電子媒體長久典藏的正確觀念。 以上僅列舉一些數位化時可能遭遇的困難,供同道參考,唯資訊技術發展迅速,說不定在未來三、五年內,這些障礙都已經排除,屆時從事文學史料數位化者可以更安心的使用數位化系統。 捌、文學史料數位化的現況與發展趨勢 文學史料數位化在國內的發展,主要還是依賴政府的大力推動,例如國家圖書館建置之「當代文學史料影像全文系統」,以及文建會積極推動的「全國文化資料庫」,這些計畫都將會建置可觀的數位典藏成果,前者以優勢的圖書、期刊、報紙典藏品,將文學資料加以分析整理、掃瞄建檔,對每一位作家皆用同樣的尺度,竭盡所能的蒐集資料,那怕是小眾作家的相關資料,依然受到的公平待遇,是國內最具有代表性的文學史料網站之一。目前國家圖書館正進行作家資料調查,希望作家們協助該館就已建檔之資料,進行資料審查與增補工作,以強化該資料庫的時效性、正確性與完整性,讓全民分享文學殿堂豐碩的果實。 後者正積極建置各類型地方文獻數位化工程,並統籌為「全國文化資料庫」建置計畫〈註十一〉 ,正式以國家級的數位典藏計畫,保存地方文獻與語文,各相關機構對於地方文獻蒐藏的資料類型,以照片最為普遍,其次分別為口述歷史、文物、方志、族譜、歌謠/諺語、私文書、報告書、詩文、公文書、碑碣、繪畫、見聞、海報傳單、書簡、戲劇、戰記、競選資料、日記、訃文、備忘錄等。「全國文化資料庫」開始執行之後,除將繼續民國88年的建置「地方文獻數位化計畫」的藏品,並闊增其藏品內容,所包括的資料類型有:音樂資料、美術資料、戲劇資料、舞蹈資料、傳統藝術資料、文學資料、電影資料、建築資料等八大類。其原始資料的來源有兩種:一為已經由中央與地方文化機關/單位收藏的公藏文化資料,二為尚藏於民間的文化資料。待「全國文化資料庫」逐年將各地方之文獻與文物建置後,文學工作者將有機會接近珍貴或未曾公開的文學史料。 至於「文建會」直屬機構「國立台灣文學館」,雖仍在籌備階段(預計民國92年中開館),但也積極扮演文學史料數位化工程,如《台灣文學年表》、《台灣文學作家作品集資料庫(作家全集)》、《台灣文學辭典》之編纂計畫,都在規劃建置當中,假以時日,必定有可觀的成果。 作家本人或其家屬在文學史料數位化領域的貢獻,也是不容忽視的角色,作家個人網站上可以提供不少文學相關資源,如向陽、張曼娟、金庸、吳淡如、彭懷真、廖玉蕙、琦君等之網站,相信未來還有更多的作家投入個人網站的建置,讓讀者有機會在網路上親近作家。 民間文學雜誌業者雖然在不景氣的經濟環境下,慘澹經營,但多少都有一份傻勁與執著,只要稍有財源,會毫不猶豫的投入數位化工程,如文訊雜誌、聯合文學、橄欖樹文學月刊等雜誌。 文學相關基金會與社團在文學史料數位化這個領域,也可以扮演重要的角色與影響力,例如「國家文化藝術基金會」、「蔣經國文化基金會」、「賴和基金會」等都長期支持文學相關活動,希望這些基金會能持續贊助文學相關活動。 文學圖書業者:電子書的發展為雜誌出版業帶來一些生機,雖然國內網路行銷市場還有許多拓展空間,但總是一個契機,若非網路購物行為糾紛多,其實網路書店的確實有發展的機會。 網路文學的品質雖然還需加強,卻提供一個業餘文學創作者發表作品的園地,並開放網友討論網站上的作品,這是傳統文學出版品無法做到的,因此有人將這種文學稱為「網路新文體」,這是由於網路的特質而衍生的新文學品種,不管作者文學素養深度或文筆洗鍊程度如何,它已經在網路上開創一片新天地,其中並不乏水平以上的作品,這種依賴網路生態的文學活動,將有繼續擴大的現象。 著作權是網路發展最大的障礙,也是文學傳播媒介最大的致命傷,但著作權卻同時保障文學創作者的權益,它像是一把刀子的兩刃,是一體的兩面,當我們保護著作權人的時候,同時也限制了知識的傳播。我們一方面要鼓勵文字工作者從事文學創作,並保障其智慧財產權,以獲取基本的酬勞,另一方面又為了要傳播知識,希望能將文學書刊,免費開放於網路上,供眾閱覽,這真是兩難。將來或許可以採行較折衷的方式,例如由文字仲介團體在網路上代為收取使用費,再將其收益分配給作者或出版社,就能突破現有的限制,大大方方的在網路上,提供文學書刊的內容。 文學網路未來的服務趨勢應該是朝個人化、多元化、資源分享與付費制等方向演進。個人化網頁服務指的是個別化網頁設計,這個理念是為了讓每一位網路使用者,進到該網站後,感受到個別性、獨特性,網站設計者特別營造一個個人專屬服務之畫面,每一個會員或使用者,可以依照自己的喜好,設定畫面內容、偏好的主題、或設定直接進入指定的網頁,而系統主機也會主動與該使用者打招呼,例如多久沒有拜訪本網站或主動發E-Mail提供該使用者偏好之訊息。在電子商務網站上的個人化網頁服務,更會紀錄會員的消費偏好、消費能力等訊息,提供網站經營者寶貴的網路行銷的資訊,目前國內文學網站上尚未提供個人化服務,或許再過三、五年,讀者可以自行設定網站服務偏好,譬如有些讀者只偏愛新詩,系統就可以設計成每當該讀者上網時,就將畫面指定到新詩網頁或某一位詩人的網頁,享受到VIP的服務。 網路服務多元化指的是大眾網站與小眾網站都有其生存的空間,各自建置文學相關資源,各自服務不同類型之讀者,使文學網站多采多姿,造福廣大的網友。 資源分享是網路資源提供者最期盼的合作模式,只要大家都使用Metadata格式建檔,有朝一日,讀者可以在甲網站可以檢索到乙網站及丙網站的資源。 「知識是無價的」,未來的文學網路服務,可能有部分文學資源是需要付費的,才能在網路上取得,為了讓文字工作者獲得基本酬勞,支付必要的著作權使用費,是可以接受的。當然讀者可以自行選擇網路上其他無償的資源或接受有償的資源。 玖、結語〈註十二〉 網路世界的最大特點就是”變”,每天都在改變,一切都在改變,誰也無法留住它,掌握它,唯有親近它、與它妥協或和平共存,才不會違背時代的潮流。 文學史料工作者通常對於資訊科技較為疏遠,這多少會影響數位化的推動腳步與發展成果,其實科技與人文是可以相處融洽的,雖然資訊科技可能帶來社會的失序、犯罪的溫床、價值觀的改變、倫理的喪失,但同時也帶動終身學習、遠距教學、知識普及、資源共享的優點,這道理與「水火」是人類的生存的必要物質,卻也是最大的災難來源相同,唯有善盡科技的優點,改善人類的生活品質,才是雙贏之道。 梁實秋先生曾說過:「文學發於心性、基於人性,亦止於人性。」 ,何懷碩先生也說過:「我們在文學藝術中看到人生的處境、人生的命運--看到我們自己,這就是共鳴。」 ,可知文學是生活中不可或缺的一部份,作為文學工作者當善盡一己之力,致力於文學史料保存工作,才能讓後代子孫瞭解先民的文化活動與心路歷程。目前在各界的努力下,國內文學史料的數位化工作,雖然有一些小小的成果,但距離虛擬網路文學圖書館的境界,還有一些障礙要克服,且讓政府與民間通力合作,為國內文學活動注入新生命。 附註: [1] 佩謙,<淺談臺灣新文學>,《傳統中國文學電子報》,第十九期,民國88年9月5日(http://cyberfair.taiwanschoolnet.org/c00/21200085/w4.htm) 【參考書目】 王梅玲,<數位館藏管理與館藏發展政策>,《中國圖書館學會館藏發展理論與實務專題研習班研習手冊》,臺北市:中國圖書館學會,民國91年,頁17-55。 撰文者:莊建國先生〈國家圖書館〉 |
|
|
||
| 91年海華獎優良華語文教學軟體選拔初審入選 | ||
|
本站榮獲財團法人中華民國電腦技能基金會「僑務委員會九十一年海華獎優良華語文教學軟體選拔」推薦參選,並通過海華獎評選小組網頁組初審入選,雖然於複選中落選,但仍為本站於中國文學的努力,寫下肯定的里程碑。 另外,遙光最近收到幾封關於「國旗等不等於國家認同」的正反辯駁意見,想為這個議題提出不同的思考。 據說,當初國父革命成功之後,在選國旗的時候,青天白日滿地紅國旗遭到很多人的反對,但一向講求民主的國父,在這一點上,怎麼樣也不肯放棄堅持。有人問國父說:「你不是一向講求民主嗎?為什麼在這件事情上如此的獨裁?」國父拿出真正沾滿陸皓東鮮血的國旗,含著眼淚說:「我不是真的想要這麼獨裁,只是每當我想到當初陸皓東為了建立這個國家所犧牲的生命,以及那麼多革命志士為了這面國旗所流的鮮血,我就忍不住哽咽,深怕辜負他們一縷忠魂以生命相誓的寄託。……」 是的。國旗只是一個圖騰,但重點是它是我們國家民族精神的象徵,不管是哪一個地方的人,只要青天白日滿地紅一天是我們的國旗,我們就一天不能摧毀這無數生命換來的信仰。軍中有「青天白日」徽可以避邪的說法,這難道不是無數精魂以堅定的信仰加諸青天白日圖騰的結果?唾棄了這面圖騰,不僅摧毀自己的信仰,也摧毀自己的依憑與護身符,這樣的人要如何接續民族承先啟後的大義?我含著眼淚,惋惜著前不見精魂的悠悠,也嗟嘆著後不見來者的泣淚。 |
| 吳稚暉的科學人生觀、一馬當先、非同小可的艷遇 |
| 您可知道吳稚暉的科學人生觀是吃飯、生小孩、招呼朋友?一馬當先的典故從何而來?而宋朝大文人宋祈,是怎麼樣避過一場殺頭罪而得到艷獄?要是您有興趣,請前往國學入門一觀。 |
| 我國現代文學史料數位化典藏與服務 |
|
所謂「留白」,是一種「由於感情複雜,一時說不清楚,或是說清楚了反倒不如不說清楚的好,而有意留下空白,讓接受者盡情發揮想像力和理解力加以填補」,從而獲致表意婉轉含蓄、耐人尋味效果的語言表達策略。下一回,我們將要請復旦大學中文系吳禮權教授,從司馬遷《史記•高祖本紀》中的一段記載,來為我們進行解析。
傳統中國文學網站:http://www.literature.idv.tw |
|
徵稿啟事:http://www.literature.idv.tw/news/n-b.htm |
||
|
本報著作權屬「聯合電子報或授權聯合電子報使用之合法權利人所有」 |
| |
個人辦報
| 兒童島
| 隨身行電子報
| 著作權聲明
| 隱私權聲明
| 聯絡我們 |