Wednesday, January 03, 2007

摘錄》Google建史上最大圖書館

在數十幢散布全球各地的建築物中,數千名工作人員拿起紙本書籍,一本一本送進掃瞄器,將紙張與油墨化為電子檔案,再送上網際網路。他們正在進行一場偉大的工程:建立人類有史以來最龐大的一座圖書館。

這座「普世圖書館」(Universal Library)是人類兩千多年來的夢想,要將古今中外所有的知識與創造成果匯聚一堂,讓每個人都可以登堂入室。這樣的夢想原本看似高不可攀,但是二○○ 四年十二月,網際網路搜尋引擎鉅擘「Google」為夢想注入一股強勁的動力,宣布與五家大型圖書館合作,將其館藏書籍掃瞄為電子檔案,供全球無數人搜尋檢索(http://books.google.com)。

文字、影音圖像等 全數蒐羅

檔案學家卡赫爾指出:「我們以今日的科技就可以做到,不必寄望明日。我們將為全世界的人們提供全人類的作品,這是一樁永垂不朽的盛事,足以和人類登陸月球媲美。」而且數位科技不僅能夠營造這座史無前例的圖書館,也將徹底改變書籍創作與出版的模式,影響無比深遠。

這座圖書館確實浩瀚如海、包羅萬象。除了做為鎮館之寶的書籍之外,它還要蒐羅歷來出版的報紙、雜誌、期刊。圖畫、相片、影片、音樂同樣彌足珍貴,再加上廣播與電視節目。

網際網路的內容也不可或缺,數以十億計的網頁將一一收錄。換言之,人類自有歷史以來的所有創造成果,都將在這座普世圖書館佔有一席之地。

專家估計,從兩河流域文明發展至今日,人類至少「出版」三千兩百萬種書籍、七億五千萬篇文字作品、兩千五百萬首歌曲、五億幀圖像、五十萬部電影、三百萬部影片(包含電視節目與短片),及一千億幅網頁。

以現行科技數位化加以壓縮後,檔案體積約五萬兆位元組(50PB),全部以電腦硬碟儲存,足以塞滿一間小鎮圖書館;不過隨著科技日新月異,未來小小一方如「iPod」隨身裝置,就可蒐羅無遺。

與圖像影音資料相比,書籍因為獨具必須翻頁閱讀的實體限制,數位化的腳步反而最為緩慢。今日出版的音樂作品幾乎全都是數位格式,歷來五十萬部電影已有十分之一化為DVD;相較之下,書籍數位化的比例頂多只達到五%。換句話說,在這座普世圖書館中,書籍實在不多。

所幸全球各地的圖書館與電子書業者正急起直追,每年掃瞄約一百萬種書籍。網路書店「亞馬遜」已有數十萬冊的成績。史丹福大學圖書館坐擁八百萬冊書籍,正運用一種最先進的自動翻頁掃瞄機,以每小時一千頁的速度量產電子書。

書具翻頁實體限制 數位化慢

中國大陸在這個領域也是一日千里。北京的「超星數字圖書網」(http://www.ssreader.com)與中國大陸九百多家大學合作,掃瞄其館藏圖書,至今已完成一百卅萬種,約佔一九四九年中共建政以後出版書籍的半數。而且「超星」掃瞄書籍的成本只有史丹福大學的三分之一。

專家估計,全球各地圖書館的藏書之中,約一五%已經沒有版權,有版權且繼續印行者僅佔一○%,另外七五%則因種種原因而妾身未明,形同孤兒。

以美國的情形而論,根據國會一九九八年通過的法案,這類書籍最快要等到二○一九年,才會完全脫離版權保護並進入公有領域,它們是目前圖書數位化工程最大的黑洞。

Google以三種方式來處理上述三類書籍:無版權書籍掃瞄後全部上網,公之於世;有版權且繼續印行者,由出版公司決定如何讓網友搜尋閱覽;第三類妾身未明的「孤兒書籍」最為棘手,Google會先公布一小部分,但任何人只要能證明自己擁有版權,就可以要求Google移除已上網發布的內容。

作家出版業 可化危機為轉機

Google策略看似八面玲瓏,但仍引發出版業與作家團體的強烈質疑與批判,認定Google處理第三類書籍的作法是公然侵犯版權,雙方已展開一場法律訴訟戰。這場大戰除反映雙方在版權觀念上的差異,也代表兩種商業經營模式的衝突。

長久以來,創作者與出版業的謀生之道,就是以低廉成本來大量複製原作的「拷貝」,並依賴法律遏阻偽造與盜版行為,保護自身利益。過去一個世紀,這種模式讓無數人能夠以創作為生,為人類文化史寫下燦爛的一頁。

然而數位科技降臨之後,舊有模式也岌岌可危。拷貝不再是價格低廉,而是完全免費,並且四處流動,無遠弗屆。儘管書籍影音出版業者想出各種克制之道,畢竟道高一尺、魔高一丈,這股趨勢沛然莫之能禦。

但這並不意謂創作者與出版業已經走入無利可圖的死胡同。在拷貝泛濫成災、價值落空的今日,有心人還是可以另闢蹊徑,乘著數位化與網際網路的潮流,深入開發自家作品在其他層面的價值。

網路搜尋技術能夠讓一部作品產生無數的連結,作品不同之間的互動更是充滿無限的可能。創作者與其冀望繼續以販賣拷貝維持生計,不如轉而嘗試藉由演出、對談、現身說法、附加資訊、廣告、贊助、訂閱等等無法複製的方式,開發出新的文化產業經營模式。

全球最大網路搜尋引擎公司Google計畫推出的圖書館典藏數位化計畫(Google Book Search),被喻為自十五世紀古騰堡印刷機問世以來對出版業最大的變革,但卻招致出版業者質疑侵犯版權,因而被迫暫時停工。

Google的這項計畫於去年十一月啟動,預計投入兩億美元,花費十年時間,將美國哈佛大學、史丹福大學、密西根大學、紐約公共圖書館及英國牛津大學共一千五百多萬冊圖書掃描入電腦,以建立全球最大的網上虛擬圖書館。

Google說,這項計畫的目標是要讓人人都可上網搜尋全世界圖書內容,尤其是一些絕版書和珍本書。而眼見Google搶先一步佔領數位圖書市場,與Google競爭日趨白熱化的雅虎和微軟也隨即宣布跟進。

不過,Google的網路圖書館計畫啟動之初就遭到廣泛質疑,在美國、德國及法國都有出版商控告其侵害版權。Google為了舒緩這種疑慮,已在今年五月決定將掃描有版權圖書工作暫停六個月,直到今年十一月,以便出版商告知Google哪些圖書不應被列入圖書掃描計畫中。

Google表示,在圖書館典藏數位化工程中,對於仍受版權保護的書籍,搜尋者將僅能瀏覽編目及幾段內容摘要。只有牛津大學與紐約公共圖書館館藏的版權已過期老書,會被掃瞄到Google Book Search搜書系統中。但美國出版商協會認為Google這麼做還不夠,對Google的網路圖書館計畫仍存有「嚴重疑慮」。

Google聲稱推動這一計畫的動機純屬利他,藉以實現該公司兩位創辦人的長期夢想。Google創辦人布林與佩吉在學生時代就致力於圖書館數位化工程。

法國方面也有人反對Google的這項計畫,如法國國家圖書館館長、知名歷史學家讓內依即警告說,Google對圖書的選擇,可能會偏重英國和盎格魯薩克遜民族的觀點,不但有可能對法語造成威脅,甚至會使其他歐洲的學術和傳統邊緣化。為求平衡,法國及其他一些歐洲國家前不久即促使歐洲聯盟支持一項掃瞄非英語圖書的計畫。

新力閱讀器 電子書的iPod

閻紀宇

不過這種態勢即將改變,消費性電子產品巨擘新力公司十月一日推出最新一代電子書閱讀裝置「新力閱讀器」(Sony Reader),售價三百五十美元(約合新台幣一萬一千六百元),業界視其為「電子書的iPod」,並寄予高度期望。

在電腦與網際網路的數位化世界中,音樂有iPod,視訊有YouTube;相較之下,書籍多少有點像個孤兒。電子書的發展雖然由來已久,但是接受程度仍遠遜於紙本書籍。

不過這種態勢即將改變,消費性電子產品巨擘新力公司十月一日推出最新一代電子書閱讀裝置「新力閱讀器」(Sony Reader)(見右圖,路透),售價三百五十美元(約合新台幣一萬一千六百元),業界視其為「電子書的iPod」,並寄予高度期望。

專屬電子書網站「Connect」(http://ebooks.connect.com)已同步上線,與企鵝、賽門舒斯特、哈潑柯林斯等六大出版集團合作,初期提供一萬多冊電子書,供新力閱讀器使用者付費下載。一冊《達文西密碼》五.五九美元(新台幣一百八十五元),相當於紙本書打七折。當紅電影「穿著 PRADA的惡魔」原著小說也只要七.九六美元,比紙本書打六折還便宜。

新力閱讀器小巧玲瓏,長寬各為十八公分與十二公分,厚度一.四公分,六吋黑白螢幕,重約兩百五十公克。它的記憶體雖只有六十四MB,但足以容納八十本到一百本電子書,如果還想擴充藏書,可以外插一般的SD記憶卡或者新力公司的Memory Stick。

除了BBeb Book格式的電子書之外,新力閱讀器另支援常見的DOC與PDF檔文件、JPEG檔圖片,還可以播放MP3或有聲書,下載瀏覽部落格與RSS新聞,未來也考慮開放使用者瀏覽網路報章雜誌。

新力閱讀器乍看之下有如一具PDA,其實兩者迥然不同,它的顯示器不是背光液晶螢幕,而是最新式的「電子紙顯示器」以及電子墨水。正因如此,新力閱讀器幾乎沒有視覺死角,而且非常省電,內建鋰電池充電四個小時之後,可以連續閱讀七千五百頁。缺點則是:自身不會發光,所以需要外界光源。

業界專家指出,新力閱讀器的基本架構是讓讀者從第一頁讀到最後一頁,因此前後翻閱或查找資料就不甚方便,既不能指定頁碼直接跳越,也無法輸入關鍵字搜尋,同時也沒有註記的功能。相較之下,紙本書籍仍然有其難以取代的優點。新力公司北美副總裁霍金斯也說:「新力閱讀器並不想取代紙本書籍,而是要作為一種輔助裝置,讓人們可以隨身攜帶一座圖書館。」