古騰堡計劃
古騰堡計劃 (Project Gutenberg) | |
---|---|
建立 | 1971年12月1日 (最初文件發佈)[1] |
收藏 | |
規模 | 超過 57,000 個文件 |
其他資訊 | |
網站 | gutenberg |
古騰堡計劃(Project Gutenberg,縮寫:PG),由義工參與,致力於將文化作品數碼化和歸檔,並鼓勵創作和發行電子書。該工程於1971年開始進行,是最早的數位圖書館。計劃中大部分書籍都是公有領域書籍的原本,古騰堡計劃確保這些原本自由流通、自由檔案格式,有利於長期儲存,並可在各種電腦上閱讀。截至2018年7月,古騰堡計劃聲稱館藏已超過57,000件。
在可能的情況下,發佈的格式是純文字檔案,但也包括其他格式,如HTML、PDF、EPUB、MOBI、Plucker。大多數版本使用的語言是英語,也有許多非英語的作品,包括漢語。目前有多個相關專案,提供更多的內容,包括區域性的和特定語言的作品。古騰堡計劃也致力維繫Distributed Proofreaders一個校對掃描文字的以互聯網為基礎的社區。
歷史
[編輯]古騰堡計劃由Michael Hart(1947年-2011年)於1971年發起。當時Hart是美國伊利諾伊大學的學生,他獲得了學校材料研究實驗室中Xerox Sigma V大型電腦的使用權限。友善的操作員給了他一個幾乎沒有使用時限的帳號,帳號在當時的價值後來被估算約100,000乃至100,000,000美元。Hart說他要做一些有價值的事情,讓這份饋贈「物有所值」。
這台電腦是阿帕網(全球互聯網的鼻祖)的15個節點之一。Hart認為有朝一日大部分民眾會接觸電腦,因而他決定將書籍電子化,供人們自由閱讀。那時他背包里有一份《美國獨立宣言》,該宣言也就成了古騰堡計劃的第一份電子文字。
該計劃的命名是為了紀念約翰內斯·古騰堡,他是一位15世紀的德國印刷商,通過推廣使用活字印刷術推動了印刷機的革命。
1990年代中期,Hart在伊利諾伊本篤會學院進行該計劃,期間陸續有義工加入。在圖像掃描器和光學文字辨識軟件得到改進並在坊間廣泛使用前,大部分文字都是靠手工輸入。
Hart後來與卡尼基美隆大學達成協定,由對方管理古騰堡計劃的財務。隨着電子文字的增加,義工開始替代Hart進行日常的維護操作。
2000年,非牟利機構古騰堡計劃著作歸檔基金會(The Project Gutenberg Literary Archive Foundation Inc)在密西西比州獲准成立,以處理相關的法律事務。基金成立後,計劃捐款得到減稅。工程的長期義工Gregory Newby成為基金會的第一任行政總裁。
同年(2000年),Charles Franks啟動了分佈校對員專案,義工可以將掃描的文字通過互聯網共用發佈,大大提高了加入PG的文字數量與種類,亦有利新的義工加入。
意大利義工Pietro Di Miceli開發、管理了第一個古騰堡計劃的網站,並着手對線上工程進行編目。在他參與的10年間(1994年-2004年),網站獲得了不少獎項,常被收錄到「最佳網頁」列表,這也提高了工程的知名度。[2]
2004年開始,啟用了新的線上目錄,PG內容更容易瀏覽、取得和連結。
收錄範圍
[編輯]到2018年4月為止,古騰堡計劃已經收錄了57,000部書籍,平均每週新增50部。
其中主要是西方文化傳統中的文學作品,比如小說、詩歌、小故事、戲劇,除此之外,PG也收錄食譜、書目以及期刊。另外還包括一些非文字內容,比如音頻檔、樂譜檔案等。
收錄中主要是英文作品,但也有相當數量的德語、法語、意大利語、西班牙語、荷蘭語、芬蘭語以及中文等語言的著作。
在可能的情況下,古騰堡以純文字的格式發佈,主要使用ASCII字元集,也常被擴充為ISO-8859-1,而中文書籍幾乎全部都是以Big5(大五碼)純文字格式發佈。義工提交時也可能會採用其他格式,最常見的是HTML。雖然一些不容易編輯的格式(如PDF)並不符合古騰堡計劃的目標,但還是有志願者提交。近年來也有關於XML格式的討論,但相關進展還比較緩慢。
理想
[編輯]Michael Hart在2004年有言「古騰堡計劃的使命很簡單:『鼓勵電子書的建立與發佈。』」[3]
工程的口號是「推倒愚昧與無知的藩籬」,就像20世紀早期公共圖書館的興起,古騰堡的義工志在繼續推廣文字讀寫,從而更好地繼承文化遺產。
古騰堡計劃的運作方式不是集中式的,例如,沒有一項選擇政策來指定要添加哪部著作,義工只是針對他們感興趣的或者手頭有的著作,進行工作。
版權問題
[編輯]古騰堡計劃根據美國版權法對其電子書進行版權驗證。只有版權過期者才可以加到PG檔案中來,版權失效的記錄將儲存以備未來參考。
與其他數位圖書館的專案不同,古騰堡計劃不會在其出版物上聲明新的版權,從而鼓勵自由再加工、再發佈。
PG的大部分書籍都依照美國的版權法律,作為公有領域發佈。其中有兩種書籍,一種書籍的前段會帶有古騰堡計劃的商標,這意味着對書籍的再利用有少量的限制,限制內容寫在電子書的授權條款裏頭(例如修改後再發佈,或者商業用途)。而如果電子書的前段沒有使用商標,作為公有領域的書籍就可以不受限地再利用。
古騰堡計劃也發佈了一些受版權保護的書籍,根據版權所有者的說明,就有進一步的限制。
1998年的美國參議員桑尼·波諾提出並被投票通過的版權年限延長法案,將現存的版權延長了20年。這導致本來在美國將變成公有領域的許多書古騰堡計劃將無法添加。
批評
[編輯]古騰堡計劃的書籍被指學術上不夠嚴格,比如,缺少版本使用詳情介紹,缺少最初版的封面,缺少校訂工具。通過比較新舊版本,可以看到新版的電子書已經有較大改進。大部分新版的電子書都保留了版本資訊以及封面。
姊妹專案
[編輯]古騰堡計劃的所有姊妹專案都是獨立的組織,但具有同樣的理念,並獲准使用古騰堡計劃的商標。它們一般專注於某些族群或語種。
- Project Gutenberg Australia (頁面存檔備份,存於互聯網檔案館) 收錄了許多根據澳洲版權法律屬於公有領域,但在美國仍然版權受限(或者無法確定),特別關注澳洲作家以及關於澳洲的書籍。
- PG-EU (頁面存檔備份,存於互聯網檔案館) 根據的是歐盟的版權法律。它的一個目標是將儘量多的語言套件括進來。採用Unicode以確保所有文字都可以正確顯示。
- Project Gutenberg of the Philippines 針對菲律賓及其語言。
- Project Gutenberg Europe 由Project Rastko維護,位於塞爾維亞-黑山。2005年啟動,使用分佈校對員軟件,以加速電子文字的製作。
- Project Gutenberg Luxembourg(頁面存檔備份,存於互聯網檔案館) 主要發佈盧森堡語的著作
- Project Gutenberg Consortia Center(頁面存檔備份,存於互聯網檔案館),格式不那麼嚴格一致,按主題收錄、包括多種語言是其特色。
- Projekti Lönnrot(頁面存檔備份,存於互聯網檔案館) 由芬蘭的古騰堡義工啟動。
儘管Projekt Gutenberg-DE數年前被獲准使用古騰堡的名稱,但由於其理念不同,所以並不是每個人都將其看作古騰堡的姊妹站。Projekt Gutenberg-DE對其產品設定版權,並將其文字限制為可瀏覽的網頁版。
也有一些受古騰堡計劃啟發而創立的專案,詳情可參見數位圖書館專案列表。
參考文獻
[編輯]- ^ Jefferson, Thomas. The Declaration of Independence of the United States of America. 1971-12-01 [2021-08-27]. (原始內容存檔於2022-02-15).
- ^ Gutenberg:Credits. Project Gutenberg. 2006-06-08 [2021-08-27]. (原始內容存檔於2007-07-11).
- ^ Hart, Michael S. Gutenberg Mission Statement by Michael Hart. Project Gutenberg. 2004-10-23 [2021-08-27]. (原始內容存檔於2007-07-14).