世界電子佛教集市
(台灣)杜正民編/于光整理
世界宗教文化
第二期(2000)
頁12-15
頁12
1993年4月在美國柏克萊大學蘭卡斯特教授 (Dr.Lancaster) 家中首次舉辦佛教電子會議。加州柏克萊大學、柏克萊佛學研究中心、東京立正大學、台北法光佛教文化研究所、京都花園大學國際禪學研究所、韓國海印寺、漢城大學、馬來西亞佛道修行者共同体等單位的16位學者專家參加了會議。代表們經過一周的討論后.決定成立電子佛典推進協議會 ((The Electronic Buddhist Text Initiative,簡稱 EBTI ),選舉蘭卡斯特為會長,阿部博士 (Dr.App) 為主任。
EBTI 以推行各種文字的佛教藏經電子化為目的,達到佛典保存、研究、傳播的作用,以資料分享、跨語言平台為推展項目,達到合作、分享、標准化的宗旨,進行國際間“學術單位”与“宗教團体”電子化的“推廣”与“協調”工作,不定期在世界各地舉辦研討會与展示活動。
1994 年在韓國海印寺及漢城東國大學舉行第二屆會議,15 個團体 90位代表与會。會議議題是:一、“禪知識”;二、云南文獻計划;三、泰國巴利藏計划;四、“中研院”文獻標記工作;五、斯里蘭卡巴利藏計划;六、佛光山辭典及藏經輸入計划;七、藏文藏經輸入計划;八、韓國海印寺高麗藏輸入計划。
1996 年在台北佛光山舉辦第三屆會議,26 個團体參加。主要議題有:一.電子辭典類計划;二、圖書館資源与服務;三、网路資源;四、佛教經典資料庫;五、教學与研究;六、編碼与標記。
1997 年在日本京都大谷大學舉辦第四屆會議,15 個國家共 162 位代表出席。主題為標記与編碼專題討論;
文獻編碼協定專題討論;經典輸入計划;電子辭典類;藝術、考古与多媒体;网路資源与進行中的計划。
1999 年第五屆會議在台北舉行,17 個國家 300 多位學者与會,150 名參會者發表論文或展示成果。主題為圖書館資訊交流、网際网路之策略、電子佛典制作、地理資訊系統、數字典藏/博物館、遠距教學、超資料文件、語言學.知識產權.數字資源開發等。
EBTI 設雙主席,目前除由韓國海印寺宗林法師擔任外,另一位置還空缺。
EBTI 最大的特點在于:它是一次各國電子佛教成果的展示會議,參會代表攜來自己的成果,与其它國家的代表探討不斷碰到的新問題,制定統一的技術標准。當前國際佛教電子化的成果非常多,而且正在不斷吸引著更多的組織和個人參与。
頁13
宗教与网絡
十余年來漢文佛典電子化技術,日本學者已用錄像的方式作了完整的總結。基于漢字字義、字形開展史的語源學理論,資料庫和新的 Unicode 標准等,以及中日韓碼、標記与內碼之間的轉換,有關文獻標記的編碼,如何能利用電子檔,同時顯示手稿原件.又能為熟練的學者解讀此文件的結构等問題不可忽視,企盼將來能在网站上提供一個以 Unicode、SGML 与 TEI 所制成的佛學綜合网路資料庫。由專家制作的“中日韓佛學經典資料庫”,以《高麗藏》為例,提供可以用“全文”或依朝代、譯者等各種“分類”法,作為查詢資料的方案。日本大谷藏文計划与苹果電腦合作開發的一套語言工具,已經做成佛教經文目錄,可用苹果電腦的資料庫程式作檢索,其功有:(1) 可以轉換藏文与羅馬轉寫字。(2) 檢索与文獻比對工具。(3) 有分類功能的苹果 4D資料庫。目前正在進行的“梵文佛學電子辭典”的輸入工作,尤其關注其他辭典所沒有出現的字.其成果將會以 CD 的形式出版。正在研究開發的“梵文多國語言辭典”的資料庫.將用梵文、藏文、漢文与韓文對照,完成后將以网絡的形式展現。由日本全國各大學組成的佛典輸入團体,目前正在建立“大正新修大藏經原典”資料庫,采用 XML 處理文獻与缺字的技術.計划將 JIS code 改為 Unicode,目前錄入大約 70 种電子出版物,總字數超過 600 万字,其中有 15,00O 字無法以 JIS 輸入,有 1,300 字無法以 Unicode 輸入。缺字部分擬以“今昔文字鏡”所提供的 8 万多字的网上免費下載的字型來處理。此外,日本神道辭典含有很多書目及日英的多媒体附件等.其中一個重要的功能是歷史年表。同時附有“干支歷法工具 ”,可以轉換為中國以60年為一循環的傳統甲子年表。
美國專家就有關標記語言、TEI 及 SGML 語言等問題,以及研究、教學.傳播、保存或其他功能,每一种不同的格式或內碼可能使得對經典的闡述產生不同的看法.推荐以 TEI 的標題作為轉換印刷書籍的標題頁,或進一步標示經典的基本結构.并將之應用于經典的參考.例如各經文可以与其他的注疏作校勘,進而解釋如何從相關文獻,區別普通名詞与專業用語的好處,自動或半自動處理文獻特征与標記.甚至只要提出其他詳細的資訊.也可以全部自動工作。從一參考點連至另一參考點的超鏈結,重新整理各描述語的組合及各語言的分析与綜合等功能。例如資料庫收錄超過 5,000 個圖檔,則可考慮采用具有最高解析度(1,800dpi)自動功能的高速掃描器,以提高質量。
韓國已經做出高麗藏 CD 盤。高麗藏電子版應用了 KTCS 碼,采用的基本技術是 “4 Byte Code System ”,即將一個 4 Bytes Code 分成兩個 Word,一個 Word。有兩個 Bytes。高位 word 根据 Unicode 作為基本 Code,低位 word 代表擴充 Code,以特殊的編碼來提升檢索效率.并作為与其他編碼系統的轉換碼。韓國与印度合作,己經輸入明細的資料,配有多功能的檢索軟件,可以用頁碼顯現及檢索梵文轉寫字。資料庫包含了約 12000頁的資料及可轉換成天城体的讀經器、最后以 CD 的形式發行.并且正在嘗試轉成网絡版顯示。美國与韓國合作,將元曉法師的全部著作英譯.預計 2000年1月出版,并發行 CD-ROM 版本,電子版的資料則包含中文、英譯及其他傳記資料。韓國東國大學擬將《韓國佛教全書》与高麗藏翻譯本兩項總計 15万頁的資料電子化.預計 2006 年于网上公開。
中國大陸從 1986年就開始成立“漢文佛教藏經”的單位.到目前已經完成的有106卷。現正在進行 :(1)建立一個与“觀音” 有關的多媒体的文字、文物、圖像等資料庫;(2)建置一個佛教文化的資料庫,有繪畫、手稿与儀軌等。已完成,12万張的圖片。(3)輸入明版的大藏經.包括圖表与索引等,并開始根据不同朝代輸入不同的佛教文獻建立詞匯庫等工作。台灣內觀研究學院完成的部分經文已經制成光碟,而且可以使用緬甸語.梵語天城体、羅馬拼音三种語言閱讀,并可以用關鍵詞查詢、簡單的文件閱覽及同時檢索三种語言的搜尋引擎。目前這項輸入工作仍在進行中。佛光大辭典是目前中日韓佛教辭典中詞匯最多的辭典,有快速的檢索引擎,并可以在畫面上同時進行閱讀与中文 big-5 碼的編輯。台灣大學佛學研究中心資料庫有達 9万多筆佛學研究資料 ,該网站包含有佛教經典、佛教文獻及大量的佛學書目、网路教學、台灣佛教新聞等項目.以及可以發音的“梵文教學”等网絡教學系統。中華電子佛典協會(簡稱 CBETA)正在進行大正藏電子化工程,完全采用 TEI 規則,以 SGML/XMl 進行標記工作,對將來電子佛典文獻的呈現与使用,
頁14
有較好的效果。中華佛學研究所將 GIS 系統應用在佛學研究上,不但可以建立歷年來的佛教史料与地理資料.還可以鏈結中華電子佛典協會處理過的標記經文.建立完整的各种時空的佛教情況如各寺院史料的研究,佛教歷史的發展 歷代高僧大德的研究等等.從時間与空間配合語言文獻的研究,建立新的架构。厚觀法師与廣淨法師制作了“印順法師佛學著作集”電子版。張景全的《金剛經》光碟不僅有文字的處理.還可以与各种功能的鏈接,如電子字典的查閱,梵唄等功能的運用。此外還有台灣大學佛學研究中与中華佛學研究所正在做大型“佛學資料庫”的建构、台灣大學楊惠南教授擬從事“台灣佛教史料電子化”、“CBETA電子佛典”學術版的開發等。
用掃描的方式保存泰國手抄貝葉經的工程已經完工,目前正試圖將它們轉換成資料庫的形式。制作的泰文版巴利大藏經,有新的檢索引擎和良好的界面.經文可以用五种不同的語言呈現.將來還要做成不同語言的藏經版本及超鏈結等,并附有圖像与語文同時呈現的功能。對老撾正在毀坏的彿典,現正以影像的方式保存.轉為電子化形式的課題,已經提上日程。到目前為止,藏文藏經的輸入至少已有 10 万頁的輸入量,而且還在不斷增加中。俄羅斯專家已把圣彼得堡的目錄建置于光碟中。他們的目標是把所有藏文的經論數字化.并且找出其目錄及館藏位置,提供給學界使用。他們已完成了一個較好用的界面,配有檢索的功能。藏文佛教字典、藏文佛學電子工具書、東亞佛教名相辭典等已有很好的應用工具出來。
蒙古對圖書館保存的亞洲最多的藏文、蒙文及布里雅特(Buryat) 文的木刻及手抄稿,試圖用現代蒙古語傳譯。這些文獻有很多在近几十年來已經開始遺失,有必要進行搶救。大英博物館的敦煌學電子庫用圖像的方式保存 12 世紀前的手稿与圖片。絲路團体的文化地圖制作,分為文獻与考古兩大部分進行,運用查詢工具,可以清楚找到建筑物,同時在地圖上有很多的超鏈結,能提供更多的資訊。為學生設計 3D 的全景照片光碟,除提供了美好的寺廟照片外,還融入了自然景觀与庭院設計。1994 到 1996 年,尼泊爾學者一共拍攝了 33300 多張照片和錄相帶,他們都是加德滿都山谷尼瓦爾人的資料,保存了本土的一些宗教儀式.過去沒有人嘗試系統地整理這些文獻。
目前國際佛典文獻電子化由基本解決方案的標記編碼及文獻編碼協定開始著手,到漢、梵、巴、藏、蒙、越南等各种經典文字的佛典輸入与佛學工具的電子辭典類,進而到与佛學相關的藝術、考古与多媒体等電子化事業.加上目前正流行的网絡資源,為數字化的工作提供了方便的新工具。不同經典文字跨平台、查閱單种語言的經文、同時對照其他經典文字的時代,指日可待。解決佛典電子化所遇到的困難,固然方法很多。其中以“標准化標記語言”和“文獻編碼協定”為較好方案,因為它們提供了一個很好的數字語言環境、有效的輸入、儲存以及可藉由不同平台分享資料等优點。因此,TEI 与 SGML 為人文學科提供了良好的工具.這些都是 EBTI 多數會員的著眼點。此外,网上呈現圖像的一些技術問題及解決的方法,大部分高解析度的影相需要20MB 到 150MB,因此用壓縮的方式儲存与展示.這些也是要想辦法解決的問題。与本文有關的比較重要的佛教電子网址有:
ijnet.or.jp/iriz/irizhtml/irizhome.htm 日本花園大學電子達摩
iis.sinica.edu.tw/~hsieh/ “漢字字庫”(包含中、日、韓字碼)
gwdg.de/~cwitter/Welcome.html 中、日、韓佛教經典資料庫
members.iworld.net/hederein./indexeng.html 高麗藏圖文資料庫
mahidol.ac.th/hudsir 泰國巴利藏
tibet.dk/dkhp/page2.htm 尼泊爾藏文佛典与辭典的鏈結与查閱等
ccbs.ntu.edu.tw/news/e-events.htm# 蒙古蒙藏文佛典
human.toyogakuen-u.ac.jp/~acmuller/index.html 中日韓佛教經典電子參考工具的應用
bl.uk/collections/oriental/dunhuang.html
kaladarshan.arts.ohiostate.edu/Default.html 國際敦煌計划
ccbs.ntu.edu.tw 佛學网絡資料檢索与网絡資源
orient.ru 俄羅斯電子佛學研究