漢文電子佛典製作與運用之研究
──以《瑜伽師地論》為例
釋惠敏[*]、維習安、杜正民、郭麗娟、周邦信
*國立臺北藝術大學教授
中華佛學學報
第十四期(2001.09)
頁43-53
頁43
提要
本研究以《瑜伽師地論》之異譯本及其綱要書為例,規劃其電子資料之製作(create)與標誌(markup)流程。嘗試採用 TEI 的標籤集(tag sets),標誌文件(document)之(1)研究背景特色(contextual features,例如:〈monogr〉、〈series〉、〈analytic〉),(2)結構特色(structural features,例如:〈div〉),(3)非結構特色(non-structural features,例如:〈item〉)等。
其次,將以述已製作與標誌的電子資料之結構特色(structural features)作互參(cross-reference)標誌(例如:〈linkGrp〉〈link targets="A1 B1 C1"/〉〈link targets="A2 B2 C2"/〉〈/linkGrp〉,〈link targets="T1579DD065 T1581DB002 T1582DB001"/〉),並且研發界面(將 XML 經文檔藉著程式 xml2dir.bat,同時用 IE5, xml parser 和 DHTML,Javascript 呈現目錄欄。以聯結欄(link)藉著程式 html.bat 呈現對照欄),以便作異譯本之比對、綱要書之對照的運用。
關鍵詞:1. 電子佛典 2. 《瑜伽師地論》 3. SGML 4. XML 5. TEI
目次
一、研究目的 二、結果與討論 三、結語 |
頁44
一、研究目的[1]
佛學典籍是人類共有的文化寶藏,但其相關的資料浩瀚如海,令人望洋興嘆。因此,若能運用資訊科技之數位化、電子化的媒體與工具,運用「多價」(multivalent)[2] 文獻模式的特性,與標準化的標誌(markup)語言(例如:SGML、HTML、XML),[3] 有效地管理佛學資訊,進而改善其教學、研究、服務等層面,不僅是佛學界的創舉,也將是人文科學界的新潮流。
玄奘(602∼664)的傳記說明他赴印留學目的之一是學習與翻譯《瑜伽師地論》(簡稱《瑜伽論》)。它記載著瑜伽師(修行者,禪師)的修行階位與境界,也是一部大乘佛教的百科全書,它能夠呈現出心理學、哲學、宗教學等,精緻精神生活的追求者之豐富經驗。因此,本研究以《瑜伽論》為主題,其研究目的如下:
1.以《瑜伽師地論》、其綱要書及異譯本為例,研究電子佛典之輸入與缺字處理、校對、標誌、全文檢索、網路系統等製作方面的問題與解決方案。
2.以此數位化的資料為例,考察其在使用介面、研究方法、教學活動等各種應用上的可能性。
1. 本論文是行政院國科會委員會專題研究計畫(NSC 89-2411-H-119-004)成果之一。
2. 傳統的文獻與數位化文獻的差異是:前者是單塊式(monolithic),後者是多價式(multivalent)。傳統的文獻觀念,與「書」同義。書是獨立式、互不連結,查詢費時,互參也麻煩,只提供給人「讀」的功能。由於數位化文獻基本單位可以是字、筆劃、乃至圖素(pixel),所以重組、連結都很簡易快速;而且同時可提供給機器(processor)與人(human mind)「讀」的功能。因此,數位化文獻具有「多價」(multivalent)文獻模式的特性,所謂多種價值(values)、意義(meanings)、運用(appeals)。"Multivalent Documents: Anytime, Anywhere, Any Type, Every Way User-Improvable Digital Documents and Systems", Thomas A. Phelps, A dissertation for Ph. D, University of California, Berkeley (1998).
3. 1986年 SGML(Standard Generalized Markup Language,標準通用標記語言),其所用的標籤(tag)可以擴張、檢查;後來為了 World Wide Web(全球資訊網)的需求,HTML(Hyper Text Markup Language,超文件標記語言)是 SGML 的一項運用,具有指定連結、指定格式的功能。1998年,為了 Web 最佳運用,開始從 SGML 推演成 XML(Extensible Markup Language,可擴展性標記語言),它可以與 HTML 整合,以處理資料的顯示。XML 是可以與 SGML 互補,可以對 Web 上的資料作結構化與描述用,而且也可廣泛支援不同種類的應用程式。詳參 Charles Goldfarb The SGML Handbook Oxford 1990. SGML。XML(Extended Markup Language)是由 W3C(World Wide Web Consortium)所制定,XML 1.0版規格書已由 W3C 核准,可參 http://www.w3.org/XML。
頁45
二、結果與討論
(一)漢文電子佛典製作流程之實例化
以《瑜伽師地論》之異譯本及其綱要書為例,運用電子資料的特點,經過一年的實作,其製作(create)與標誌(markup)流程可依如下三個步驟進行:
1. 製作與標誌(markup)文件(document)之研究背景特色(contextual features)
以參考書目(bibliography)為例。採用 TEI 的標籤集(tag sets)標誌《瑜伽論》的各類(單一書藉〈monogr〉,論著收於叢書〈series〉,論文〈analytic〉收於期刊雜誌)參考資料,同時可聯結到解題、《瑜伽師地論》全文及工具書。如下所示:
(1)以參考書目(bibliography)為例
〈biblStruct〉 |
頁46
〈pubPlace〉台北市〈/pubPlace〉 |
(2)以解題、導讀為例
〈div1 n="1" type="entry"〉〈div2
n="1" id="jie1579DB001" type="解題之summary"〉〈head〉瑜伽師地論導讀〈/head〉 |
2. 製作與標誌文件(document)之結構特色(structural features)
將《瑜伽論》之異譯本及其綱要書的內容(content)視為條理化階層(ordered hierarchy),不只是線性的。所以,將其章節結構分為二十層,如下以〈div〉標誌,再用以 HTMLHelp 檢查。
頁47
〈div1 n="1" type="fen"〉〈head
type="added"〉1分〈/head〉 |
3. 製作與標誌文件(document)之非結構特色(non-structural features)
以《法相辭典》的詞條作為檢索《瑜伽論》之相關詞彙(proper nouns, keywords)用,以〈item〉標誌。如下所示:
〈div1 type="glossary"〉 |
頁48
(二)漢文電子佛典運用之實例:異譯本之比對、綱要書之對照
將上述已製作與標誌的電子資料作異譯本之比對、綱要書之對照的運用,可依如下二個步驟進行:
1. 依相關文件之結構特色(structural features)作互參(cross-reference)標誌
將《瑜伽師地論》(T1579)之異譯本(T1581-4)及其綱要書(T1602)的各個 div(以div1=DA、div2=DB、div3=DC、div4=DD……表示)。加上聯結 id(例如:div1=T1579DA, div2= T1579DB……),其號碼(number)可用程式依流水號碼加入。
〈div1 n="1" id="T1579DA001"
type="fen"〉〈head type="added"〉1本地分〈/head〉 〈div2 n="1" id="T1579DB001" type="di"〉〈head type="added"〉1五識身相應地〈/head〉 〈div3 n="1" id="T1579DC001" type="zhang"〉〈head type="added"〉1章 十七地總說〈/head〉 〈lb n="0279a08"/〉〈p id="T1579p0001"〉云何瑜伽師地?謂十七地。何等十七? 〈lb n="0279a09"/〉嗢&M011960;南曰:〈/p〉 〈lb n="0279a10"/〉〈lg〉〈l〉五識相應、意,〈/l〉〈l〉有尋伺等三,〈/l〉 〈lb n="0279a11"/〉〈l〉三摩地俱、非,〈/l〉〈l〉有心、無心地,〈/l〉 〈lb n="0279a12"/〉〈l〉聞、思、修、所立,〈/l〉〈l〉如是具三乘,〈/l〉 〈lb n="0279a13"/〉〈l〉有依、及無依,〈/l〉〈l〉是名十七地。〈/l〉〈/lg〉 〈lb n="0279a14"/〉〈p id="T1579p0002"〉一者、五識身相應地。二者、意地。三者、有尋有 〈lb n="0279a15"/〉伺地。四者、無尋唯伺地。五者、無尋無伺地。六 〈lb n="0279a16"/〉者、三摩呬多地。七者、非三摩呬多地。八者、有 〈lb n="0279a17"/〉心地。九者、無心地。十者、聞所成地。十一者、思 〈lb n="0279a18"/〉所成地。十二者、修所成地。十三者、聲聞地。十 〈lb n="0279a19"/〉四者、獨覺地。十五者、菩薩地。十六者、有餘依 〈lb n="0279a20"/〉地。十七者、無餘依地。如是略說十七、名為瑜 〈lb n="0279a21"/〉伽師地。〈/p〉〈/div3〉 〈div3 n="2" id="T1579DC002" type="zhang"〉〈head type="added"〉2章 五識身地總說〈/head〉 〈lb n="0279a22"/〉〈p id="T1579p0003"〉〈app n="027905"〉〈lem〉&lac;〈/lem〉〈rdg wit="【元】【明】【宮】"〉本地分中五識身相應地第一〈/rdg〉〈/app〉云何五識身相應地?謂五識身自性、彼所依、 〈lb n="0279a23"/〉彼所緣、彼助伴、彼作業、如是總名五識身相 〈lb n="0279a24"/〉應地。何等名為五識身耶?所謂眼識、耳識、 〈lb n="0279a25"/〉鼻識、舌識、身識。〈/p〉〈/div3〉 〈div3 n="3" id="T1579DC003" type="zhang"〉〈head type="added"〉3章 五識身地別釋〈/head〉 〈div4 n="1" id="T1579DD001" type="jie"〉〈head type="added"〉1節 眼識之五相〈/head〉 〈div5 n="1" id="T1579DE001" type="xiang"〉〈head type="added"〉1項 自性〈/head〉 〈p id="T1579p0004" type="inline"〉云何眼識自性?謂依眼、了別 〈lb n="0279a26"/〉色。〈/p〉〈/div5〉 |
頁49
寫聯結標誌(參考 TEI, 14.4.3:A Three-way Alignment, pp. 433):
〈linkGrp〉
〈link targets="A1 B1 C1"/〉
〈link targets="A2 B2 C2"/〉
〈/linkGrp〉
依照 id 聯結相對的異譯本及其綱要書(例如:〈link targets="T1579DD065 T1581DB002 T1582DB001"/〉)。
依照id聯結相對的經文。
〈linkGrp〉 |
2. 研發界面
將 XML 經文檔藉著程式 xml2dir.bat,同時用 IE5, xml parser 和 DHTML,Javascript 呈現目錄欄。以聯結欄(link)藉著程式 html.bat, 呈現多種異譯本之比對欄及綱要書之對照欄。
頁50
3. 電子檔上網
利用標誌完成之經文檔案,產生網路版之經文檔,上網提供大眾使用。
頁51
可作異譯本之比對、綱要書之對照的運用
三、結語
已完成製作與標誌(markup)《瑜伽論》之異譯本及其綱要書的電子資料的背景特色、結構特色、非結構特色。也以互參(cross-reference)標誌將此電子佛典運用於異譯本之比對及綱要書之對照,並研發界面,可以在網路上提供學界使用。
雖然也完成全文檢索的功能,但是尚未提供詞條檢索的功能,有待努力。
(本論文曾口頭發表於華梵大學所主辦的「覺之教育」學術論文研討會,2000年10月28日)
頁52
【參考文獻】
橫山紘一、廣澤隆之
《漢梵藏對照瑜伽師地論總索引》(東京:山喜房)1996
韓清淨科記
《瑜伽師地論科句披尋記彙編》(臺北市:新文豐出版社)1983
Wittern, Christian
"Minimal Markup and More──Some
Requirements for Public Texts", Conference talk held at the 3rd EBTI
meeting on April 7th 1996 in Taipei, Taiwan.
Barnard, David, Ron Hayter, Maria Karaba, George
Logan and John McFadden
"SGML-Based Markup for Literary Texts: Two
Problems and Some Solutions", Computers and The Humanities vol. 22, pp. 256∼276.
Calzolari, Nicola and Zampolli, Antonio
"Lexical Databases and Textual Corpora: A
Trend of Convergence between Computational Linguistics and Literary and
Linguistic Computing", in: Cole R.A., J.Mariani, H.Uszkoreit, A. Zaenen,
V.Zue (Hrsg.)Survey of the State of the Art in Human Language Technology,
Cambridge 1996.
Faure, Bernard
La volonte’ d’orthodoxie dans le bouddhisme
chinois, Paris 1998.
Giordano, Richard, Goble, Carole and Kiillgren,
Gunnel
"Problems of Multidatabase Construction
for Literary and Linguistic Research", Research in Humanities Computing
vol. 5, Oxford 1995, pp. 143∼164.
Lancashire, Ian(Ed.)
The Humanities Computing Yearbook 1989-90 A
Comprehensive Guide to Sotware and other Resources, Oxford: Clarendon Press,
1991.
Latz, Hans-Walter
Entwurf eines Modells der Verarbeitung von
SGML──Dokumenten in versionsorientierten Hypertext──Systemen Das
HyperSGMI, Konzept, Diss. Berlin 1992.
Simons, Gary F.
"Implementing the TEI’s
Feature-Structure Markup by Direct Mapping to the Objects and Attributes of an
Object──Oriented Database System", Research in Humanities Computing
vol. 5, Oxford 1995, pp. 220∼242.
Sperberg-McQueen, C. Michael and Burnard, Lou
(Eds.)
Guidelines for Electronic Text Encoding and
Interchange, Chicago and Oxford, 1994.
頁53
A Study on Creation and Application of Electronic
Chinese Buddhist
Texts: With the Yogaacaarabhuumi as a Case
Study
Hui-min Bhikkhu[*], Christian Wittern,
Aming Tu, Lijuan Guo, Ray Chou,
*Professor, Taipei National University
of the Arts
Summary
This research is an attempt to create and markup electronic data. We try to use tag sets of TEI and markup the documents (including contextual features such as <monogr>, <series>, <analytic>; structural features such as <div>, and nonstructural features such as <item>) based on the various translations and outlines of Yogaacaarabhuumi.
Second, the project described above will be cross-referenced with structural features of the electronic data, providing, for example <linkGrp><link targets="A1 B1 C1"/><link targets="A2 B2 C2"/></linkGrp>, <link targets= "T1579DD065 T1581DB002 T1582DB001"/>). Intefaces will be developed, such as using the xm12dir.bat program on Sutra XML with IE5, xml parser, and DHTML and Javascript to provide menus. The Link will provide cross references through html.bat. This will be useful for comparing different translations and outlines.
Key words: 1. Electronic Chinese Buddhist Texts 2. Yogaacaabhuumi 3. SGML
4. XML 5. TEI