文件編碼組織 文件編碼交換格式指引 選錄版
TEI Lite: An Introduction to Text Encoding for Interchange
3. TEI文件的結構
所有遵循TEI的文件都包含(a)TEI標頭(以元素<TEI標頭>(<teiHeader>)標誌者)與(b)文本的正文轉錄(以元素<文件>(<text>)標誌)。
TEI標頭部分提供相當於印刷出版品題名頁中所提供的資訊。最多包含四個部分:機讀文本的書目描述、編碼方式的敘述、文本的非書目性敘述(文本背景資訊)、以及修訂史。標頭部分更進一步的敘述詳「20. 電子題名頁」。
TEI文件可以件(單一作品),或合集(多件單一作品的集合,如選集)為單位。不論何種狀況,可能出現正文前資訊或正文後資訊。兩者之間為正文,在合集中,或可以由群組組成,每一個群中可包含更多的群組或文本。
以件為單位的作品,編碼的整體的結構如下:
<TEI.2> <TEI標頭>〔標頭部分資訊〕</TEI標頭> <文本> <正文前資訊>〔正文前資訊〕</正文前資訊> <正文>〔正文〕</正文> <正文後資訊>〔正文後資訊〕</正文後資訊> </文本> </TEI.2>
合集可能也有合集的正文前後的資訊,中間會出現一或多個個文本群組,每一個獨立,但可能也各自擁有正文前後資訊。合集編碼使用的整體的結構如下:
<TEI.2> <TEI標頭>〔合集的標題部分資訊〕</TEI標頭> <文本> <正文前資訊>〔合集的正文前資訊〕</正文前資訊> <群組> <文本> <正文前資訊>〔第一份文件的正文前資訊〕</正文前資訊> <正文>〔第一份文件的正文〕</正文> <正文後資訊>〔第一份文件的正文後資訊〕</正文後資訊> </文本> <文本> <正文前資訊>〔第二份文件的正文前資訊〕</正文前資訊> <正文>〔第二份文件的正文〕</正文> <正文後資訊>〔第二份文件的正文後資訊〕</正文後資訊> </文本> 〔更多的文件群組? f </群組> <正文後資訊>〔合集的正文後資訊〕</正文後資訊> </文本> </TEI.2>
也可把TEI文件做成合集,每一份文件都有自己獨立的標頭。這種合集稱為TEI文集,文集本身也有標頭:
<TEI文集> <TEI標頭>〔集合的標題部分資訊〕</TEI標頭> <TEI.2> <TEI標頭>〔第一份TEI文件的標頭部分〕</TEI標頭> <文本>〔集合中的第一份TEI文件〕</文本> </TEI.2> <TEI.2> <TEI標頭>〔第二份TEI文件的標頭部分〕</TEI標頭> <文本>〔集合中的第二份TEI文件〕</文本> </TEI.2> </TEI文集>
但是,不能以TEI文集再建以一個合集──也就是說,不能將多個元素<TEI文集>(<teiCorpus>)合併視為單一物件。這是TEI指引現行版本中的限制。
在後續的章節中,主要是討論簡單的文本結構。每一種狀況由幾個相關的TEI元素與簡短的定義構成,其後是專屬於該元素的屬性定義。大體而言,都會附帶簡短的範例。
譯自TEI官方網站的TEI Lite網頁:http://www.tei-c.org/Lite/
網頁內容未經任何校訂,恐有疏漏,請勿任意轉載引用
若有任何疏漏及錯誤之處,歡迎來信指正:sofia@gate.sinica.edu.tw