文件編碼組織 後設資料標誌集 選錄版
TEI Lite
3. TEI文件的結構
所有符合TEI標準的文件,都包含(A)一個TEI標頭部分(以元素<TEI標頭>(<teiHeader>)標誌)與(B)文件正文轉錄部分(以元素<文件>(<text>)標誌)。
TEI標頭部分提供相當於印刷文件題名頁所提供的資訊。最多可包含四個部分:機讀書目的敘述文字、文件編碼敘述的方式、文件的非書目性敘述(文件背景資訊)、以及修訂歷史。標頭部分更進一步的敘述詳見「20. 電子題名頁」。
TEI文件可以件為單位(單一作品),也可以合作成集(多件單一作品的合集,類似選集)。不論哪一種,正文都可能出現正文前資訊或正文後資訊,在合作成集的文件中,或可以由群組組成,以包含多個群組或是文件。
以件為單位的作品,編碼的整體的結構如下:
<TEI.2> <teiHeader>〔標頭部分資訊〕 </teiHeader> <text> <front>〔正文前資訊〕</front> <body>〔正文〕</body> <back>〔正文後資訊〕</back> </text> </TEI.2>
合作成集的文件可能會有正文前後的資訊。但是,每一個文件可能會各自擁有正文前後資訊,這些資訊會夾在一或多個文件群組中出現。則合集的文件編碼整體的結構如下:
<TEI.2> <teiHeader>〔合集的標題部分資訊〕</teiHeader> <text> <front>〔合集的正文前資訊〕</front> <group> <text> <front>〔第一份文件的正文前資訊〕</front> <body>〔第一份文件的正文〕</body> <back>〔第一份文件的正文後資訊〕</back> </text> <text> <front>〔第二份文件的正文前資訊〕</front> <body>〔第二份文件的正文〕</body> <back>〔第二份文件的正文後資訊〕</back> </text>〔更多的文件群組〕 </group> <back>〔合集的正文後資訊〕</back> </text> </TEI.2>
也可把各自擁自己的標頭部分的TEI文件做成合集。這種合集稱為一個TEI集合,集合也有集合的標頭部分:
<teiCorpus> <teiHeader> [header information for the corpus]</teiHeader> <TEI.2> <teiHeader>[header information for first text]</teiHeader> <text> [first text in corpus] </text> </TEI.2> <TEI.2> <teiHeader>[header information for second text]</teiHeader> <text> [second text in corpus] </text> </TEI.2> </teiCorpus>
但是,不能以TEI集合再建以一個合集──也就是說,不能將多個元素<TEI集合>(<teiCorpus>)合在一起,當作一個單一物件。這是目前TEI指引的限制。
本文件後續的章節,主要在討論簡單的文件結構。每一種結構由幾個相關的TEI元素與其簡短的定義構成,並說明元素所使用到的任何特定屬性的定義。大多數的章節都包含一則小範例。
譯自TEI官方網站的TEI Lite網頁:http://www.tei-c.org/Lite/
網頁內容未經任何校訂,恐有疏漏,請勿任意轉載引用
若有任何疏漏及錯誤之處,歡迎來信指正:sofia@gate.sinica.edu.tw