TEI Lite 中文譯稿

文件編碼組織 後設資料標誌集 選錄版
TEI Lite


3. TEI文件的結構

所有符合TEI標準的文件,都包含(A)一個TEI標頭部分(以元素<TEI標頭>(<teiHeader>)標誌)與(B)文件正文轉錄部分(以元素<文件>(<text>)標誌)。

TEI標頭部分提供相當於印刷文件題名頁所提供的資訊。最多可包含四個部分:機讀書目的敘述文字、文件編碼敘述的方式、文件的非書目性敘述(文件背景資訊)、以及修訂歷史。標頭部分更進一步的敘述詳見「20. 電子題名頁」

TEI文件可以件為單位(單一作品),也可以合作成集(多件單一作品的合集,類似選集)。不論哪一種,正文都可能出現正文前資訊或正文後資訊,在合作成集的文件中,或可以由群組組成,以包含多個群組或是文件。

以件為單位的作品,編碼的整體的結構如下:

<TEI.2> 
  <teiHeader>〔標頭部分資訊〕 </teiHeader> 
  <text> 
    <front>〔正文前資訊〕</front> 
    <body>〔正文〕</body> 
    <back>〔正文後資訊〕</back> 
  </text>
</TEI.2>

合作成集的文件可能會有正文前後的資訊。但是,每一個文件可能會各自擁有正文前後資訊,這些資訊會夾在一或多個文件群組中出現。則合集的文件編碼整體的結構如下:

<TEI.2> 
  <teiHeader>〔合集的標題部分資訊〕</teiHeader>
    <text> 
      <front>〔合集的正文前資訊〕</front> 
      <group> 
        <text> 
          <front>〔第一份文件的正文前資訊〕</front>
          <body>〔第一份文件的正文〕</body> 
          <back>〔第一份文件的正文後資訊〕</back> 
        </text> 
        <text> 
          <front>〔第二份文件的正文前資訊〕</front> 
          <body>〔第二份文件的正文〕</body> 
          <back>〔第二份文件的正文後資訊〕</back> 
        </text>〔更多的文件群組〕 </group> 
      <back>〔合集的正文後資訊〕</back> 
    </text>
</TEI.2>

也可把各自擁自己的標頭部分的TEI文件做成合集。這種合集稱為一個TEI集合,集合也有集合的標頭部分:

<teiCorpus>
  <teiHeader> [header information for the corpus]</teiHeader>
  <TEI.2>
    <teiHeader>[header information for first text]</teiHeader>
    <text> [first text in corpus] </text>
  </TEI.2>
  <TEI.2>
    <teiHeader>[header information for second text]</teiHeader>
    <text> [second text in corpus] </text>
  </TEI.2>
</teiCorpus>

但是,不能以TEI集合再建以一個合集──也就是說,不能將多個元素<TEI集合>(<teiCorpus>)合在一起,當作一個單一物件。這是目前TEI指引的限制。

本文件後續的章節,主要在討論簡單的文件結構。每一種結構由幾個相關的TEI元素與其簡短的定義構成,並說明元素所使用到的任何特定屬性的定義。大多數的章節都包含一則小範例。

上一章 回到目次 下一章


譯自TEI官方網站的TEI Lite網頁:http://www.tei-c.org/Lite/
網頁內容未經任何校訂,恐有疏漏,請勿任意轉載引用
若有任何疏漏及錯誤之處,歡迎來信指正:sofia@gate.sinica.edu.tw