文件編碼組織 文件編碼交換格式指引 選錄版
TEI Lite: An Introduction to Text Encoding for Interchange


3. TEI文件的結構

所有遵循TEI的文件都包含(a)TEI標頭(以元素<TEI標頭>(<teiHeader>)標誌者)與(b)文本的正文轉錄(以元素<文件>(<text>)標誌)。

TEI標頭部分提供相當於印刷出版品題名頁中所提供的資訊。最多包含四個部分:機讀文本的書目描述、編碼方式的敘述、文本的非書目性敘述(文本背景資訊)、以及修訂史。標頭部分更進一步的敘述詳「20. 電子題名頁」

TEI文件可以(單一作品),或合集(多件單一作品的集合,如選集)為單位。不論何種狀況,可能出現正文前資訊正文後資訊。兩者之間為正文,在合集中,或可以由群組組成,每一個群中可包含更多的群組或文本。

以件為單位的作品,編碼的整體的結構如下:


<TEI.2>
    <TEI標頭>〔標頭部分資訊〕</TEI標頭>
    <文本>
        <正文前資訊>〔正文前資訊〕</正文前資訊>
        <正文>〔正文〕</正文>
        <正文後資訊>〔正文後資訊〕</正文後資訊>
    </文本>
</TEI.2>

合集可能也有合集的正文前後的資訊,中間會出現一或多個個文本群組,每一個獨立,但可能也各自擁有正文前後資訊。合集編碼使用的整體的結構如下:


<TEI.2>
    <TEI標頭>〔合集的標題部分資訊〕</TEI標頭>
    <文本>
        <正文前資訊>〔合集的正文前資訊〕</正文前資訊>
        <群組>
           <文本>
              <正文前資訊>〔第一份文件的正文前資訊〕</正文前資訊>
              <正文>〔第一份文件的正文〕</正文>
              <正文後資訊>〔第一份文件的正文後資訊〕</正文後資訊>
           </文本>
           <文本>
              <正文前資訊>〔第二份文件的正文前資訊〕</正文前資訊>
              <正文>〔第二份文件的正文〕</正文>
              <正文後資訊>〔第二份文件的正文後資訊〕</正文後資訊>
           </文本>
           〔更多的文件群組?
f        </群組>
        <正文後資訊>〔合集的正文後資訊〕</正文後資訊>
    </文本>
</TEI.2>

也可把TEI文件做成合集,每一份文件都有自己獨立的標頭。這種合集稱為TEI文集,文集本身也有標頭:


<TEI文集>
  <TEI標頭>〔集合的標題部分資訊〕</TEI標頭>
  <TEI.2>
     <TEI標頭>〔第一份TEI文件的標頭部分〕</TEI標頭>
     <文本>〔集合中的第一份TEI文件〕</文本>
  </TEI.2>
  <TEI.2>
    <TEI標頭>〔第二份TEI文件的標頭部分〕</TEI標頭>
    <文本>〔集合中的第二份TEI文件〕</文本>
  </TEI.2>
</TEI文集>

但是,不能以TEI文集再建以一個合集──也就是說,不能將多個元素<TEI文集>(<teiCorpus>)合併視為單一物件。這是TEI指引現行版本中的限制。

在後續的章節中,主要是討論簡單的文本結構。每一種狀況由幾個相關的TEI元素與簡短的定義構成,其後是專屬於該元素的屬性定義。大體而言,都會附帶簡短的範例。

上一章 回到目次 下一章


譯自TEI官方網站的TEI Lite網頁:http://www.tei-c.org/Lite/
網頁內容未經任何校訂,恐有疏漏,請勿任意轉載引用
若有任何疏漏及錯誤之處,歡迎來信指正:sofia@gate.sinica.edu.tw