文件編碼組織 文件編碼交換格式指引 選錄版
TEI Lite: An Introduction to Text Encoding for Interchange


20. 電子題名頁

每一個TEI文本都有文件標頭,提供的資訊可類比至印刷本書名頁的資訊。TEI標頭以元素<TEI標頭>(<teiHeader>)標誌,包含四個主要部分:

<檔案描述>/<fileDesc>
標誌電子檔的完整書目描述。
 
<編碼描述>/<encodingDesc>
記載電子文件與來源文件的關係,或電子文件的源由。
 
<背景描述>/<profileDesc>
提供文本在非書目性方面的細節描述,特別是使用的語言及次要的語言、文件的緣起、相關人員及其他背景。
 
<版本描述>/<revisionDesc>
概述檔案更新的歷史。

共用多種特性的文件的全集或合集,可共用一個全集標頭,而每一個組件都可擁有各別的標頭。在這種情況下,屬性可標明其類型。


<TEI標頭 類型="文集">

為在標頭帶入全集層次的資訊。

某些標頭的元素由<段落>(<p>)標誌一或多個篇章的逐頁資訊。其他的可分成下列幾組:

20.1. 檔案描述

元素<檔案描述>(<fileDesc>)是必備的。以下列元素標誌電子檔完整的書目描述:

<題名與作者敘述>/<titleStmt>
集合關於作品與可為其知識內容負責者的資訊。
 
<版本敘述>/<editionStmt>
集合文本在某一特定版本中的相關資訊。
 
<檔案大小>/<extent>
描述電子文件在在某一媒體上儲存的約略大小,可以任何適用的單位記錄。
 
<出版敘述>/<publicationStmt>
集合與電子或文本相關的出版或發行資訊。
 
<集叢敘述>/<seriesStmt>
集合任何關於出版品所屬集叢的資訊。
 
<附註敘述>/<notesStmt>
收集任何與文本相關,但書目描述中其他元素未能記錄的資訊。
 
<來源描述>/<sourceDesc>
說明電子文件衍生或是製作時來源文件實體的書目描述。

標頭至少含下列結構:


<TEI標頭>
     <檔案描述>
          <題名與作者敘述> ... </題名與作者敘述>
          <出版敘述> ... <出版敘述>
          <來源描述> ... <來源描述>
     </檔案描述>
</TEI標頭>

20.1.1. 題名敘述

下列元素可在元素<題名敘述>(<titleStmt>)中使用:

<題名>/<title>
標誌作品的題名,不論是是文章、書籍、期刊或叢書,其他題名或是副題名也包含在內。
 
<作者>/<author>
在書目參照中,標誌作品個人或團體作者的名字,或任何書目中的原始責任敘述。
 
<贊助者>/<sponsor>
標明贊助組織或機構的名稱。
 
<資助者>/<funder>
標明負責資助計畫或文件的個人、機構或組織的名稱。
 
<政策研訂者>/<principal>
說明負責建立電子文件的主要研究者。
 
<責任敘述>/<respStmt>
對知識內容負文字、編輯、記錄或編集之責者的責任敘述,作者、編者等特定功能的元素不符或不適用者。

建議區分電腦與來源文件的題名,例如:


[來源文件題名]:機讀轉錄
[來源文件題名]:電子版
機讀版:[來源文件題名]

元素<責任敘述>(<respStmt>)包含下列附屬構件:

<責任類型>/<resp>
標誌描述個人智財權性質的慣用語。
 
<名稱>/<name>
標誌一個正式的名稱或名詞片語。

範例:


<題名與作者敘述>
     <題名>愛德格•愛倫•坡短篇二則:機讀轉錄</題名>
     <作者>愛倫坡(1809-1849)
     <責任敘述><責任類型>轉錄者</責任類型>
     <名稱>詹姆士•班森</名稱></責任敘述>
</題名與作者敘述>

20.1.2. 版本敘述

<版本敘述>/<editionStmt>集合文本某版本的相關資訊(同書目中其他處用法),可包含下列元素:

<版本>/<edition>
描述文本的某一特定版本。
 
<責任敘述>/<respStmt>
對知識內容負文字、編輯、記錄或編集之責者的責任敘述,作者、編者等特定功能的元素不符或不適用者。

範例:


<版本敘述>
     <版本 識別號="U2">草稿第三版,大幅更動
     <日期>1987</日期>
     </版本>
</版本敘述>

電子文件的新版實際內容為何,留給編碼者決定。

20.1.3. 檔案大小敘述

<檔案大小>/<extent>
描述電子文件在在某一媒體上儲存的約略大小。

範例:


<檔案大小>4532位元組</檔案大小>

20.1.4. 出版敘述

元素<出版敘述>/<publicationStmt>是必備的。可包含短文敘或集合下列元素:

<出版者>/<publisher>
提供關於負責文件出版或發行的組織名稱。
 
<發行者>/<distributor>
補充說明負責文件發行的個人或單位的名稱。
 
<授權者>/<authority>
補充說明在出版者或發行者之外,負責提供電子檔案的個人或其他單位的名稱。

上面三個元素至要出現一個,除非出版敘述全部以文章敘述。當中可出現下列元素:

<出版地>/<pubPlace>
標誌文件出版地的名稱。
 
<地址>/<address>
標誌郵寄或其他種類的地址,例如,出版商地址、機構地址、個人地址。
 
<識別碼>/<idno>
用來辨別文件的任何標準或非標準編碼,屬性包括:
類型/type
編碼的種類,例如國際標準書號(ISBN)或其他標準系列。
 
<取得限制>/<availability>
補充說明關於文件的獲取的資訊,例如任何使用或散佈的限制,版權狀態等等。屬性包括:
狀態/status
說明文件目前的獲取性質的代碼,屬性的參考值包括:限制(restricted)、不明(unknown)及免費(free)
日期/<date>
標誌任何格式的日期。

範例:


<出版敘述>
     <出版者>牛津大學出版社</出版者>
     <出版地>牛津</出版地> <日期>1989</日期>
     <識別碼 類型="ISBN">0-19-254705-5</識別代碼>
     <取得限制>牛津大學出版社版權所有,1989</取得限制>
</出版敘述>

20.1.5. 集叢與附註敘述

元素<集叢敘述>(<seriesStmt>)集合關於所屬集叢的資訊。可包含元素<題名>(<title>)、<識別代碼>(<idno>)或<責任敘述>(<respStmt>)。

使用元素<附註敘述>(<notesStmt>)包含一或多個內含附註或註解的元素<附註>(<note>)。格式的書目中可見的部分資訊,已被指定為TEI架構的特定元素。

20.1.6. 來源描述

元素<來源描述>(<sourceDesc>)為必備,記錄來源的細節,或是電腦檔案衍生的出處資訊。可使用一或多個下列元素包含簡單的短文或引用書目:

<引用書目>/<bibl>
標誌結構鬆散的引用書目,可選擇是否明確標誌其中的構件。
 
<完整書目>/<biblFull>
標誌結構完整的引用書目,呈現所有TEI檔描述的構件。
 
<書目表列>/<listBibl>
標誌引用書目表列,不限形式。

範例:


<來源描述>
     <引用書目>莎士比亞手稿首葉,查爾頓•辛曼提供(牛頓摹本,1968) </引用書目>
</來源描述>



<來源描述>
     <描述敘述 識別名稱="CNN12">
     <引用書目><作者>美國有線電視新聞網網路新聞
          <題名>頭條新聞
          <日期>1989年1月12日
     </引用書目>
     </描述敘述>
</來源描述>

20.2. 編碼描述

元素<編碼描述>(<encodingDesc>)標明規範文本轉錄的方法與編輯原則。強烈推薦使用此元素。可以文章描述或包含下列元素:

<計畫描述>/<projectDesc>
詳述電子檔案編碼的意圖或目標,以及任何關於徵集或收集程序的資訊。
 
<取樣宣告>/<samplingDecl>
標誌在建立全集或合集時,文件取樣使用原則與方法的敘述。
 
<編輯宣告>/<editorialDecl>
提供文件在編碼時運用的編輯原則與實作的詳細說明。
 
<標誌宣告>/<tagsDecl>
提供關於適用於SGML文獻標誌細節資訊。
 
<參考宣告>/<refsDecl>
標明文本的標準參考系統建構的方式。
 
<分類宣告>/<classDecl>
標誌文件在其他部分使用的一或多個分類法中的類號。

20.2.1. 專案與取樣描述

元素<計畫描述>(<projectDesc>)與<取樣宣告>(<samplingDecl>)的範例:


<編碼描述>
     <計畫描述>為克拉列蒙特•莎士比亞診所的使用而收集,1990年6月。
     </計畫描述>
</編碼描述>


<編碼描述>
     <取樣宣告>自文本開始處取二千字為樣本。
     </取樣宣告>
</編碼描述>

20.2.2. 編輯宣告

元素<編輯宣告>(<editorialDecl>)包含文件編碼實作的描述文章。一般而言這類描述應包含下列主題,每一主題可以簡單的放在不同段落。

更正/correction
在何種情況下如何更正文件。
 
規格化/normalization
原始文件規格化或標準化的幅度。
 
引文/quotation
原始文件的引號如何處理──保留或由實體參考所取代,是否區分開放或封閉的引文等。
 
連字符號/hyphenation
原始文件的連字號如何處理(尤其是行尾連字符號)──是被保留或由實體參考所取代等。
 
文件分割/segmentation
文件如何分割,例如分割成句子、語調單位、表列階層等。
 
詮釋/interpretation
文件加入何種分析或詮釋資訊。。

範例:


<編輯宣告>
     <段落>第四章的全篇的講述分析全部由手動加入,還未檢查。
     <段落>轉錄的錯誤由WordPerfect拼字檢查控制。
     <段落>所有的字以韋氏大學字典第九版轉成現代美式拼法。
     <段落>所有的引用符號轉成實體參考。
</編輯宣告>

20.2.3. 標誌、參考及分類宣告

元素<標誌宣告>(<tagsDecl>)用來提供關於文件中實際出現SGML標誌的細節資訊。可包含使用元素的簡單表列及使用量,使用下列特殊功能的元素:

<標誌使用>/<tagUsage>
說明採用TEI的文件中關於特定元素在元素<文件>(<text>)中統一的使用資訊。屬性包括:
對應元素名種/gi
標誌所指元素的名稱(一般識別)。
出現次數/occurs
標明元素在文件中出現的次數。

元素<樣式>(<rendition>)用來記載來源文本中被標誌部分使用的不同樣式。

<樣式>/<rendition>
補充說明關於一或多個元素在展現時預定採用樣式的資訊。
 
<標誌使用>/<tagUsage>
說明採用TEI的文件中關於特定元素在元素<文件>(<text>)中統一的使用資訊。屬性包括:
出現次數/occurs
標明在文件中元素出現的次數。
識別名稱出現次數/ident
標明具有全域屬性識別名稱(id)識別值的元素在文件中出現的次數。
樣式/render
標明定義元素<樣式>使用樣式的識別碼。

範例:


<標誌宣告>
 <標誌使用 對應元素名稱="text" 出現次數=1>
 <標誌使用 對應元素名稱="body" 出現次數=1>
 <標誌使用 對應元素名稱=p 出現次數="12">
 <標誌使用 對應元素名稱="hi" 出現次數=6>
</標誌宣告>

以上(想象中的)標記宣告可以適用於包含十二個段落的文件,其中標誌了六個元素<醒目標示>(<hi>)。注意,如果使用元素<標誌宣告>,必須包含相關文本中每一個元素的<標誌使用>。

元素<參考宣告>(<refsDecl>)用來記載任何編碼工作內建的標準架構。最簡單的格式由文章敘述組成。

範例:


<參考宣告>
<段落>每一個第一層與第二層的屬性N包含使用XX.yyy這類格式分割的正規的
參考系統,其中XX為羅馬數字的冊號,yyy為阿拉伯數字的章節號。
</參考宣告>

元素<分類宣告>(<classDecl>)集合標頭其他部分使用的分類架構定義或來源的描述。這類的架構必須至少提供一種,以下列的元素編碼:

<分類學>/<taxonomy>
定義用在文本的分類法,不論是隱含於書目引用者,或是以明確分類架構呈現者。
 
<引用書目>/<bibl>
標誌書目構件未明確標記,結構鬆散的引用書目。
 
<類目>/<category>
標誌使用者定義的分類法中單獨描述的類目,這個類目有可能是位一個更大類目中的一部分。
 
<類目描述>/<catDesc>
以短文的形式,描述分類法或文件類型中的某些類目。

在最簡單的例子裡,分類可由書目參照定義,如下例所示:


<分類宣告>
     <分類學 識別名稱="LCSH">
          <引用書目>國會圖書館標題法</引用書目>
     </分類學>
</分類宣告>

此外,編碼者可定義特殊目的的分類架構,如下例所示:


<分類學 識別名稱=B>
   <引用書目>布朗語料</引用書目>
   <類目 識別名稱="B.A"><類目描述>出版報導
      <類目 識別名稱="B.A1"><類目描述>每日</類目>
      <類目 識別名稱="B.A2"><類目描述>週日</類目>
      <類目 識別名稱="B.A3"><類目描述>國家</類目>
      <類目 識別名稱="B.A4"><類目描述>地方</類目>
      <類目 識別名稱="B.A5"><類目描述>政治</類目>
      <類目 識別名稱="B.A6"><類目描述>體育</類目>
     ...
   </類目>
   <類目 識別名稱="B.D"><類目描述>信仰
      <類目 識別名稱="B.D1"><類目描述>書籍</類目>
      <類目 識別名稱="B.D2"><類目描述>期刊與追蹤</類目>
   </類目>
  ...
</分類學>

這類分類架構中,特殊文本與分類中的類目間的連結是由元素<分類用詞>(<textClass>)中的元素<類目參考>(<catRef>)構成,下面會進一步描述。

20.3. 背景描述

元素<profileDesc>允許在單一架構中記錄包含多種特質的描述性資訊。有三種選用構件:

<建置資訊>/<creation>
關於文件建置的資訊。
 
<使用語言>/<langUsage>
描述在文本中出現的語言、次要語言、語體、方言等。
 
<分類用詞>/<textClass>
集合以標準分類架構、索引典等來描述文本的性質或主題的資訊。

範例:


<建置資訊>
     <日期 標準格式值="1992-08">1992年8月</日期>
     <名稱> 類型="place">塔歐斯,新墨西哥</名稱>
</建置資訊>

元素<分類用詞>(<textClass>)參考由元素<分類宣告>(<classDecl>)所定義的系統為文件分類,包含一或多個下列元素:

<關鍵詞>/<keywords>
標誌定義文本主題或性質的關鍵詞或片語。屬性包括:
分類架構/scheme
識別控制詞彙定義的相關關鍵字組。
 
<分類號>/<classCode>
標誌文本使用某種標準分類系統時的分類碼。
分類架構/scheme
識別使用的分類法系統或分類學。
 
<類目參考>/<catRef>
標明在某個分類學或類型學中定義的一個或多個類目。屬性包括:
目標/target
識別相關的類目。

元素<關鍵詞>包含識別文件主題或特性的關鍵字或片語。屬性架構(scheme)連結到元素分類學(<taxonomy>)中定義的分類系統。


<分類用詞>
     <關鍵詞 分類架構="LCSH">
          <列表>
          <項目>英國文學-歷史與評論-資料處理</項目>
          <項目>英國文學-歷史與評論-理論等</項目>
          <項目>英國語文-風格-資料處理</項目>
          </列表>
     </關鍵詞>
</分類用詞>

20.4. 更新描述

元素<更新描述>(<revisionDesc>)為文本每一筆更正記錄提供異動登錄。異動登錄可以一系列的元素<更新>(<change>)記錄,每一個<更新>中都包含:

<日期>/ <date>
標誌任何格式的日期。
 
<責任敘述>/<respStmt>
對知識內容負文字、編輯、記錄或編集之責者的責任敘述,作者、編者等特定功能的元素不符或不適用者。
 
<項目>/<item>
標誌列表中的一個部件。

範例:


<更新描述>
    <更新><日期>1991年6月3日:</日期>
     <責任敘述><名稱>EMB</名稱><責任類型>編</責任類型></責任敘述>
          <項目>格式更新</項目></更新>
    <更新><日期>1990年5月25日:</日期>
     <責任敘述><名稱>EMB</名稱><責任類型>編</責任類型></責任敘述>
          <項目>史都華的更新鍵入</項目>
  </更新>
</更新描述>

上一章 回到目次


譯自TEI官方網站的TEI Lite網頁:http://www.tei-c.org/Lite/
網頁內容未經任何校訂,恐有疏漏,請勿任意轉載引用
若有任何疏漏及錯誤之處,歡迎來信指正:sofia@gate.sinica.edu.tw