文件編碼組織 文件編碼交換格式指引 選錄版
TEI Lite: An Introduction to Text Encoding for Interchange
20. 電子題名頁
每一個TEI文本都有文件標頭,提供的資訊可類比至印刷本書名頁的資訊。TEI標頭以元素<TEI標頭>(<teiHeader>)標誌,包含四個主要部分:
共用多種特性的文件的全集或合集,可共用一個全集標頭,而每一個組件都可擁有各別的標頭。在這種情況下,屬性可標明其類型。
<TEI標頭 類型="文集">
為在標頭帶入全集層次的資訊。
某些標頭的元素由<段落>(<p>)標誌一或多個篇章的逐頁資訊。其他的可分成下列幾組:
元素<檔案描述>(<fileDesc>)是必備的。以下列元素標誌電子檔完整的書目描述:
標頭至少含下列結構:
<TEI標頭>
<檔案描述>
<題名與作者敘述> ... </題名與作者敘述>
<出版敘述> ... <出版敘述>
<來源描述> ... <來源描述>
</檔案描述>
</TEI標頭>
下列元素可在元素<題名敘述>(<titleStmt>)中使用:
建議區分電腦與來源文件的題名,例如:
[來源文件題名]:機讀轉錄 [來源文件題名]:電子版 機讀版:[來源文件題名]
元素<責任敘述>(<respStmt>)包含下列附屬構件:
範例:
<題名與作者敘述>
<題名>愛德格•愛倫•坡短篇二則:機讀轉錄</題名>
<作者>愛倫坡(1809-1849)
<責任敘述><責任類型>轉錄者</責任類型>
<名稱>詹姆士•班森</名稱></責任敘述>
</題名與作者敘述>
<版本敘述>/<editionStmt>集合文本某版本的相關資訊(同書目中其他處用法),可包含下列元素:
範例:
<版本敘述>
<版本 識別號="U2">草稿第三版,大幅更動
<日期>1987</日期>
</版本>
</版本敘述>
電子文件的新版實際內容為何,留給編碼者決定。
範例:
<檔案大小>4532位元組</檔案大小>
元素<出版敘述>/<publicationStmt>是必備的。可包含短文敘或集合下列元素:
上面三個元素至要出現一個,除非出版敘述全部以文章敘述。當中可出現下列元素:
範例:
<出版敘述>
<出版者>牛津大學出版社</出版者>
<出版地>牛津</出版地> <日期>1989</日期>
<識別碼 類型="ISBN">0-19-254705-5</識別代碼>
<取得限制>牛津大學出版社版權所有,1989</取得限制>
</出版敘述>
元素<集叢敘述>(<seriesStmt>)集合關於所屬集叢的資訊。可包含元素<題名>(<title>)、<識別代碼>(<idno>)或<責任敘述>(<respStmt>)。
使用元素<附註敘述>(<notesStmt>)包含一或多個內含附註或註解的元素<附註>(<note>)。格式的書目中可見的部分資訊,已被指定為TEI架構的特定元素。
元素<來源描述>(<sourceDesc>)為必備,記錄來源的細節,或是電腦檔案衍生的出處資訊。可使用一或多個下列元素包含簡單的短文或引用書目:
範例:
<來源描述>
<引用書目>莎士比亞手稿首葉,查爾頓•辛曼提供(牛頓摹本,1968) </引用書目>
</來源描述>
<來源描述>
<描述敘述 識別名稱="CNN12">
<引用書目><作者>美國有線電視新聞網網路新聞
<題名>頭條新聞
<日期>1989年1月12日
</引用書目>
</描述敘述>
</來源描述>
元素<編碼描述>(<encodingDesc>)標明規範文本轉錄的方法與編輯原則。強烈推薦使用此元素。可以文章描述或包含下列元素:
元素<計畫描述>(<projectDesc>)與<取樣宣告>(<samplingDecl>)的範例:
<編碼描述>
<計畫描述>為克拉列蒙特•莎士比亞診所的使用而收集,1990年6月。
</計畫描述>
</編碼描述>
<編碼描述>
<取樣宣告>自文本開始處取二千字為樣本。
</取樣宣告>
</編碼描述>
元素<編輯宣告>(<editorialDecl>)包含文件編碼實作的描述文章。一般而言這類描述應包含下列主題,每一主題可以簡單的放在不同段落。
範例:
<編輯宣告>
<段落>第四章的全篇的講述分析全部由手動加入,還未檢查。
<段落>轉錄的錯誤由WordPerfect拼字檢查控制。
<段落>所有的字以韋氏大學字典第九版轉成現代美式拼法。
<段落>所有的引用符號轉成實體參考。
</編輯宣告>
元素<標誌宣告>(<tagsDecl>)用來提供關於文件中實際出現SGML標誌的細節資訊。可包含使用元素的簡單表列及使用量,使用下列特殊功能的元素:
元素<樣式>(<rendition>)用來記載來源文本中被標誌部分使用的不同樣式。
範例:
<標誌宣告> <標誌使用 對應元素名稱="text" 出現次數=1> <標誌使用 對應元素名稱="body" 出現次數=1> <標誌使用 對應元素名稱=p 出現次數="12"> <標誌使用 對應元素名稱="hi" 出現次數=6> </標誌宣告>
以上(想象中的)標記宣告可以適用於包含十二個段落的文件,其中標誌了六個元素<醒目標示>(<hi>)。注意,如果使用元素<標誌宣告>,必須包含相關文本中每一個元素的<標誌使用>。
元素<參考宣告>(<refsDecl>)用來記載任何編碼工作內建的標準架構。最簡單的格式由文章敘述組成。
範例:
<參考宣告> <段落>每一個第一層與第二層的屬性N包含使用XX.yyy這類格式分割的正規的 參考系統,其中XX為羅馬數字的冊號,yyy為阿拉伯數字的章節號。 </參考宣告>
元素<分類宣告>(<classDecl>)集合標頭其他部分使用的分類架構定義或來源的描述。這類的架構必須至少提供一種,以下列的元素編碼:
在最簡單的例子裡,分類可由書目參照定義,如下例所示:
<分類宣告>
<分類學 識別名稱="LCSH">
<引用書目>國會圖書館標題法</引用書目>
</分類學>
</分類宣告>
此外,編碼者可定義特殊目的的分類架構,如下例所示:
<分類學 識別名稱=B>
<引用書目>布朗語料</引用書目>
<類目 識別名稱="B.A"><類目描述>出版報導
<類目 識別名稱="B.A1"><類目描述>每日</類目>
<類目 識別名稱="B.A2"><類目描述>週日</類目>
<類目 識別名稱="B.A3"><類目描述>國家</類目>
<類目 識別名稱="B.A4"><類目描述>地方</類目>
<類目 識別名稱="B.A5"><類目描述>政治</類目>
<類目 識別名稱="B.A6"><類目描述>體育</類目>
...
</類目>
<類目 識別名稱="B.D"><類目描述>信仰
<類目 識別名稱="B.D1"><類目描述>書籍</類目>
<類目 識別名稱="B.D2"><類目描述>期刊與追蹤</類目>
</類目>
...
</分類學>
這類分類架構中,特殊文本與分類中的類目間的連結是由元素<分類用詞>(<textClass>)中的元素<類目參考>(<catRef>)構成,下面會進一步描述。
元素<profileDesc>允許在單一架構中記錄包含多種特質的描述性資訊。有三種選用構件:
範例:
<建置資訊>
<日期 標準格式值="1992-08">1992年8月</日期>
<名稱> 類型="place">塔歐斯,新墨西哥</名稱>
</建置資訊>
元素<分類用詞>(<textClass>)參考由元素<分類宣告>(<classDecl>)所定義的系統為文件分類,包含一或多個下列元素:
元素<關鍵詞>包含識別文件主題或特性的關鍵字或片語。屬性架構(scheme)連結到元素分類學(<taxonomy>)中定義的分類系統。
<分類用詞>
<關鍵詞 分類架構="LCSH">
<列表>
<項目>英國文學-歷史與評論-資料處理</項目>
<項目>英國文學-歷史與評論-理論等</項目>
<項目>英國語文-風格-資料處理</項目>
</列表>
</關鍵詞>
</分類用詞>
元素<更新描述>(<revisionDesc>)為文本每一筆更正記錄提供異動登錄。異動登錄可以一系列的元素<更新>(<change>)記錄,每一個<更新>中都包含:
範例:
<更新描述>
<更新><日期>1991年6月3日:</日期>
<責任敘述><名稱>EMB</名稱><責任類型>編</責任類型></責任敘述>
<項目>格式更新</項目></更新>
<更新><日期>1990年5月25日:</日期>
<責任敘述><名稱>EMB</名稱><責任類型>編</責任類型></責任敘述>
<項目>史都華的更新鍵入</項目>
</更新>
</更新描述>
譯自TEI官方網站的TEI Lite網頁:http://www.tei-c.org/Lite/
網頁內容未經任何校訂,恐有疏漏,請勿任意轉載引用
若有任何疏漏及錯誤之處,歡迎來信指正:sofia@gate.sinica.edu.tw