文件編碼組織 文件編碼交換格式指引 選錄版
TEI Lite: An Introduction to Text Encoding for Interchange
20. 電子題名頁
每一個TEI文本都有文件標頭,提供的資訊可類比至印刷本書名頁的資訊。TEI標頭以元素<TEI標頭>(<teiHeader>)標誌,包含四個主要部分:
共用多種特性的文件的全集或合集,可共用一個全集標頭,而每一個組件都可擁有各別的標頭。在這種情況下,屬性可標明其類型。
<TEI標頭 類型="文集">
為在標頭帶入全集層次的資訊。
某些標頭的元素由<段落>(<p>)標誌一或多個篇章的逐頁資訊。其他的可分成下列幾組:
元素<檔案描述>(<fileDesc>)是必備的。以下列元素標誌電子檔完整的書目描述:
標頭至少含下列結構:
<TEI標頭> <檔案描述> <題名與作者敘述> ... </題名與作者敘述> <出版敘述> ... <出版敘述> <來源描述> ... <來源描述> </檔案描述> </TEI標頭>
下列元素可在元素<題名敘述>(<titleStmt>)中使用:
建議區分電腦與來源文件的題名,例如:
[來源文件題名]:機讀轉錄 [來源文件題名]:電子版 機讀版:[來源文件題名]
元素<責任敘述>(<respStmt>)包含下列附屬構件:
範例:
<題名與作者敘述> <題名>愛德格•愛倫•坡短篇二則:機讀轉錄</題名> <作者>愛倫坡(1809-1849) <責任敘述><責任類型>轉錄者</責任類型> <名稱>詹姆士•班森</名稱></責任敘述> </題名與作者敘述>
<版本敘述>/<editionStmt>集合文本某版本的相關資訊(同書目中其他處用法),可包含下列元素:
範例:
<版本敘述> <版本 識別號="U2">草稿第三版,大幅更動 <日期>1987</日期> </版本> </版本敘述>
電子文件的新版實際內容為何,留給編碼者決定。
範例:
<檔案大小>4532位元組</檔案大小>
元素<出版敘述>/<publicationStmt>是必備的。可包含短文敘或集合下列元素:
上面三個元素至要出現一個,除非出版敘述全部以文章敘述。當中可出現下列元素:
範例:
<出版敘述> <出版者>牛津大學出版社</出版者> <出版地>牛津</出版地> <日期>1989</日期> <識別碼 類型="ISBN">0-19-254705-5</識別代碼> <取得限制>牛津大學出版社版權所有,1989</取得限制> </出版敘述>
元素<集叢敘述>(<seriesStmt>)集合關於所屬集叢的資訊。可包含元素<題名>(<title>)、<識別代碼>(<idno>)或<責任敘述>(<respStmt>)。
使用元素<附註敘述>(<notesStmt>)包含一或多個內含附註或註解的元素<附註>(<note>)。格式的書目中可見的部分資訊,已被指定為TEI架構的特定元素。
元素<來源描述>(<sourceDesc>)為必備,記錄來源的細節,或是電腦檔案衍生的出處資訊。可使用一或多個下列元素包含簡單的短文或引用書目:
範例:
<來源描述> <引用書目>莎士比亞手稿首葉,查爾頓•辛曼提供(牛頓摹本,1968) </引用書目> </來源描述>
<來源描述> <描述敘述 識別名稱="CNN12"> <引用書目><作者>美國有線電視新聞網網路新聞 <題名>頭條新聞 <日期>1989年1月12日 </引用書目> </描述敘述> </來源描述>
元素<編碼描述>(<encodingDesc>)標明規範文本轉錄的方法與編輯原則。強烈推薦使用此元素。可以文章描述或包含下列元素:
元素<計畫描述>(<projectDesc>)與<取樣宣告>(<samplingDecl>)的範例:
<編碼描述> <計畫描述>為克拉列蒙特•莎士比亞診所的使用而收集,1990年6月。 </計畫描述> </編碼描述>
<編碼描述> <取樣宣告>自文本開始處取二千字為樣本。 </取樣宣告> </編碼描述>
元素<編輯宣告>(<editorialDecl>)包含文件編碼實作的描述文章。一般而言這類描述應包含下列主題,每一主題可以簡單的放在不同段落。
範例:
<編輯宣告> <段落>第四章的全篇的講述分析全部由手動加入,還未檢查。 <段落>轉錄的錯誤由WordPerfect拼字檢查控制。 <段落>所有的字以韋氏大學字典第九版轉成現代美式拼法。 <段落>所有的引用符號轉成實體參考。 </編輯宣告>
元素<標誌宣告>(<tagsDecl>)用來提供關於文件中實際出現SGML標誌的細節資訊。可包含使用元素的簡單表列及使用量,使用下列特殊功能的元素:
元素<樣式>(<rendition>)用來記載來源文本中被標誌部分使用的不同樣式。
範例:
<標誌宣告> <標誌使用 對應元素名稱="text" 出現次數=1> <標誌使用 對應元素名稱="body" 出現次數=1> <標誌使用 對應元素名稱=p 出現次數="12"> <標誌使用 對應元素名稱="hi" 出現次數=6> </標誌宣告>
以上(想象中的)標記宣告可以適用於包含十二個段落的文件,其中標誌了六個元素<醒目標示>(<hi>)。注意,如果使用元素<標誌宣告>,必須包含相關文本中每一個元素的<標誌使用>。
元素<參考宣告>(<refsDecl>)用來記載任何編碼工作內建的標準架構。最簡單的格式由文章敘述組成。
範例:
<參考宣告> <段落>每一個第一層與第二層的屬性N包含使用XX.yyy這類格式分割的正規的 參考系統,其中XX為羅馬數字的冊號,yyy為阿拉伯數字的章節號。 </參考宣告>
元素<分類宣告>(<classDecl>)集合標頭其他部分使用的分類架構定義或來源的描述。這類的架構必須至少提供一種,以下列的元素編碼:
在最簡單的例子裡,分類可由書目參照定義,如下例所示:
<分類宣告> <分類學 識別名稱="LCSH"> <引用書目>國會圖書館標題法</引用書目> </分類學> </分類宣告>
此外,編碼者可定義特殊目的的分類架構,如下例所示:
<分類學 識別名稱=B> <引用書目>布朗語料</引用書目> <類目 識別名稱="B.A"><類目描述>出版報導 <類目 識別名稱="B.A1"><類目描述>每日</類目> <類目 識別名稱="B.A2"><類目描述>週日</類目> <類目 識別名稱="B.A3"><類目描述>國家</類目> <類目 識別名稱="B.A4"><類目描述>地方</類目> <類目 識別名稱="B.A5"><類目描述>政治</類目> <類目 識別名稱="B.A6"><類目描述>體育</類目> ... </類目> <類目 識別名稱="B.D"><類目描述>信仰 <類目 識別名稱="B.D1"><類目描述>書籍</類目> <類目 識別名稱="B.D2"><類目描述>期刊與追蹤</類目> </類目> ... </分類學>
這類分類架構中,特殊文本與分類中的類目間的連結是由元素<分類用詞>(<textClass>)中的元素<類目參考>(<catRef>)構成,下面會進一步描述。
元素<profileDesc>允許在單一架構中記錄包含多種特質的描述性資訊。有三種選用構件:
範例:
<建置資訊> <日期 標準格式值="1992-08">1992年8月</日期> <名稱> 類型="place">塔歐斯,新墨西哥</名稱> </建置資訊>
元素<分類用詞>(<textClass>)參考由元素<分類宣告>(<classDecl>)所定義的系統為文件分類,包含一或多個下列元素:
元素<關鍵詞>包含識別文件主題或特性的關鍵字或片語。屬性架構(scheme)連結到元素分類學(<taxonomy>)中定義的分類系統。
<分類用詞> <關鍵詞 分類架構="LCSH"> <列表> <項目>英國文學-歷史與評論-資料處理</項目> <項目>英國文學-歷史與評論-理論等</項目> <項目>英國語文-風格-資料處理</項目> </列表> </關鍵詞> </分類用詞>
元素<更新描述>(<revisionDesc>)為文本每一筆更正記錄提供異動登錄。異動登錄可以一系列的元素<更新>(<change>)記錄,每一個<更新>中都包含:
範例:
<更新描述> <更新><日期>1991年6月3日:</日期> <責任敘述><名稱>EMB</名稱><責任類型>編</責任類型></責任敘述> <項目>格式更新</項目></更新> <更新><日期>1990年5月25日:</日期> <責任敘述><名稱>EMB</名稱><責任類型>編</責任類型></責任敘述> <項目>史都華的更新鍵入</項目> </更新> </更新描述>
譯自TEI官方網站的TEI Lite網頁:http://www.tei-c.org/Lite/
網頁內容未經任何校訂,恐有疏漏,請勿任意轉載引用
若有任何疏漏及錯誤之處,歡迎來信指正:sofia@gate.sinica.edu.tw