文件編碼組織 後設資料標誌集 選錄版
TEI Lite
1. 介簡
文件編碼組織指引(TEI Guideline,以下簡稱「指引」)的寫作,是針對想要把資訊轉換成電子形式儲存的使用者。指引強調文字資訊的轉換,但對其他格式的資訊,如圖象及聲音等,也有涉及。不論是建立新的資源或轉換已存在的作品,指引都是同等適用的。
指引提供使文件特徵明確表現的方法,並以此種方式來輔助電腦軟體在不同的平台上做文件處理。明確化的程序稱為標誌或編碼。在電腦裡,任何的文字呈現都使用某種形式的標誌,TEI的加入,部分是因為現有的相通且不可省略的編碼架構,很多都是學界設定的,另一部分是因為學術架構的範圍擴張,TEI現在已被視為文字資料的電子格式。
指引描述一個可被擴充到多種不同軟體語言的編碼架構。第一版的TEI使用標準通用標誌語言(SGML ),最近的版本(TEI P4, 2002),已可使用可擴充標誌語言(XML ),未來的版本或許可以擴及其他架構性的語言。這些語言的共通之處,是以元素與屬性來定義文件,並有規則來規範元素與屬性在文件中的用法。TEI使用XML的企圖,著眼於XML的完整性與一般性,而在的標誌架構上,TEI的與其他使用XML的架構並無二致,任何一般目的的XML工具軟體,都可以處理符合TEI標準的文件。
TEI以前的經費來自計算與人文學會(Association for Computers and the Humanities)、計算語言學會(Association for Computational Linguistics)、及文學與語言學計算學會(Association for Literary and Linguistic Computing),目前則由獨立的會員性組識維護與發展,主要負責的有四所大學。目前的經費源自美國國家人文研究捐贈基金(U.S. National Endowment for the Humanities)、歐盟委託執行計畫第八指導委員會(Directorate General XIII of the Commission of the European Communities)、安德魯•威廉•美隆基金會(Andrew W. Mellon Foundation)、及加拿大社會科會及人文學研究委員會(Social Science and Humanities Research Council of Canada)。第一版指引於1994年5月出版,歷時六年,集全球數百位各領域專長的學者之力。在接下來的幾年中,指引在數位圖書館的發展中具漸具影響力,不論是在軟體語言,或是在全球資訊網本身的發展上。TEI組織於2001年1月成立,一年後發行了現行指引的完整修訂版,修訂後全版與XML相容。
工作之初,TEI整體的目的是1987年11月在紐約的維薩學院(Vassar College)所舉行的預備會議中所擬定的封閉條款,再進一步依據此「帕基普西原則」(Poughkeepsie Principles)建構一系列的文件。被建構的文件即為指引,應該要:
學術的世界廣闊而分歧。為了使指引能廣泛地被接受,指引必須確保:
本文獻稱為TEI選錄版,描述一個抽取自大量元素中的易用選集,並從設計的目標中推薦範例。
完整的TEI架構中定義了幾百個元素,從中加以選擇,試圖區分出一套好用的「起始集」,壓縮出每個使用者都應該知道的元素。對於了解全部的TEI DTD,以及熟悉在完整的DTD中,哪些選項在特殊的文件類型的工作上是必須的,TEI選錄版的工作經驗是非常寶貴的。
定義本子集的目的,綜述如下:
讀者可以就是否符合標準判定編輯者是否成功。基於標誌實際文件的經驗,我們有信心已有部分達到目標。牛津文件檔案的館藏將原來的標誌轉換成SGML時,即使用TEI選錄版;維吉尼亞大學與密西根大學的電子文件中心,也使用TEI選錄版來為館藏編碼。文件編碼組織本身現行的技術文件──包含本文件,也使用選錄版。
作在一份適宜的課程文件,雖然已經嘗試讓文件內容完備,讀者必須注意本文件並未涵蓋所有TEI編碼架構的細節。指引中,除了完整敘述本文件所描述所有元素外,還有其他未被選錄的元素。選錄版所列的元素,應以查閱指引做為參考時的權威資料。選錄版同時假設,使用者具備某些XML的基本知識。
譯自TEI官方網站的TEI Lite網頁:http://www.tei-c.org/Lite/
網頁內容未經任何校訂,恐有疏漏,請勿任意轉載引用
若有任何疏漏及錯誤之處,歡迎來信指正:sofia@gate.sinica.edu.tw