TEI Lite 中文譯稿

文件編碼組織 後設資料標誌集 選錄版
TEI Lite


 

18. 字集、發音符號等

隨著XML及其採用Unicode做為所有文件的必備字集,關於世界上各種不同的語言及書寫系統在呈現上大部分問題,已經大幅減少。特別是對使用歐語標準格式工作的人而言,幾乎不需要做特別的動作:任何XML的編輯器都應允許直接輸入音節字母及非ASCII碼的字元,而且不論是使用Unicode或是參考的字元集實體,此檔應以可直接在不同的(編碼)系統之間轉換的方式儲存。

然而,為了與其他舊系統的相容性,TEI Lite DTD包含許多最廣泛運用的字碼宣告,讓這些字形可以記憶並輸入與儲存。

使用者或可在符合TEI的檔案中使用自己的字形名稱,而如果使用者希望;或者可提供這些字形的宣告,可以將這些字形對應到相應的Unicode值上。標準的名稱(使用長編碼)的優點是清析;對任何說英語者而言,識別出這些字元已被命名,是清楚可解的,甚至不需要任何的資源表列。但許多舊架構對重音節字形的表現並非如此。

當使用者需要的字形並不在公開的字集中,使用者或許想要用ISO的公開字集中的命名規則產生一個新的名稱(字碼),如下面所述者:

連音字/digraphs
表示兩個字母發一個音節的字碼名稱,該字碼由一串綁在一起的字母表現。如果需要大寫,兩個字母都要使用大寫字母(記得這種狀況在字碼中通常很明顯),例如:aelig (æ), AElig (Æ) szlig (ß)。
 
發音與音節符號/diacritics and accents
表示多數的西歐語言中含音節的字碼,在含有音節標記的字母後面附加下列字串中的一種,可以使用大寫或小寫。
 
曲音符號/umlaut
曲音以uml表示,例如:auml (ä), Auml (Ä), euml (ë), iuml (sic: ï), ouml (ö), Ouml (Ö), uuml (ü), Uuml (Ü)。
 
重音節符號/acute
急促音或是重音節以acute表示,例如:aacute (á), eacute (é), Eacute (É), iacute (í), oacute (ó), uacute (ú)。
 
抑音節符號/grave
抑音節以grave 表示,例如:agrave (à), egrave (è), igrave (ì), ograve (ò), ugrave (ù)。
 
曲折符號circumflex
曲折音符號以circ表示,例如:acirc (â), ecirc (ê), Ecirc (Ê), icirc (î), ocirc (ô), ucirc (û)。
 
鼻音符號/tilde
鼻音符號以tilde表示,例如:atilde (ã), Atilde (Ã), ntilde (ñ), Ntilde (Ñ), otilde (õ), Otilde (Õ)。
 
子音consonants
以下是在西歐語言中遇到特殊子音時推薦的字碼:ccedil (ç), Ccedil (Ç), eth(þ,小寫的eth或盎格魯撒克遜或冰島語的劃線d), ETH (大寫的eth), thorn (小寫的thorn), THORN(大寫的thorn), szlig (德文中的s-z的連字或esszet、ß)。
 
標點符號/punctuation marks
以下是某些常見的標點符號推薦使用的字碼:ldquo(左雙引號括弧,在文字上方像66者)、rdquo(右雙引號括弧,在文字上方像99者)、mdash (一個內夾的連字符號)、hellip(水平省略符號,三個相近的點號)、rsquo(右單引號,在文字上方像9者)。

 

上一章 回到目次 下一章


譯自TEI官方網站的TEI Lite網頁:http://www.tei-c.org/Lite/
網頁內容未經任何校訂,恐有疏漏,請勿任意轉載引用
若有任何疏漏及錯誤之處,歡迎來信指正:sofia@gate.sinica.edu.tw