語言典藏計畫-臺灣南島語典藏
Metadata 服務窗口: 城菁汝

  在這數位知識的時代,大部份訊息的解讀,皆要靠語言文字的媒介。因此,提供語言文字知識表達與內涵的語料庫,是知識經濟及數位資訊基礎架構中不可或缺的一環。本計劃的目標在建立以下三個不同型式之核心語料庫;(1)當代語言:廿世紀漢語平衡語料庫;(2)歷史語言:近代漢語白話語料庫;(3)瀕臨滅絕語言及文化遺產:臺灣南島語語料庫。中研院語言所「語言典藏」網站連結:http://corpus.ling.sinica.edu.tw/project/LanguageArchive/

Metadata標準:採用OLAC (Open Language Archives Community)

Metadata元素一覽

工作進程

  係說明主題計畫和Metadata工作組的工作進度與成果。黑體字部份表示已完成的工作及其相關大事記,反白文字部份則表示即將完成的工作。

參與成員

 
主題計畫:齊莉莎、余清華、鄭錦全、黃居仁、張如瑩
 
後設資料(Metadata)工作組:陳亞寧、陳淑君、沈漢聰、城菁汝

  工作文件區為後設資料工作組與主題計畫同仁一起研擬Metadata過程的相關記錄,內容包括:工作表單記錄、控制詞彙表、分析文件、需求規格書、使用規範、會議記錄、其他。

國外相關類型計畫

British National Corpus
http://info.ox.ac.uk/bnc/
Alaska Native Language Center, University of Alaska
http://www.uaf.edu/anlc/
Cobuild Corpus
http://www.collins.co.uk/corpus/CorpusSearch.aspx
Rosetta Project, USA.
http://www.rosettaproject.org/
Penn Treebank(English)
http://www.cis.upenn.edu/~treebank/
Comparative Bantu Online Dictionary, University of California Berkeley, USA
  http://www.cbold.ddl.ish-lyon.cnrs.fr/
WordNet
http://www.cogsci.princeton.edu/~wn/
Spoken Dutch Corpus Project
http://corpus.ling.sinica.edu.tw/project/LanguageArchive/data/result/workshop/20020122workshop_list.html

相關活動

    語言資源建構與標記工作營 (2002-1-22, 中研院語言所舉辦)

 

本頁更新日期 : 08/11/5