语言後设资料OLAC及DC标准与应用-语言座标.PPT

语言後设资料OLAC及DC标准与应用-语言座标.PPT

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语言後设资料OLAC及DC标准与应用-语言座标

語言後設資料:OLAC及DC標準與應用 張如瑩 ruyng@.tw 中研院語言所籌備處 2003年9月10日 Outline Background DCMS: Dublin Core Metadata Element Set OLAC: Open Language Archives Community Language Archive Background #1 全球資訊網(World Wide Web)的興起 知識時代的來臨 面對語意網(Semantic Web)挑戰 Background #2 文字與圖片資料機器無法真正理解其義 非語意或語意的註解皆有助於電腦理解 將Web page呈現和內容以XML或其他物件導向的語言(ex: XOL, SHOE, RDF, RDF Schema, DAIL+OIL)加以呈現 Metadata 定義和功能 譯名: 後設資料、詮釋資料、超資料、元資料或是元數據 定義 Metadata通常稱為“data about data” 描述資料的資料。 Metadata是資料結合物件,用來描述資料屬性的資料,以協助其潛在使用者擁有完整的進一步知識。 功能包括: 定位(location) 探索(discovery) 文件紀錄(documentation) 評估(evaluation) 選擇(selection) Dublin Core Metadata Initiative 源起1995挖掘web資源的OCLC/NCSA Metadata workshop, / Dublin Core後設資料元素一個普遍跨學科的核心元素,有效廣泛支援資源挖掘,適用於任何以數位化或傳統型態存在的資源描述. 目標: 更容易挖掘出資源以及資料互通 包含十五個可任選與重複的元素(elements) Dublin Core Metadata Element Set v1.1 Title 資源標題 Creator 創造者 Subject 主題 Description 資源描述 Publisher 出版者 Contributor貢獻者/單位 Date日期 Type資源型態 Format 資源格式 Identifier 資源識別碼 Source 來源 Language 語言 Relation 關聯性 Coverage 涵蓋範圍 Rights權利管理 DCMS -修飾語(qualifiers) 語言典藏及其後設資料標準 Open Language Archives Community OLAC的目標 於2000年12月的一個語言資源工作營中,由來自北美、南美、歐洲、非洲、中東、亞洲、澳洲的語言學家與軟體發展者所創,希望藉由下列步驟進行創造世界性語言資源的虛擬圖書館: 針對語言資源數位典藏發展一致性的實踐指引。 發展一網路上具有互通性且提供存取相關語言資源的儲存器和服務中心 OLAC的組織 Coordinators: Steven Bird Gary Simons Advisory Board: Helen Aristar Dry, Susan Hockey, Chu-Ren Huang, Mark Liberman, Brian MacWhinney, Michael Nelson, Nicholas Ostler, Henry Thompson, Hans Uszkoreit, Antonio Zampolli Participating Archives Services: LDC, ELRA, DFKI, CBOLD, ANLC, LACITO, Perseus, SIL, APS, Utrecht Prospective Participants: ASEDA, Academia Sinica, AISRI, INALF, LCAAJ, Linguist, MPI, NAA, OTA, Rosetta, Tibetan Digital Library (UVA) Individual Members: ~120 OLAC的緣起 許多協會需要語言資源,如:語言學家、工程師、教師、演說家﹔許多機構提供片段性的架構,如:檔案管理員、軟體發展者和出版者。 前所未有的契機: 延伸性標誌語言(Extensible Markup Language,XML)和 Unicode提供以結構化方式彈性呈現以及長期儲存資料。 線上或非線上的數位化出版品有效且實際上達到分享語言資源涵義 Dublin Core 後設資料集(資源分類標準模組)連同Open Archives Initiative所提供的交換方法,可建立一個跨越多個儲存器與檔案櫃的架構。 OLAC的願景 # 1 使用者透過單一OLA

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档