- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2000年以来我国多语言料库研究进展
2000年以来我国多语言语料库研究进展 〔摘 要〕语料库是指根据一定的方法收集的自然出现语料构成的电子数据库。2000年以来我国对多语言语料库的研究呈现快速上升的趋势。在全面文献调研的基础上,本文对我国多语言语料库的研究现状进行了归纳与梳理。国内学者对多语言语料库的研究多集中于语言学领域,其次是计算机领域。研究主题主要分布在多语言语料库的关键技术研究、多语言语料库的应用研究两大方面。 中国论文网 /4/viewhtm 〔关键词〕多语言语料库;跨语言语料库;平行语料库;可比语料库;综述 〔中图分类号〕G252.8 〔文献标识码〕A 〔文章编号〕1008-0821(2016)06-0165-06 〔Abstract〕Corpus is an electronic database which is composed of the natural corpus collected accordingto a certain method.Since 2000,the research on multilingual corpora in China presented a rapid upward trend.Based on a comprehensive literature research,this paper summarized the current research situation of multilingual corpora in our country.The researches on multilingual corpus were mostly concentrated in the field of linguistics,followed by the computer field.Research topics were mainly distributed in two parts:the key technologies of multilingual corpora and the application multilingual corpora. 〔Key words〕multilingual corpora;cross-language corpora;parallel corpora;comparable corpora;review 语料库是指根据一定的方法收集的自然出现语料构成的电子数据库[1]。按语种划分可分为单语言、双语言和多语言语料库,后两者根据语料的组织形式又可以分为平行语料库和可比语料库。平行语料库,又称对齐语料库,是由原文本和对应的翻译文本构成的语料库,语言之间是完全对等的、互译的,是译文关系,多用于机器学习、双语词典;而可比语料库,又称类比语料库,是表述相同主题的多种语言文本的集合,源语言和目标语言没有严格的翻译关系,多用于语言对比研究,比如针对同一事件不同语言的新闻报道的集合等。 自20世纪90年代初世界上第一个多语言语料库“加拿大议会会议录英法平行语料库”在加拿大建成以来[2],国内外出现了一些多语言语料库,如厦门大学海外教育学院主持开发的英汉双语平行语料库(厦大E-C Corpus)[3]、北京大学中国语言学研究中心开发的汉英双语语料库[4]、北京外国语大学日本研究中心研制的中日对译语料库[5]、香港理工大学研制的双语旅游语料库、上海交通大学的科技英语可比语料库(JDEST)、绍兴文理学院创建的《红楼梦》汉英平行语料库[6]等。国内学者对多语言语料库的研究以双语平行语料库为主,涉及3种及3种以上语种的语料库较少。据笔者统计,英汉语料库的研究文献(包括学术论文、学位论文、会议论文)占总文献的55.9%。语料库的语种以英汉语为主,其次是维汉语,另外还包括俄语、日语、法语、藏语等与汉语的结合。本文研究的多语言语料库包括两种及两种以上语言的语料库。 1 我国多语言语料库研究数量分布 笔者选取CNKI、重庆维普、万方数据库为数据源,以“跨语言语料库”或“双语语料库”或“多语言语料库”或“平行语料库”或“对齐语料库”或“类比语料库”或“可比语料库”为关键词,对期刊论文、会议论文与学位论文进行检索,经筛选得到999篇与“多语言语料库”主题相关的论文,其中学术论文628篇、会议论文51篇、学位论文320篇。具体学术论文数量的年代分布分别如表1和图1所示。 从图1可以看出,2000年以来我国对多语言语料库的研究基本呈快速上升的趋势。笔者将其分为3个阶段,第一阶段为萌芽时期(2000-2004年),这一阶段的发文量较少,年均发文量3.6篇;第二阶段为初步发展时期(2005-2009年),发文数量有所增长,但增幅较慢,年均
有哪些信誉好的足球投注网站
文档评论(0)