作为语音研究与教学得力工具英语语音语料库.docVIP

作为语音研究与教学得力工具英语语音语料库.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
作为语音研究与教学得力工具英语语音语料库

作为语音研究与教学得力工具英语语音语料库   一、引言   在以往资源缺乏、技术条件相对不足的时代,语音学家只能根据口耳之学进行研究,结论多建立在定性描述的基础上,不够客观准确。广泛发展的语音语料库因其语料的客观性和真实性为语音实验研究提供了科学的研究材料和对象。至二十世纪末语音语料库的发展促进了语言语音研究的深入,涵盖了发音语音学、音位系统的构成和特征、语流中的音变、音节、音高体系、重音和节奏等七个专题(许高渝、王之光,2002)。各语音语料库相继建成,其中大多是英语语音语料库,如于20世纪90年代初得到DARPA资助建立的英语语音语料库TIMIT,包含630个说话者的5600多个语句,均为朗读语体的美国英语,对英语语音识别的研究、开发与评估起到了极大的推动作用;HCRC Map Task Corpus是包括18小时根据任务型研究设计、并经过标注的128段双人自然对话的、目前研究话语结构、韵律和语调相互关系最成功的语料库之一(Harrington,2010)。自20世纪90年代以来,我国有几十所大学和科研机构相继开展了汉语语音语料库的建设与研究,如中国科学技术大学科大讯飞公司发布的汉语语音语料库和中国社会科学院语言研究所主持的“863语音语料库”。为反映和记录语言的实际使用情况、透视语言系统的发展规律、比较语言体系的系统差异,特别是为考察外语学习者的语言习得规律及相关教学策略,研究人员开始关注英语学习者语音语料库。   中国英语学习者作为世界最大规模的英语学习团体,内部存在众多差异,诸如不同方言区的方言口音对英语口语的语音习得干扰殊为明显,因此对于英语本族语人士的方言语音学特征的描写与研究对外语语言教学与研究有着重要借鉴意义。牛津大学研究员Esther Grabe博士及其团队通过在英国各方言区采集本地人口语语料,考察方言与英语语音体系的系统差异,于2002年创建了IViE语音语料库,对英国各地区方言的语音、语调系统(如说话者的说话方式、语音语调、重音和停顿)开展了系统研究。本文将系统简要介绍该语料库的内容、规模、标注系统和现有研究应用,为有志于研究英语变体和中国各方言区英语学习者语言习得的教师???研究人员提供信息。   二、IViE语料库介绍   (一)语料内容、采集地区及现有规模   IViE语音语料库现有36小时的语料和4小时的已标注口语语料录音及标注信息,内有对应图片描述语料来源地、来源者性别及其相关信息。为使语料全面、具有时效性和代表性,IViE语料库取材于英国及周边国的9个城镇地区:伦敦、剑桥、卡地夫、利物浦、布拉福德、利兹、纽卡斯尔、北爱尔兰贝尔法斯特和爱尔兰的都柏林。所选择的地区较分散,不仅选取了所谓的南部标准的英语方言(剑桥、伦敦),而且也选取了广泛使用的“现代”或“主流”的英语方言(贝尔法斯特、北爱尔兰、都柏林)。已标注的口语语料包括伦敦、剑桥、布拉福德、利兹、纽卡斯尔、贝尔法斯特和都柏林7个地区、男女受试者各一位基于5种任务形式的录音材料。   语料库中的声音文件来自于108位(每个地区12位受试者)母语朗读者(男女各半,均为16岁在校中学生),按照相同的实验任务录音并按眷写及标注文本存储。声音文件分为设定好的文字朗读(单句朗读、段落朗读)和未设定的自然口语(自由交谈、复述故事和口头交谈等部分)。单句句型包括:简单句、陈述疑问句、一般疑问句、特殊疑问句和选择疑问句等,段落和复述的材料取自童话故事《灰姑娘》的片段,自然口语语料取自以吸烟为主题的话题讨论和通过看地图解说如何到达目的地的口头任务。   语料库建设者充分考虑到语音语调在不同情境、话题和说话方式等情况下将发生变化,因此采用了多种类型的实验材料,涵盖各种句型和基本文体类型。在朗读和复述任务中,很多人的单词发音听起来都很含糊,句子也缺少抑扬顿挫;但是在访谈和地图任务中他们的发音明显变得自然,使用了重音、节奏、语调等不同语音技能。   (二)IViE语料库标注系统   IViE标注系统是基于AM理论(将自主音段音系学与节律音系学结合起来的语调研究的理论框架)和ToBI(Tones and Break Indices)语音韵律标注系统建立的。在ToBI标注系统提供的两种短语边界表示方法(“H%”和“L%”)的基础上,IViE标注系统有两处主要改进:   IViE标注系统在ToBI基础上新增了表示方法“%”用来划分无音高运动时的语调短语边界,这个符号使得转写标音更明显,更易操作。例如,IViE标注系统中,若重读音节的语调由低目标值上升到高目标值,可表示为L*+H%,而在ToBI标注系统下,则需表示为L*+HL-H%;   更准确易懂,较好地解决了语音标注需求量增加带来的问题,但ToBI标注系统的设计主要面向专业人士。   IVi

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档