课件:常见语料库使用入门.pptVIP

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
公共语料库检索 26 公共语料库的检索说明 ——以BCC语料库为例 句型 THANK YOU SUCCESS * * 可编辑 公共语料库检索 27 公共语料库的检索说明 ——以BCC语料库为例 定界 公共语料库检索 28 公共语料库的检索说明 ——以BCC语料库为例 构式 公共语料库检索 29 公共语料库的检索说明 ——以BCC语料库为例 构式 公共语料库检索 30 公共语料库的检索说明 ——以BCC语料库为例 自定义有哪些信誉好的足球投注网站 公共语料库检索 31 公共语料库的检索说明 ——以BCC语料库为例 检索结果 公共语料库检索 32 公共语料库的检索说明 ——以BCC语料库为例 历时检测 公共语料库检索 33 公共语料库的检索说明 ——以BCC语料库为例 检索统计 公共语料库检索 34 公共语料库的检索说明 ——以BCC语料库为例 筛选 查看上下文 如果想对检索结果进一步筛选,可以使用筛选功能,对检索结果进一步剔除或者仅仅保留符合筛选检索式的实例。 公共语料库检索 35 公共语料库的检索说明 ——以BCC语料库为例 下载 高级设置 公共语料库检索 36 公共语料库的检索说明 ——以BCC语料库为例 句法树 注意检索格式 多摸索多使用 依据调查需要 设置调查项目 学点儿统计学 学点编程语言 公共语料库检索 37 第三节 个人语料库创建 个人语料库创建 38 材料/工具准备阶段 1、电脑、办公软件 2、语料的选取标准 3、语料库大小设定 4、已收好集的语料 5、采取txt格式保存 生语料库 熟语料库 加工标注 词性标记 句法标记 词义标记 篇章指代标记 韵律标记 …… 若只是要词频数据,则生语料库足够,word/wps或txt记事本都可以建立word/wps的“查找替换”工具即可, txt记事本的“编辑-查找”工具也行。 “宏” 个人语料库创建 39 熟语料库加工阶段 需要工具/材料: 1、电脑、办公软件 2、语料库加工工具 2、语料的选取标准 3、语料库大小设定 4、已存的生语料库 5、采取txt格式保存 个人语料库创建 40 熟语料库加工阶段 可以采用这个工具 双击 打开软件 个人语料库创建 41 熟语料库加工阶段 需要说明的是:自己找到的语料库必须是已经集中放好到“语料库”这样的文件夹中。 点击 打开文件 个人语料库创建 42 熟语料库加工阶段 打开 “语料库”文件夹 个人语料库创建 43 熟语料库加工阶段 比如,选择 “痴人”这个语料 个人语料库创建 44 熟语料库加工阶段 然后,点击 “切分标注”即可 个人语料库创建 45 熟语料库加工阶段 然后,点击全选, 复制到新建的一个txt文档, 保存文件,得到一个熟语料 然后,把新存的那个熟语料文件 保存到一个新建的“熟语料库”文件夹中 依据此法,逐一对生语料库中的单个语料进行“词性标注”,然后逐一保存到“熟语料库”中。这时,初加工的自建熟语料库的完成了。 个人语料库创建 46 语料库的检索阶段 双击该软件 进入界面 推荐使用的软件AntConc 个人语料库创建 47 语料库的检索阶段 接下来,英语不好的话,可以设置语言,点击“Global Settings”菜单,找到“Language Encodings”,点击该菜单,再点击右手边的“Edit”,这时会弹出一些选项,选择“Chinese Encodings”,在选择该项目右边的“Chinese(euc-cn),最后点击右下方的“Apply”。 个人语料库创建 48 语料库的检索阶段 这时,会自动回到 这个界面 个人语料库创建 49 语料库的检索阶段 点击“File”选项,再选择“open files”, 然后得找到“熟语料库”文件夹,点击。 个人语料库创建 50 语料库的检索阶段 选中全部语料, 然后点击“打开”。 个人语料库创建 51 语料库的检索阶段 所有“熟语料库”中的单个语料都出现在了Antconc软件的左侧栏中,接下来,我们就可检索了。比如,你检索、研究的是“很+X”,那么由于转成了熟语料库,检索式应为“很/d */a”(很接形容词)、“很/d */v”(很接动词)等等,然后依检索式进行检索。 需要说明的是“很/d */a”词与词之间得空一格,就像英语中“I have ”得空一格。 个人语料库创建 52 语料库的检索阶段 比如说,检索“很/d */a”, 在检索栏中写上“很/d */a”点击start 就出现了 个人语料库创建 53 语料库的检索阶段 Concordance Hits 代表的是出现“很/d */a”也就是(很+形容词)出现的次数,我们可知出现了“46”,那么这就意味着,很接形容词在我的这个语料中出现了46次。依据此法可检索“很/d */v”的次数。 *代

文档评论(0)

iuad + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档