- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自然语言处理 定义:采用计算机技术来研究和处理自然语言。 计算机对自然语言研究和处理,一般应经过三个过程: 1,把需要研究的问题在语言学上加以形式化,使之能以一定的数学形式,严密而规整地表示出来。 2,把这种严密而规整的数学形式表示为算法,使之在计算上形式化。 3。根据算法编写计算机程序,使之在计算机上加以实现。 自然语言学是介乎语言学、数学、计算机科学之间的边缘性的交叉学科。 自然语言处理的原理 机器翻译的原理与发展阶段 术语数据库的作用与工作原则 数理语言学的研究对象 统计语言学的统计 自然语言处理运用到的语言理论主要有哪些? 语料库的类型与作用 美国著名语言学家乔姆斯基,创立了转换生成语法,其核心就是语言能从有限的要素和规则演变出无限的句子;语言分深层与表层,深层结构靠规则向表层结构有规律地生成: “我们这里要考虑的是各种生成句子的装置,它们又以各种各样的方式,同自然语言的语法和各种人造语言的语法二者都有着密切的联系。我们将把语言直接地看成在符号的某一有限集合V中的符号串的集合,而V就叫做该语言的词汇……我们把语法看成是对程序设计语言的详细说明,而把符号串看成是程序。” (一)机器翻译系统 自然语言处理系统的研究首先是从机器翻译系统做起的。 1,草创期(20世纪40-60年代) 1946年,美国宾夕法尼亚大学埃克特(.P.Eckert)和莫希莱(J.W.Mauchly)首创世界上第一台计算机,1949年美国洛克菲勒基金会副总裁韦弗(W.Weaver)首创机器翻译。 工作原理:A语言与B语言之间经过一种“中介语言”,又叫“通用语言”、“中间语言”来实现。 机器翻译相当于读码解码,实现上是以查询词典的方式来实现词对词的机器翻译。 2,复苏期(20世纪70年代) 美国学者英格维(V.Yingve)提出机器翻译的过程: 用代码化的结构标志来表示原语文句的结构; 把原语的结构标志转换为译语的结构标志; 构成译语的输出文句。 句法分析成为机器翻译工作的中心。 复苏期的代表产品是法国格勒诺布尔理科医科大学自动翻译中心的机器翻译系统。 这时研究者还认识到,机器翻译中必须保持原语和译语在语义上的一致。从而语义分析比句法分析日益引起人们的重视。 3,繁荣期(20世纪70年代——) 产品的实用化、商品化。 工作原理: 1,直译式:词对词;句法直译式、语义直译式。 2,转换式:在原语和译语之间设定能在一定程序上表现语义关系的中间表达式,再通过中间表达式来完成句法和语义的进一步转换。 3。枢轴式:把语言规则普遍化,成为不依赖任何具体语言的普遍意义,形成“枢轴”,由“枢轴”来承担“中介语”的作用。 这时的机器翻译都是“基于规则”的机器翻译。 近年来出现了“基于经验”的机器翻译。所谓基于经验,就是指基于统计,基于实例。它是在大型语料库的基础上形成的。 演示sxd软件与sms软件。 一种语言中的任何一个句子都有可能是另外一种语言中的某几个句子的译文,只是这些句子的可能性各不相同,机器翻译就是要找出其中可能性最大的句子,也就是对所有可能的目标S计算出概率最大的一个作为源语言T的译文。 “选优式”的做法。 这种观点的理论依据:人类并不通过做深层的语言学分析来进行翻译,而是首先把输入的句子正确地分解为一些更小单位的短语,接着把这些短语翻译成其他语言的短语,最后再把这些较小单位的短语构成完整的句子。在短语的翻译中是通过“类比”的原则来实现的。 机器翻译要做的事就是在机器中存储一些实例,并建立由给定的句子找寻类似例句的机制。这就是基于实例的机器翻译方法。 基于实例的机器翻译要研究的主要问题: 1,正确地进行双语自动对齐:在实例库中要难准确地由源语言例句找到相应的目标语言例句,并实现对应。 2,建立有效的实例匹配检索机制:语言单位不能太小,愈小歧义愈多。因此,它非常强调尽量多地储存短语实例。 3,根据检索到的实例生成与源语言句子相对应的译文。 例子: 金山词霸:词库、释义库、音库 (二)自然语言理解 人机对话: 中国社科院语言研究所“RJD-80型汉语人机对话系统” 中国科学院心理研究所“机器理解汉语-实验I:CLUS系统” 中国社科院语言研究所“TK-84型汉语人机对话系统” 东北工学院建立“中文句子及文本理解系统CTUS” …… (三)情报自动检索 情报自动检索包括的内容; 1,文献情报的采集; 2,文献情报的加工处理: 3,文献情报的编排和存储: 4,检索服务: 情报检索系统的评测标准: 1,查询效率:查全率;查准率: 2,运行效率:机时;存储空间;费用 运用范围: 1,自动生成文摘; 2,自动编制索引; 3,自动抽取情报资料的主题词; 日常生活中随时都可接触到情报索引(信息检索) 学校查成绩; 银行
您可能关注的文档
最近下载
- 浙教版九年级上册科学 第1章 物质及其变化 单元测试卷(含解析).pdf VIP
- 互文成语探析.docx VIP
- 三体系内审检查表.pdf
- 2025年信息安全工程师职业资格考试试题及答案.docx VIP
- 2025年安徽省高中学业水平合格考数学试卷试题(含答案).docx VIP
- 2025山东济南市工程咨询院招聘10人笔试模拟试题及答案解析.docx VIP
- 2025年安徽省普通高中学业水平合格性考试地理(含详解答案) .pdf VIP
- 2025山东济南市工程咨询院招聘6人笔试模拟试题及答案解析.docx VIP
- 2025年广告传媒行业新兴媒体在汽车行业的品牌推广策略分析.docx
- 医疗设备保修合同范本10篇.docx VIP
文档评论(0)