- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 13 卷 第2 期 2017 年 2 月
迎接自然语言处理新时代
李 航
华为诺亚方舟实验室
关键词 :
自然语言理解 自然语言处理 特邀专栏作家
人类的语言具有什么特性? 下面是几位最权威 些语言特性的研究作出了卓越贡献,他们的论述是
学者的看法。 对这些特性的最佳诠释。
语言是草根现象,它像是维基百科,聚集了数以 本文从语言的特性出发,讨论为什么让计算机
十万计的人的贡献。当人们要找到更好的表达自己思 理解人类语言 (自然语言)是极其困难的,提出自
想方式的时候,就发明了术语、俚语、新说法,其中 然语言处理研究应该采取的策略。
一部分积累到语言中,这就是我们得到语言的过程。
·
——史蒂文 平克(Steven Pinker) 为什么自然语言理解很难?
如果语法没有递归结构,那么它将变得不可接
受的复杂。因为它有了递归的工具,所以它能够产
生无穷多的句子。 自然语言理解
· 你说一句话,如何判断别人 (或者计算机)是
——诺姆 乔姆斯基(Noam Chomsky)
我们通常的概念系统的大部分都具有比喻性。 否真正理解了你的意思?这是一个难解的问题。到
我们的思考方式,我们所经历的,我们每天做的,都 目前为止,自然语言理解主要有两个定义,一个是
与比喻有关。 基于表示的,一个是基于行为的。对于前者,如果
·
· 你说 “哈利 波特”,别人把它联系到了大脑中的
——乔治 雷可夫(George Lakoff)
当一个人听到或看到一句话的时候,他使用自
己所有的知识和智能去理解。这不仅包括语法,也
包括他的词汇知识、上下文知识,更重要的,是对相
关事物的理解。
·
——特里 威诺格拉德(Terry Winograd)
语言看来是人的认知向外界环境扩展的核心手
段。语言的进化也许就是为了扩展我们的认知与外
界环境的积极交互。
·
——安迪 克拉克(Andy Clark)
总结起来,不完全规则性、递归性、比喻性、
知识关联性、交互性是人类语言的主要特点。这些 图1 人通过语言给出命令,机器人若能正确执行,
特性密切关联,体现了语言的本质。上述学者对这 就认为它可以 “理解”语言
57
专栏 第 13 卷 第2 期 2017 年 2 月
· 一个趋势是语法变得越来越简单。比如,英语中
哈利 波特的概念 (表示),那么就认为他理解了
你的意思。而对于后者,如果你说 “给我拿一杯茶 以前说 “We shall”、“I shall”,现在逐渐变成 “We
来”,别人真的按你说的做了 (行为),就认为他理 will”、“I will”。另外,受其他语言影响,语法也会
解了你的意思 (图1 )。 发生变异。比如,非洲美国裔英语 (也被称为黑人
现
文档评论(0)