论语言科学与语言技术.docx

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
论语言科学与语言技术 (南京师范大学) 提要:本文阐释了依据当代科技进步和人类社会发展 所提出的语言科技新思维。“语言科学”主要指基础性的描 写语言学和理论语言学; 写语言学和理论语言学; “语言技术”主要指应用性的计算 语言学。语言技术可划分为文本处理技术和系统模拟技术。 虽然计算语言学的关键任务是“教计算机学说话”,但研究 语言的可计算性和利用计算机工具研究语言这两者本质上 是相 通的,只是前者探索的是适合于“人一机对话”的语 言能力,而后者讨论的是适合于“人一人对话”的语言规 则。语言学家只有了解了语言系统的计算机模式化要求, 才有可能将研究目标对准语言工程。人类语言的本质共性 是语义性。依据语义语法学理论,建构计算机所需要的元 语言系统(语言基因图谱分析工程)和语义结构网络(语 言能力移植工程),才能穿过智能机研制中的瓶颈。当代信 息科技的发展趋势表明,语言研究对象的语义性和语言研 究过程及其成果的技术化将成为21世纪的语言学精神。关 键词:语言科技语言系统模拟语言基因分析语言能力移植 语义语法学 一、语言科技”新思维的提出 虽然计算机设计的初衷是缘于数值计算,但是英国数 学家图灵()在《机器能思维吗?》(1950) —文中已经预 见到计算机和自然语言将结下不解之缘,并且提出检验计 算机智能的最好方法就是对语言信息的处理能力。1977年, 费根鲍姆(Feigeaum)提出知识工程,计算机信息处理出 现了从“数据世界”向“知识世界”的转移趋势。知识世 界的载体是语言符号系统,语言信息处理的需求促使语言 研究过程和语言研究成果的技术化趋势日益明显,当代语 言学已凸显出“语言科学”与“语言技术”的二分互补格 局,由此我在《南京师范大学语言科技系建设发展规划》 (XX年2月)中提出“语言科技”的新思维。“语言科学” 主要指基础性的描写语言学和理论语言学。“语言技术”主 要指面向信息处理的应用语言学或计算语言学,其研究任 务可划分为“文本处理技术”和“语言模拟技术”。简而 言之,语言文本处理技术是通过编辑和编程,将印刷文本 转化为可供计算机使用的电子文本的技术。语言系统模拟 (Simula tion)或者语言能力仿真(emulat ion)技术是 通过算法和编程,将自然语言的理解和生成能力输入计算 机的技术。获得语言能力的计算机可以实现“人一机对话” 而成为名实相符的“电脑”。为研制智能机服务的“语言 系统模拟”,可比喻为“语言基因图谱分析工程”和“语言 能力移植工程”。强调语言研究的技术化,并非忽视传统语 言学研究存在技术性的一面,例如实验语音学和方言语音 调查等。之所以以往未能突出语言研究的技术化,其原因 在于一一除语音研究可借助声学技术设备以外一一语言研 究的绝大多数领域还一直没有相应的实验性技术设备。 虽然当代语言学家不可能也不必要都转向计算语言学 研究,但具有一定的语言信息处理意识却非常必要。早在 1964年1 1月,美国科学院语言自动处理咨询委员会就在 《语言与机器》的报告中明确指出:机器翻译遇到了难以 克服的s emanticbar rier (义障)。然而这一警告,除了致 使机器翻译研究热的暂时消退以外,并没有引起语言学界 的足够重视。1982年,日本制订了一个为期10年面向AI (人工智能)的“第五代计算机”即智能机的研制计划, 其中包括自然语言处理装置。1992年结束时,只部分达到 了预定目标。随后又公布了另一个为期10年的“真实世界 计算机(RWC)计划”即“新信息处理技术计划”。(许万增 19 96, -62)据说,90年代后期日本不得不宣布暂停研制, 其根本原因就在于未能穿过语言研究的“瓶颈”。自然语言 处理装置的任务无法实现,计算机谈何“真实世界”或 “人工智能”。时至今日,这一 “义障”仍然没有跨越。在 《新世纪将对人类产生重大影响的十大科技趋势》(新华社 北京2000年12月30日电)的报道中,列出21世纪的“认 知神经科学领域”和“信息技术领域”,并分别提出来“探 索意识、思维活动的本质”和“计算机向智能化方向发展” 的任务,然而没有语言科技领域的合作一一关键是认知语 义结构网络研究的根本性突破一一则不可能实现。 无论从手段还是就目标,对准自然语言处理的当代语 言学研究,其性质都应界定为“语言科技”。“语言科技” 的内涵是以理论研究为指导,以描写研究为基础,以应用 研究为枢纽,促使语言研究向计算机应用、数学、认知科 学和现代教育技术领域延伸,沟通文理工相关学科以实现 语言研究过程及其成果的技术化;“语言科技”的外延表现 为语言工程科技、语言教育科技和语言研究科技。语言学 和计算机科学等学科相结合的“语言工程科技”,研究领域 是“人一机对话”,其目标主要是自然语言能力的模拟。语 言学与现代教育技

文档评论(0)

ggkkppp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档