- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
苏杰《三重门》作者身份的语言学分析
苏杰:《三重门》作者身份的语言学分析
《三重门》作者身份的语言学分析? 苏杰? 韩寒被质疑有人代笔,到现在已经快两个月了。其间断断续续,我大致看了两方的主要论辩文字。方舟子是我一直很敬佩的人。与方舟子一起质疑韩寒的麦田、彭晓芸等人,他们的理性和克制,也给我留下了很深的印象。质疑者有不少分析论证,有相当强的说服力。相比之下,韩寒的表现却令人大跌眼镜。由于手头的工作比较忙,一直没时间看韩寒父子的相关作品,不过,我心中的天平,已经向质疑者一方倾斜了。? 新的学期开始了。这学期我有一门课是“西方校勘学概论”。“校勘学”英语是textual criticism,也可以译为“文本鉴别学”。我打算把质疑韩寒事件作为一个个案与同学们分析讨论,于是找来《三重门》和韩仁均的有关作品,从质疑者的立场出发,进行比对分析。结果出乎我的意料。我心中的天平,开始向韩寒一方倾斜。? 谁都无法证明?? 面对代笔质疑,韩寒晒出手稿。质疑方说,手稿太干净了,不像创作稿;所以,即使笔迹是韩寒的,也不能证明文字是他撰写的。这种说法也不是没有道理。? 最近,韩寒在接受《中国新闻周刊》采访时说,这是“谁都无法证明的东西”,“如果这个事情可以成立的话,那这就意味着,全中国只要看哪个作家不顺眼,然后就可以说,你的文章不是你写的,那这个作家就百口莫辩。作家这个行业很特殊,因为他们都是在家里写,对于一个作家来说,这种质疑成立的话,那这个作家就不用混了,我觉得他就直接完蛋了,他的职业生涯就不用继续了”。? 这未免有点危言耸听。文本的作者身份,真的没有办法证明吗?? 当然不是。近几十年,欧美各国有一个方兴未艾的边缘学科,叫“司法语言学”( Forensic Linguistics)。司法语言学家的主要工作之一,就是通过语言分析、文本鉴别,确定文本的作者身份。下面我先参考马尔科姆·库尔撒德(Malcolm Coulthard)的经典论文《个人语言特点和作者身份认定》(Author Identification,Idiolect and Linguistic Uniqueness),对这一方面的理论和实践作一简单的介绍。? 语言指纹? 语言学家解决作者归属问题的理论出发点是,在操同一种语言的庞大人群中,每一个个体的言说和写作,都有其独一无二的特点,英语叫idiolect。? 每一个人都有自己多年建立起来的一个常用词汇集合(或者叫常用词表)。这个词表,与其他人所建立起来的常用词表可加以区分。这种区分,不仅表现为每个人的词表所包含的词语项不相一致,还表现为每个人对不同词语项有着不同的偏好。? 打个比方。大卖场里的货物不下几万种,理论上我们都是可以选购的,也就是说,这是open selection;但我们经常买的,也就不满一百种吧。这每一种选择(selection),都是出于我们的偏好和习惯,体现了一定的个性。单一的“选择”(selection),譬如有人每个月都会买雀巢咖啡,区分度不是很大,因为有不少人也会有同样的“选择”。可是,如果多个“选择”形成一个集合(co-selection),那么区分度就会很大,甚至是独一无二的。譬如经常买雀巢咖啡+涪陵榨菜+中华牙膏+绍兴黄酒+弥猴桃+喜跃猫粮的,整个大卖场记录里,恐怕就只有一个家庭。? “因而虽然从理论上讲,任意说话者/书写者在任意时间可以使用任意的词语,但在实际上会有典型性的个人化的好尚拣择。这意味着应该有可能设计出一种‘语言指纹’的识别方法,换句话说,特定说话者/书写者在语言上所形成的印象是可以用来进行身份辨认的,就像签名一样。”? 把基于co-selction的个人语言的独一无二的特点(idiolect)称作“语言指纹”,这很形象。但是,我们也应注意“语言指纹”与生理指纹之间的重要不同。? “生理指纹的价值在于,每个样品都是可以通过比对进行同一认定的,也是穷尽性的,也就是说,包含了对于个体身份进行同一认定所需要的所有信息。相比之下,语言样本,即使是很大的语言样本,也只能提供相关个人语言特点的非常局部的信息。”因而我们目前还不可能建立一个“语言指纹库”,并在此基础上对争议文本进行比对检测。? 虽说如此,但“语言指纹”的识别方法也不是全无作为。因为实际案例中常常有一些线索,可以将所要比对的文本样本局限在几个人(通常是两个人)之间,从而大大地简化了问题。实践中有一些通过“语言指纹”对作者身份做出同一认定的著名案例。? UNA炸弹客案? 美国有一个人,在1978年至1995年之间,每年一次,向多个地方邮寄炸弹,先后炸死3人,炸伤23人。最初看不出有什么规律,几年后FBI注意到,受害人都是在大学或者航空公司工作,因而取“大学”(University)和“航空”(Airli
文档评论(0)