- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从NLG到机器新闻写作 摘 要:随着人工智能技术在全行业的渗透,机器新闻作为人工智能在传媒业的一种应用越来越受到学界和业界的关注。本文梳理了机器写作的发展过程,分析机器新闻的优缺点;从机器新闻发展的现状入手,对机器新闻的发展进行反思,也对未来机器新闻的发展提出一些建议。 关键词:机器新闻;人工智能;人机协同 中图分类号:G20 文献标识码:A 文章编号:1672-8122(2017)10-0018-02 机器新闻,被认为是人工智能时代的产物。有研究者将机器新闻分为广义和狭义两个方面。广义的机器新闻是指人工智能技术在新闻写作、采访、编辑等新闻活动中的具体运用;狭义的机器新闻是指基于数据统计和机器学习,运用算法,从可识别的数据中提取具有新闻价值的信息,形成新闻报道角度,自动选择语词样本、新闻报道模板生成的新闻故事[1]。广义的机器新闻运用非常广泛,早期的Google News就是通过聚合算法进行新闻首页的自动更新和推荐。这种形式可以看作是机器新闻的雏形。 狭义的机器新闻,可以概括为机器新闻写作。国外的研究者用一些不同的名称来表示这种过程,比如计算新闻(computational journalism)定义为用来补充新闻的责任功能的算法、数据和社会科学知识的组合[2]。本文讨论的是狭义的机器新闻,即机器新闻写作。 一、从NLG到机器新闻写作 (一)机器新闻写作技术的发展 机器新闻写作的核心在于自然语言生成(Natural Language Generation)技术。自然语言生成是指基于非语言输入自动生成自然语言文本的过程[3],是人工智能和计算语言学的分支。 机器写作可以追溯到20世纪五六十年代对机器翻译和生成上下文无关文法句子的研究。70年代,在游戏等领域已经开始应用机器写作,利用该技术生成游戏文本。80年代,文本规划的概念被提出,机器写作有了更大进步,可生成段落甚至篇章。到90年代,基于模板的文本生成算法被提出,文本规划器和语言实现器的出现使得机器写作在军事、气象等更多领域得到了运用。 自然语言生成系统的工作流程与新闻写作的基本模式有许多地方是相符合的[4]。但是直到21世纪初,机器写作才进入新闻领域,并且投入市场。2006年,Thomson Reuters集团网站宣布使用算法在网站自动编写财政新闻。 2007年,美国第一家利用机器生产新闻的公司――StatSheet诞生。2011年公司改组并改名为Automated Insights。它的主要产品Wordsmith是一个自然语言生成平台,使用基于数据、定量分析和关于写作风格规则的人工智能系统来生产故事。2015年10月,平台允许用户通过上传自己的数据和模板来创作。现在,Automated Insights公司的具体业务涉及新闻报道、数据分析、写作程序开发等。用户可以直接在电子表格中通过应用程序制作Wordsmith内容。根据Automated Insights官方网站的统计数据,2016年该平台共生产了超过15亿篇文章,成为世界上最大的内容生产商。 与Wordsmith同年进入市场的是Narrative Science公司。它的主要产品为Quill。目前,该公司的重心放在了金融服务提供商等企业客户上。 (二)国内机器新闻写作的应用 国内企业在机器新闻写作领域也做出了一系列探索与尝试。腾讯推出“Dream Writer”,在2015年9月10日发布了第一篇机器写作新闻《8月CPI同比上涨2% 创12个月新高》。这篇稿件从国家统计局中获取数据,涵盖高级统计师的评论建议,用时仅为一分钟。目前,Dream Writer写作的主要领域是财经和体育。 同年11月7日,新华社推出“快笔小新”机器人,为体育部、经济信息部和中国证券报部门提供新闻稿件。 2016年,由北京大学和今日头条合作研发的Xiaoming bot在里约奥运会期间发稿超过450篇[5]。Xiaoming bot主要应用在体育赛事当中。技术上,它是首个基于文字直播数据进行新闻生成的系统,并在语言情感自适应等技术上实现了突破。还能够图文自动关联发稿,基于大量的图文数据库,采用机器学习算法,学习图文语义匹配模型,为文本自动挑选合适的图片。 DT稿王是第一财经媒体实验室开发的一款自动化的新闻写作工具,2015年5月正式推出。它具有信息采集、语义分析、有哪些信誉好的足球投注网站、联想等功能,通过与DT稿王的自动写作功能连接,能代替作者完成简单而庞大的片段写作。 南方都市报社的写稿机器人“小南”也在2017年1月18日正式上岗,首篇文章为300余字的春运报道。在数据自动抓取完成之后,这篇报道的生成只用了不到1秒的时间。与前面提到的新闻写作机器人有所
文档评论(0)