写稿机器人“抢”饭碗?

renwen 提交于 周三, 2019/03/27 - 00:37
分类

写稿机器人“抢”饭碗?

来源:广州日报 日期:2018-11-20

 

  智能辅助创作系统“抓取”数据 构建新闻知识图谱

  全球人工智能的发展日新月异,AI+工业、AI+医疗、AI+制造业、AI+教育……可谓百花齐放,随着互联网的不断演进,移动智能终端的高度成熟,信息“爆炸”时代已悄然来到大众身边,在这个海量信息的背后,衍生了一种新的“媒体人”,它们不是人类,而是“机器人”。

  今年10月,广州国际人工智能产业研究院正式入驻广州市南沙区,研究院携16支人工智能领域高端人才团队率先进驻南沙。重点实验室中,有一支专注于人工智能和自然语言处理(NLP)在资讯内容领域应用的AI研发团队——云天弈,也就是大家早有耳闻的“写稿机器人”。

  智能机器人除了能下围棋,还能写稿?早在2009年,美国棒球大联盟就首次启用了智能机器人StatsMonkey完成了比赛稿件的撰写,而2015年,国内互联网企业腾讯上线了写稿机器人DreamWriter,截至目前该系统已运作近三年时间。人工智能已慢慢融入当下的内容创作, “写稿机器人”的“智商”究竟有多高?人工智能又能为媒体行业带来怎样的变化?

  未来,随着物联网技术的深入发展,在万物互联的大背景下,这一领域的专家更对全媒体记者描绘了一个更“科幻”的场景。

  智能写稿机器人数量不断壮大

  说起智能写稿机器人,最早要追溯到2009年,美国棒球大联盟首次用智能机器人StatsMonkey通过统计分析,识别比赛期间的重大事件并总结整体比赛动态,自动编写了一篇体育报道。

  而到了2015年,“写稿机器人”才在行业中真正爆发,国内外各大媒体开始“试水”写稿机器人。据了解,在国外,《纽约时报》利用Blossomblot系统筛选文章向社交网站等平台推送;《洛杉矶时报》智能系统专注处理地震等突发新闻……在国内,2015年腾讯旗下名叫Dreamwriter的写稿机器人正式上线,发布了一篇名为《8月CPI涨2% 创12个月新高》的报道。随后,国内媒体也陆续“尝鲜”,新华社推出机器人写稿项目、阿里巴巴联合第一财经推出“DT稿王”,今日头条推出了“xiaomingbot”……在内容生产领域,传统媒体、移动互联网媒体纷纷跟进这股技术热潮,试图将写稿机器人引用到日益大量的新闻报道、内容生产以及分发的过程中;在技术领域,人工智能业界越来越多的研究团队投入到“写稿机器人”的研发当中。

  揭秘写稿机器人

  那么,“写稿机器人”是如何“写”出一篇稿件的?国内AI新闻实验室云天弈CEO金利杰博士在接受记者采访时表示,“写稿机器人”只是让外界更容易理解的称呼,在业内他们更愿意将这类人工智能系统称为“智能辅助创作系统”,这也是更为贴切的说法。

  以 “小弈写作”平台为例,它从海量资讯中迅速提炼内容线索,根据用户输入的关键词,一键生成文章框架,并从多个维度自动评判内容价值。用户可以通过“系统热门话题”列表搜寻当前最热的新闻话题,一键生成相关主题文章;也可以通过输入关键词,让“小弈”写一篇命题作文。

  全媒体记者了解到,“写稿机器人”与传统新闻采写的模式不同。“写稿机器人”每天自动“抓取”各类海量信息,当记者和编辑需要某个新闻内容时,输入关键词,系统会根据关键词先“抓取”上万条来自各种渠道的相关信息,并生成初稿。在“小弈写作”平台上,国际资讯方面的活跃数据横跨两年,整体更是存储了大概5~6年的资讯,这也侧面反映了写稿机器人平台背后拥有的海量数据。事实上,这也是作为人工智能平台的必备条件——只有拥有足够大的数据储备,机器人才能进行分类和学习,从而构建事件的知识图谱。

  当然,不同的人工智能平台有不同的算法与思路,像云天弈的AI系统并非完全依靠机器人写出一篇完整的稿件,“绝大部分稿件都是由编辑进行后期加工和润色”。

  “机器人”主要集中

  在体育、财经类新闻报道

  腾讯媒体研究院发布的研究内容指出,“写稿机器人”总共可分为三类,都依赖自然语言处理技术。第一类是基于模板的写作,即使用一个文章模板,将数据库中的结构化信息(包括具体数字、百分比等)填充进去。第二类是提取后整理,即对包含无用信息的长自然语言文本进行分析,提取文章中的关键信息,重新组织语言后输出。第三类是完全依靠机器自动生成,一般是通过训练语言模型,对语言进行数学建模,然后不使用原始文本,而是通过人工智能的方式逐句地生成算法认为“最能够体现原文含义而且看起来像一句话”的文字。

  据了解,当下众多的写稿机器人,或者说大部分“智能辅助创作系统”都以第一类模板写作和提取后整理为主。其较为专注和擅长的写作领域主要是体育类、财经类和灾难类新闻。这几类新闻的共性在于,其内容大部分都依靠数据“说话”。以NBA赛事新闻为例,大部分构成是比分+队员的得分表现,也就是数据分析为主的新闻类型。因此,在“机器人”的数据库里会有这类新闻的模板。同时,系统通过人工智能具备的深度学习能力,在撰写这类新闻的同时,分析记者/编辑是如何处理的,从而得到更大量的数据,建立更多种多样的模式。

  全媒体记者留意到,腾讯Dreamwriter所撰写的财经类新闻,大部分都是关于某只股票股价升跌的即时新闻。据Dreamwriter负责人刘康表示,Dreamwriter最初诞生时要解决的最核心的问题是“财经新闻的生产能力满足不了内容的需求”。

  而云天弈的“小弈写作”是基于广泛题材的智能资讯写作系统,是第二类和第三类的结合,其写作范围不局限于靠数据“说话”的新闻领域。据测算,一个小型的编辑团队,在“小弈写作”智能创作平台的帮助下,工作效率可以提升五倍,“传统记者/编辑一天大概可以写两篇长篇幅的新闻,而在‘小弈写作’的配合下,一天可完成十篇左右”。在整个智能辅助创作过程中,系统不但能帮助选题,还能“生成”与记者/编辑想写内容的相关度极高的文章框架, 可大幅简化写作流程,缩短成稿时间。

  今年1月,机器人“小弈”在GET资讯App“上岗”。一般而言,传统新闻资讯的写作,编辑的工作量占80%,机器占20%。目前GET资讯团队可以做到机器完成65%,人工完成35%的程度,未来希望能实现机器完成80%,编辑只负责20%。“在我们看来,能完全由机器生产并自动发布的内容只占很少部分,因为任何媒体都需要监管和内容审核。未来,新闻资讯平台的人力也将主要集中在这部分。然而,降低人力成本、提高时效性也是必然的,例如以往30人团队完成的工作,现在由10人或更少人的团队也能完成。”金利杰表示。

  据国内大型内容资讯平台的阅读量数据统计,在“小弈写作”的帮助下,GET资讯撰写的不少新闻的阅读量能达到几万到十几万,有的甚至上百万。

  …

标签