智能新闻时代已经来临
汤开智认为,人工智能在经历了异想天开的阶段之后沉寂了一段时间,到了2006、2007年时,随着社交媒体的数据量极大增加,机器学习极速发展,使得很多人工智能的规则、模型可以通过很多的数据去验证,让人工智能慢慢地又活过来,并且在各个行业和领域开始彰显价值。
新闻写作领域也迎来了人工智能发展的机遇。汤开智表示,新闻写作领域面临的困难主要有三,一是有见解、有内容的文章需要花费时间完成;二是现在媒体记者被大数据包围着,对数据的运用、快速解读的要求越来越高;三是写作具有自由发挥、天马行空的特性,而商业新闻写作需要的是效率和特有的模式,因此人工智能可以用来协调两者,解决优化问题。
DT稿王,助力新闻写作
DT稿王是阿里和第一财经合作做的项目,是一个基于接收数据生产新闻稿件的系统。借助算法在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户,帮助媒体机构、商业机构和写作爱好者新闻生产的数据化和智能化。举例来说,股市有很大的信息量,是以秒级的数据,价格成交量、资金流动量,很多都在这里面发生。对于这样的一个场景,对于股民或者二级市场的投资者来讲,他们想知道到底有什么值得关注的事情发生了,这些发生的事情是由什么原因造成的?可能对将来投资的走势有什么影响。这是有一个明确的目标,可以用数字、规则的方式帮助我们实现。
汤开智还对DT稿王的应用案例做了分享。第一个案例是抓取统计局主要数据部分做评价,包括CPI的上升、下降,对经济的影响是什么样的层次等,加上最近一段时间经济学家对整个市场的评价,就变成一财的消息稿或者解读稿。现在每个月都在发这样的稿件。第二个案例是看数字说话。给你一堆表格,你能够把这个表格用一句话或者一段话给总结出来。这样的场景在整个的从数字到内容之间是比较多的。第三个案例是监控所有上市公司发布公告,从公告里面产生相应的内容,南都电源6月14号发布了公告,同时监控所有股市的异动,哪些股票快速下跌等等。我们刚刚监测到这个公告的发布,下午开盘时就出现股价快速的拉升。这样的两个事情通过数据的关联,很容易就能够形成一种内容创新的思路。合在一起就可以形成一种新的稿件。
DT稿王的未来:基于人工智能的写作助手
谈到愿景,汤开智从产品、人工智能和客户群三个层面分享了他的观点:
第一,在产品层次,DT稿王会不停地迭代。第一阶段我们需要对接市场上商业写作的场景。第二阶段,我们希望变成开放式的写作工具,大家可以去写插件、写逻辑。在这个过程当中,可以生成各式各样的稿件。第三部分,希望是变成写作的助手,帮助到很多自由写作,但是又有商业目的的写手。
第二,从人工智能的角度是有三个阶段,第一个阶段是描述性的逻辑,主要是以CM WEB为代表的,把很多实体之间的关系用一种很简单的方式描述出来。我们现在这个阶段做得很多。第二个阶段是第一阶逻辑。这个可以嫁接很多跨界、跨域逻辑之间的关系,能够进行推理。第三阶段是基于深度学习或者机器学习,描述的是非线性的逻辑,一些看似完全没有关系的事情,可以通过数据、非线性的模型建立起来。
第三,从客户群来说,我们希望刚开始是专业的媒体机构,甚至包括特别专注在某个领域的自媒体可以用这样的工具。第二是很多商业机构,比如说写分析报告的商业机构。第三是喜欢写作的个人。不期待能写小说,能写日记或者散文。但你能写对某一个电商品牌的评论,写的以后很多人原来来读或者搜索引擎愿意搜索,然后你写的文章在网上是有流量的。这是比较有流量的事情。
我们还会生成很多小的机器人为不同人群的写作提供服务。