自从DT稿王上线以来,每天都生成成百上千的稿件,这些稿件也被很多的媒体渠道所使用。机器稿件对快速获取信息有用,但是读者的感受是比较死板枯燥。最近在翻一财网的机器稿件的时候,发现一个极其有趣的现象。

如下图所示,是一条2016年6月的CPI解读新闻,共获得了75条评论:

 

 

再翻一下评论的细节,很多货真价实的内容:

 

我们为什么对这个感到惊讶呢?因为这篇稿件完全是由写稿机器人“DT稿王”写的。一条机器稿件被不少人读了,假设阅读的人中有1%会发表评论,那大约有75,000人读了这篇新闻。在这些人中,没有任何人表示这篇稿件太过枯燥,没法读;而且很多人参与了评论,他们根本看不出这是机器稿件。我们很惊讶:机器稿件能够通过读者的图灵测试?

下图展示了这个稿件的基本结构,也大约能看出基本的写作逻辑:

稿件的第一部分是对基本数据的总结,机器通过抓取分析统计局发布的消息,对照相关的历史数据,能够很快地写出这段文字。

稿件的第二部分是摘录统计局消息中的解读内容。通过一些关键词的识别,上下文的对照,机器能够准确无误的把这段文字提取出来,作为解读的基础材料。

稿件的第三部分是相关的经济学家在最近发表评论的部分摘录。这部分工作对机器来说是一个挑战:机器需要分析第二部分的内容,了解这个基础解读的重点,还有CPI走势的判断;在这些分析的基础上,还需要使用一个智能匹配算法,把数据库中最近收集到的专家评论进行比对打分,选出最相关且和统计局发布消息最符合的评论作为第三部分的主体内容。

如果你对DT稿王感兴趣,可以通过这个视频更好地了解DT稿王: