常见问题


 
 

 

大数据机器写作,会不会到时候写出来的内容都一样?

 
 

 

目前还看不到会一样。比如DT稿王每天生产出来的上千条稿件,都没有重复的。你可能是担心不同的新闻机构都来使用我们的稿件,就会用重复。这个一般不同的机构会做不同的改写和不同角度的解读,也不会有重复的。在我们的下一版产品中,我们把个性化写作作为我们的一个重要目标,我们的产品会越来越支持写出不一样的内容。

 

 

 

请问,对于带有人情世故和一些感情的写作,如果全部把这些东西嫁接到智能之类的平台去做总结,是否存在误解和牵强?

 
 

 

是的,所以我们不勉强所有的文章都用机器的逻辑来实现,只有那些逻辑比较明显,机器的语言音风格也能接受的才用智能写作的方法。对于强烈感情色彩的文章,还是要靠作者特别是高水平的作者的发挥。机器也许可以在整理素材,匹配素材,决定写作线索等方面提供协帮助。

 

 

 

 

机器语言是不是会有点呆板,是否可以考虑通过对比历史或其他资讯数据,同时对接词义分析工具,通过近义词替换,词义色彩分析等办法,达到为出具的报告加入感情色彩或意义委婉的目的?

 
 

 

目前我们的机器写作主要是针对财经事实的描述,因为文体的局限,语言显得有些呆板。如果要增加可读性,需要尝试写作不同的文体。比如说,基于事实的解读,我们可以针对不同的数字范围,使用不同的语音进行描述,那样会让语言丰富起来。我们最近在针对天猫的清单商品进行描述,这个对语言的要求比较自由,也能容忍更多的色彩。我们的写作技术使用互联网上的流行话题,还有同义词,相关词进行替换,给内容带来新的来丰富写作的色彩。

 

 

 

 

智能写作目前最前沿的科技以及应用是什么?

 
 

 

智能写作的技术一般归类到自然语言生成技术。因为数据的复杂性和多样性,很多数据挖掘和人工智能的技术也被使用。目前的应用主要是一些自动内容生产的工具,如Narrative Science, Wordsmith, 等。

 

 

 

 

针对智能写作的部分,针对个性化需求怎么进行信息的提取制成模板,或者编辑是否可以按照自己的意愿去打造个性模板,还是说当前阶段只是适合普遍性的模块分析?

 
 

 

目前的写作技术是不区别个性化的,也就是说个性化和普遍性的我们都可以写,关键看我们设计怎样的写作逻辑和给出怎样的输入数据。但是从业务场景来看,个性化场景的写作是很有价值的。比如说,我们可以根据每一个投资者投资的股票来写出他希望读到的关于他的投资篮子的报告,已经与此相关的市场趋势和对风险的一些提示等。

 

 

 

 

针对智能写作的部分,针对个性化需求怎么进行信息的提取制成模板,或者编辑是否可以按照自己的意愿去打造个性模板,还是说当前阶段只是适合普遍性的模块分析?

 
 

 

目前的写作技术是不区别个性化的,也就是说个性化和普遍性的我们都可以写,关键看我们设计怎样的写作逻辑和给出怎样的输入数据。但是从业务场景来看,个性化场景的写作是很有价值的。比如说,我们可以根据每一个投资者投资的股票来写出他希望读到的关于他的投资篮子的报告,已经与此相关的市场趋势和对风险的一些提示等。

 

 

 

 

 

目前智能写作中,人工工作占到多大比例?尤其是对时效性要求比较高的新闻,还有人工参与吗?没有的话,新闻质量又如何保障?

 
 

 

目前稿件的生成过程完全是自动的。但是成为可以发布的新闻稿,是有人工审核的。即使有很多稿件没有进行任何修改就直接发布了,但这些稿件也都是经过了人工审核的过程。当然,审核的编辑也可能对机器生成的文章进行一些修改。