人工智能用于写作其实已有相当久远的时间。超过大多数人的想象,近四十年前的20世纪80年代,新闻行业已经在尝试更多引入计算机来进行工作。最初的尝试始于使用机器自动化抓取信息,虽然困难重重,但是新闻行业从未放弃,而且由于写作生产量巨大,也可以说新闻行业成了应用机器写作的领跑者。
追溯起来,几十年前新闻行业就已经在尝试使用机器自动化抓取信息,自动产生新闻了。1988年,美国《大西洋月刊》记着Bill Dedman用计算机梳理了海量住房按揭数据,揭示了房地产行业的隐形种族歧视,他的这篇《The Color of Money》,《金钱的肤色》获得了第二年的普利策奖,成为机器新闻写作历史上第一篇有巨大影响力的文章。
2010年代后,随着计算机硬件技术的突破,长期徘徊不前的人工智能方法突然迎来了春天,机器学习和深度学习的兴起,各行各业都开始进行广泛尝试,就新闻业来说,2012年,《华盛顿邮报》启动事实核查机器人“Truth Teller”,在2013年美国众议院辩论期间,第一时间发掘出当时多数党领袖“给富人加税会导致70万人失业”等谬论的反驳文章和证据
2014年《洛杉矶时报》采取突然新闻机器人,成为最快报导洛杉矶3.17地震的媒体
2015年《腾讯财经》发表了Dreamwriter新闻写作机器人编写的经济报道《8月CPI涨2%,创12个月新高》
2015年 新华社启用机器人“快笔小新”,为体育部、经济信息部和《中国证券报》写体育赛事及财经消息稿件
2016年《华盛顿邮报》使用机器人Heliograf报道里约奥运会
2017年《广州日报》使用机器人“同同”、“阿乐”在全国人大和政协“两会”期间写出政府工作报告热词分析、外交部部长记者会热点问题分析等多篇报道
2017年,路透社启用“路透社追踪器“,2017年拉斯维加斯当地时间10月某日凌晨1:22分发生枪击案,“路透社追踪器”在社交网站上发现了这一事件并在1:49分报道了此事。
媒体新闻界使用机器人也不仅仅是为了快速自动化产生新闻。节约人力的另一方面是为了解放人力。路透社除了“路透社追踪器”以外,还曾经退出过一整套名为“开放加莱(Open Calais)”的智能解决方案。当一位编辑利用开放加莱写作的时候,他的用词会被系统学习和模拟,随时与系统已有数据进行比对,筛选出关键词和重点内容。当作者写完稿件后,只需要再次比对关键词,核查重点内容部分即可完成稿件编辑和校对。从而把编辑和记者从繁琐细碎的校对工作当中解放出来。
不过和工业生产中机器往往代表着精确、可靠不同,机器写作生产还存在大量的不确定性,虚假来源的问题,信息幻觉的问题等等,这些都会给基于AI写作带来长期困扰。因此在新闻写作应用AI的历史,其实也是一部人类与虚假信息对抗的历史。不过这是另一个话题了。