隨著自然語言處理、知識庫等人工智能技術的發展,許多媒體已經開始了機器人報道的探索。《紐約時報》數字部門開發了機器人編輯 Blossomblot,每天推送300篇文章,每篇文章的平均閱讀量是普通文章的38倍。此外,《紐約時報》還會在財報季、運動比賽報道的時候使用機器人來寫稿;美聯社在過去一年多時間里使用Wordsmith系統編發企業財報;在華爾街引起巨大反響的Kensho可以通過接入美國勞工部等數據源來自行創造投資分析報告;電訊社也計劃使用雅虎在報導夢幻橄欖球聯賽時用到的技術,用來發布一些美式橄欖球回顧;AutomatedInsights的寫作軟件去年寫了150億篇文章,宣稱自己是世界上最大的內容生產者;路透社也在發表機器撰寫的文章,該系統的負責人認為「在一次盲測中,機器的作品表現得比人類作品更具可讀性。」;此外,還有專門提供「標題黨」服務的Click-o-Tron公司。
媒體領域出現這種趨勢的原因在于相關技術已經達到了一定的成熟度,而且這種成熟度是和新聞媒體的要求很好的匹配在了一起。在卡斯韋爾的「結構化故事」系統中,所謂的「故事」完全不是個故事,而是一個信息網,我們可以像對待文案、信息圖表或者其它表達形式一樣去組裝它,閱讀它,就像我們擺弄音樂音符一樣。任何一類信息——從法院報道到天氣預報——都能夠最終能放入到這個數據庫中。這樣的系統的潛力是巨大的。
「大多數自然語言系統都是在簡單地描述一個事件。但是大多數新聞都是描繪性的,甚至是事件驅動的」來自密蘇里大學DonaldWReynolds新聞機構的大衛·卡斯韋爾說。「事件們在不同的地點發生,這些事件之間的因果關系是這些事件的核心敘述結構。」需要把它們放到古老的新聞術語中:誰,發生了什么,在哪里,什么時候。
根據 DonaldWReynolds的說法,人工智能系統在進行新聞創作時需要解決非常多的技術難題,包括自然語言處理中的自動摘要、文本分類等,還有知識庫和知識發現(KDD)等相關技術,比如實體定義、關系抽取、問答系統等。簡單來說,就是機器首先需要理解自然語言,然后通過知識管理弄明白新聞中各個要素(各類知識)之間的關系。
Xiaomingbot、CFO只是頭條實驗室眾多研究布局中的階段性成果,后者旨在推動人工智能技術研究,讓算法更好地理解文字、圖片、視頻、環境場景和用戶興趣,從而促進人類信息與知識交流的效率和深度。今日頭條不僅僅是新聞客戶端,是一款基于機器學習的個性化資訊推薦引擎,是所有信息、內容分享創作的平臺。人工智能和機器學習的算法起到了重要作用,能夠幫助高效精準地把用戶感興趣的內容推薦出去。今日頭條的內容平臺對應著雙邊用戶:一邊是內容的創作者,另一邊是內容的消費者。所以為了把最好的內容推薦給最需要的讀者,就需要機器學習的技術。今日頭條等媒體巨頭對人工智能技術在研發和應用上的加碼,讓我們看到了人工智能在未來對媒體業造成的巨大影響。《淺狽中提到,互聯網作為一種智力工具,在給我們帶來便利的同時也在重塑著我們的思維方式。隨之而來的問題是,互聯網這種媒介傳遞的信息越多,我們想找到優質或者自己所需信息的難度也就越大。而這正是人工智能的優勢所在,它可以讓大數據從負擔變成便利,會重塑媒體的內容生產和分發。
在采用Wordsmith之前,美聯社需撰寫約300家公司的財報文章,可想而知這并不是個輕松的工作量。在使用機器人Wordsmith之后,美聯社每季度可以出3000家公司財報,雖然其中仍有120篇需要人力更新或添加獨立的后續報道,但顯然它替人類編輯承擔了絕大部分的工作量。
在哥倫比亞大學慶祝普利策獎誕生一百年之際,智能機器人也將在財經報道、體育實況報道、騙點擊的標題黨新聞(clickbait)以及其它原本只有受過訓練的記者才能報導的領域開始一展身手。「總有一天,機器人會贏得普利策獎」,來自NarrativeScience的KrisHammond如此預測。這家公司專注于「自然語言生成」。「我們能講述隱藏在數據中的故事。」最近的進步味著,人工智能現在能夠撰寫出具有可讀性的流暢文字,并且還能比亢奮的寫手更快地大量炮制模板型文章。「有了自動化,我們現在能為4,000家公司追蹤、撰寫季度收益報告,」來自世界第一個也是迄今為止唯一個使用自動化編輯的通訊社——美通社的賈斯汀·邁爾斯說,「以前我們只能做到400家。」
而對于機器人能否拿普利策新聞獎這個問題,邁爾斯也「絕對相信」——因為機器人已經做到了。BillDedman因一篇抵押貸款中存在種族主義問題的調查報道,而獲得了普利策獎。這篇報道雖然發表于1988年,卻是由電腦協助寫作成的。
自動化新聞不僅僅具有數量優勢,還有助于定位客戶需求——通過用戶畫像、情感分析等技術為用戶提供個性化內容,或者對于智能對話系統與用戶進行交互。
隨著人工智能技術在新聞領域的參與程度越來越高,對于人工智能技術是否造成失業問題的爭論也愈演愈烈。牛津大學此前發布了一篇報告稱,目前47%的工作崗位將最終被自動化。但對此的批評意見認為,工作被取代,并不意味著勞動者將失去工作,正如曾經汽車的出現取代了許許多多的馬車夫和馬童,但同時創造了更多修建高速公路和服務加油站的工作。
對于媒體領域來說同樣如此,機器人負責這項單調而又乏味的工作就能把記者們解放出來,讓他們追求一些需深度思考的報道,同時機器人也可以將消費者從海量信息中解放出來,提高他們獲取信息和知識的效果和效率,而這就是人工智能對媒體的最重要影響。不久的未來,我們將看到人工智能作為工具在新聞產業產出發揮重要的作用。