2017-03-16 10:09:44分類:行業(yè)資訊4683
隨著技術(shù)的發(fā)展,越來越多的新聞媒體希望通過先進的技術(shù)提高發(fā)稿數(shù)量,提升新聞服務(wù)質(zhì)量。"機器新聞寫作"是人工智能技術(shù)在新聞傳播領(lǐng)域一個現(xiàn)象級的發(fā)展。早些年,福布斯網(wǎng)站、美聯(lián)社、彭博社、洛杉磯時報等媒體已在體育、財經(jīng)、天氣等領(lǐng)域?qū)崿F(xiàn)了"機器人寫新聞"。今年以來,國內(nèi)的騰訊公司、新華社相繼推出了研發(fā)多時的新聞寫作機器人,并直接應(yīng)用于新聞寫作實踐,引發(fā)熱議。
信息科技時代,高科技武裝的機器智能正越來越多地解放著人的體力和腦力。事實上,我們正生活在一個越來越由人工智能所定義的世界里--智能搜索引擎告訴我們哪些資訊更重要;算法根據(jù)個人習(xí)慣和興趣,推算出我們應(yīng)該看什么電影,聽什么歌,買什么商品;警方利用犯罪大數(shù)據(jù)決定在哪里強化治安部署……就新聞領(lǐng)域而言,技術(shù)對新聞行業(yè)的入侵早已不是什么新鮮事,即使是新聞寫作,這項長期依賴于記者采訪的累活兒,在人工智能科技的高速推進下,也正變得越來越"新潮"。
前不久,新華社正式推出新聞機器人"快筆小新"參與寫稿項目。這臺智能化的機器人可以快速完成體育賽事、中英文稿件和財經(jīng)信息稿件的自動撰寫。實際上這并不是國內(nèi)第一個"寫稿"機器人。早在9月10日,騰訊財經(jīng)一則標(biāo)題為《8月CPI同比上漲2.0%創(chuàng)12個月新高》的消息就由一款自動新聞寫作軟件Dreamwriter"操刀"完成,這款寫作軟件能根據(jù)算法進行及時分析和研判,在一分鐘內(nèi)將重要資訊和對信息的解讀送達(dá)用戶。在科技發(fā)達(dá)的歐美國家,相關(guān)技術(shù)更進一步。福布斯網(wǎng)站早在兩年前就已經(jīng)啟用NarrativeScience的程序自動生成財經(jīng)新聞。在去年7月,美聯(lián)社也開始使用自動化技術(shù)報道公司業(yè)績,截至2014年底,其智能寫作系統(tǒng)已完成了4400篇財報新聞,效率是人類記者的15倍。
那么,機器人寫稿子到底是如何運行的呢?
對于相對"格式化"的新聞資訊,機器人消除了傳統(tǒng)媒體的弊端,可以做到瞬間反應(yīng)、迅捷生成,在短時間內(nèi)處理大量數(shù)據(jù),且差錯率較低。他們內(nèi)容生產(chǎn)過程的核心,是基于云計算和大數(shù)據(jù)分析的人工智能,依賴于一個或多個采集存儲了大量高質(zhì)量數(shù)據(jù)的龐大數(shù)據(jù)庫,在寫稿時,機器人先從海量數(shù)據(jù)庫中找出符合新聞主題需要的原始數(shù)據(jù)信息,然后通過一系列結(jié)構(gòu)化處理、清洗,把數(shù)據(jù)信息重新排列組合,形成高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù),最后套用設(shè)定好的固定新聞模板將文本呈現(xiàn)出來。數(shù)據(jù)挖掘中間上下前后的連接邏輯也比較簡單,并且數(shù)據(jù)源比較單一。這方面,在內(nèi)容相對單調(diào)枯燥,報道風(fēng)格單一,又對數(shù)據(jù)準(zhǔn)確度和速度要求很高的體育賽事播報、證券財經(jīng)類、領(lǐng)導(dǎo)人公共活動、天氣預(yù)報等新聞中,機器人"智能填充輸出"優(yōu)勢十分明顯。正因此,無論是美聯(lián)社與AutomatedInsights(AI)公司合作,使用他們的Wordsmith平臺自動生產(chǎn)財報,還是新華社"快筆小新"應(yīng)用在中國足球超級聯(lián)賽報道,都很大程度上加快了出稿速度,減少了記者工作量。
知識概念模型技術(shù)的應(yīng)用,有助于將記者、編輯、專家話語智慧轉(zhuǎn)換成計算機可識別數(shù)據(jù),從而在信息數(shù)據(jù)的整合編排過程中,機器人能快速從海量數(shù)據(jù)中挖掘可用于文本分析的專家智慧數(shù)據(jù),從而模仿類似專家的行為(人工智能模仿),自動生成包括原因、結(jié)論、推測等深度分析新聞。同時,若添加、串聯(lián)不同語言風(fēng)格的語料庫,在出色的語義分析技術(shù)帶動下,機器人新聞生成將匹配更加豐富的自然語言,內(nèi)容輸出將呈現(xiàn)多樣性、個性化,以適應(yīng)不同社會階層或年齡段的受眾群體。特別是隨著大數(shù)據(jù)的發(fā)展以及相關(guān)用戶行為痕跡的記錄跟蹤,與之匹配的新聞推送早已成熟,隨之而來的"私人訂制"的新聞生產(chǎn)也并非遙不可及。
其實這種憂慮為時尚早,因為當(dāng)下的機器人新聞生產(chǎn)尚處在"稿子拼湊、語言堆砌"的稚拙摸索階段,即"幼年"期,在未來相當(dāng)長一段時間內(nèi)機器智能還遠(yuǎn)遠(yuǎn)無法替代人的"大腦",尤其是那些需要體現(xiàn)思考價值、人文審美的新聞稿件,依舊依賴于媒體記者們來完成。"機器可以根據(jù)格式和語法規(guī)則寫一首詩,或者一篇小說,但全世界的數(shù)據(jù)加起來,也無法讓一個程序理解愛、悲傷或恐懼。"[1]AutomatedInsight的CEORobbieAllen早前就說過:"其實就是讓機器人把數(shù)據(jù)轉(zhuǎn)化成故事,真正的難點在于怎么讓它看起來像人寫的,因為只有數(shù)據(jù)不是好故事。"
事實也是如此,新華社"快筆小新"盡管已能夠采寫多種類型的資訊稿件,但"編輯簽發(fā)"依舊是無法忽略的重要環(huán)節(jié)。即使是美聯(lián)社也公開承認(rèn),隨著大量財報新聞由機器人撰寫,新聞的質(zhì)量將會有所下降,針對一些關(guān)注度比較高的公司,如Google、蘋果的財報,美聯(lián)社直接承諾將繼續(xù)由資深記者手工撰寫,以避免帶來風(fēng)險性。
當(dāng)下時髦的機器人新聞寫作還有一個致命缺陷,就是其局限于現(xiàn)有數(shù)據(jù)庫的信息加工。這有兩個方面的影響:
一是平臺數(shù)據(jù)庫積累的大小、質(zhì)量、類別等,都將影響機器人新聞生產(chǎn)的內(nèi)容質(zhì)量,特別是一旦出現(xiàn)數(shù)據(jù)缺陷或算法邏輯差異,都可能導(dǎo)致不同的內(nèi)容輸出結(jié)果。更為致命的是,諸如情緒、價值這種東西是很難用數(shù)據(jù)量化并存儲的,具體新聞故事場景中,機器人新聞生產(chǎn)很難相應(yīng)加入"情感"元素,為此,他們更多只是"機械地"從數(shù)據(jù)庫里抽取形容詞。
二是新聞寫作機器人即使能通過對數(shù)據(jù)庫的深入挖掘與信息組合,創(chuàng)造出很多原創(chuàng)性新聞,但發(fā)生于社會現(xiàn)實的素材或者說實地實景的社會信息,依舊難以呈現(xiàn)。這背后實際上道出了一個機器人寫作的現(xiàn)實背景:即機器人能進行新聞寫作并不是本身有多高明,而在于,在這個時代,新聞生產(chǎn)可以不完全依賴于線下采訪。新聞生產(chǎn)和采訪的脫離,是互聯(lián)網(wǎng)蓬勃發(fā)展對傳統(tǒng)新聞業(yè)整體性的顛覆,也是當(dāng)今時代媒體行業(yè)的重大變更。反過來也一樣,現(xiàn)實生活中的題材依然離不開記者的實地采訪,最起碼線下的信息內(nèi)容需要編輯記者人工輸入到統(tǒng)一的數(shù)據(jù)庫中,新聞寫作機器人才能進行下一步工作。即使只有這一過程,記者的價值依舊不可替代。
盡管多家媒體推出了新聞機器人,但目前主流輿論依然認(rèn)為,記者工作是一種復(fù)雜的、高級的腦力勞動,人性是機器難以逾越的鴻溝,人類的深刻理解力和創(chuàng)造力是機器難以效仿的。不過,這種看法或許太過保守,科技進步之下機器的進化速度令人驚嘆,未來的機器人必將越來越智能。特別是人工智能、大數(shù)據(jù)運算、機器學(xué)習(xí)等新技術(shù)不斷取得突破性發(fā)展,我們已看到了語音識別、機器翻譯、機器人寫新聞、即時數(shù)據(jù)展示、個性化推薦等許多媒介變化。當(dāng)代最有影響的媒介理論家之一DouglasRushkoff在《編程,或者被編程》一書中寫道:隨著計算機和網(wǎng)絡(luò)計算能力的不斷提升,"思考本身將不再--至少不再是獨一無二地--成為人類的特權(quán)"。瑞典學(xué)者的一項研究顯示,大多數(shù)讀者無法分辨自動寫作軟件和記者撰寫的某些報道。有軟件公司負(fù)責(zé)人預(yù)測,在5年之內(nèi)機器人所撰寫的文章就能獲得普利策新聞獎,并稱將來90%新聞稿由機器人撰寫。
顯然,過分夸大和低估智能機器帶給新聞行業(yè)乃至人類社會的影響,都是極其不負(fù)責(zé)任的。那么,如何定位當(dāng)下聲名鵲起的新聞寫作機器人相對適合呢?機器人"Quakebot"的設(shè)計者舒文克提出一種相對中性的觀點,他認(rèn)為,機器人寫手雖有其技術(shù)優(yōu)勢,但卻無法完全具備人的靈活性和創(chuàng)造力,讓機器人成為記者的幫手,相信它會使工作更有趣。國內(nèi)不少媒體人士也指出,相對程序化、枯燥的工作交由機器人后,記者們將有更多精力和時間來應(yīng)付更需要獨特角度和思考的報道。2014年3月26日,《人民日報》刊發(fā)署名為"趙鐸"的文章《"機器人記者"忙起來》指出,機器人寫手只是一種輔助形式,它可以節(jié)省時間,把記者從一堆基礎(chǔ)數(shù)據(jù)和信息中解放出來。但機器人撰寫新聞的過程就像一個復(fù)雜的填詞游戲,一些具有固定模式的行業(yè)性文章更符合它的能力,"如果有一天記者真的被冷冰冰的機器人取代,新聞恐將淪為諸多報道模式的生硬拼盤"。
不管如何爭論,如今,機器人與人工智能已不再停留在暢想階段,它們正成為產(chǎn)業(yè)新風(fēng)口,掀起新一輪技術(shù)創(chuàng)新浪潮。如何適應(yīng)未來的技術(shù)變革,顯然也是國內(nèi)外媒體亟需思考的命題。筆者認(rèn)為,以下兩點尤其值得各媒體提前做好內(nèi)功:
1.積極搶占數(shù)據(jù)浪潮的高地
智能化離不開互聯(lián)網(wǎng)數(shù)據(jù),隨著新聞傳播業(yè)數(shù)據(jù)庫建設(shè)的發(fā)展,大數(shù)據(jù)庫不僅成為新聞媒體向用戶提供新聞信息服務(wù)的直接手段之一,也是媒體內(nèi)容生產(chǎn)走向自動化深入挖掘轉(zhuǎn)型的重要基礎(chǔ)。特別是隨著互聯(lián)網(wǎng)跨界融合的發(fā)展,互聯(lián)網(wǎng)開放技術(shù)賦予各媒介平臺流量信息的共享與豐富,活躍于互聯(lián)網(wǎng)媒介的信息用戶正成為新聞寫作素材的間接生產(chǎn)者,每天提供著海量的網(wǎng)絡(luò)信息(數(shù)據(jù)),這些有跡可循的用戶行為痕跡都可能成為未來新聞智能創(chuàng)作的基礎(chǔ)數(shù)據(jù)。可以說,未來擁有基礎(chǔ)數(shù)據(jù)的規(guī)模,將成為衡量一個媒體實力的重要標(biāo)志。反過來,采集大量高質(zhì)量的數(shù)據(jù),又有助于通過數(shù)據(jù)挖掘?qū)崿F(xiàn)信息篩選與新聞生產(chǎn)的個性化、精準(zhǔn)化定位,大大降低用戶獲取有效信息的成本。
2.大力推進業(yè)務(wù)與技術(shù)深度融合
我們正在歷經(jīng)一場由技術(shù)應(yīng)用推動的媒體轉(zhuǎn)型,媒體形態(tài)和輿論格局正在發(fā)生深刻調(diào)整,智能化趨勢下,新聞業(yè)無論是產(chǎn)品形態(tài),還是新聞生產(chǎn)力,都會經(jīng)歷新的洗禮,新聞傳播正處于一個重要的歷史分界點。但無論是現(xiàn)在還是未來,行業(yè)的信息技術(shù)含量會越來越重,其中人工智能交互將是最核心趨勢。目前,類似百度新聞和今日頭條的個性化推薦就是智能交互的初級階段。尤其是新媒體領(lǐng)域,新媒體發(fā)展最關(guān)鍵在技術(shù)層面,新媒體本身就是技術(shù)驅(qū)動的媒體,比如雅虎、Facebook、微博、微信等,都是一個新的技術(shù)運用很快占領(lǐng)市場。因此,媒體轉(zhuǎn)型必須跟蹤前沿技術(shù),創(chuàng)造自己獨特的技術(shù),打造屬于自己的獨創(chuàng)產(chǎn)品。
"機器人寫作"是知識技術(shù)融合的產(chǎn)物,機器稿件生產(chǎn)系統(tǒng)的出現(xiàn),雖然將給新聞傳播行業(yè)帶來深刻而長遠(yuǎn)的變化,但萬變不離其宗的是,新聞從來都是一種極富"專業(yè)性、創(chuàng)造性"的智力活動。在新聞寫作過程中,記者們創(chuàng)作出更具專業(yè)性、思想性的新聞內(nèi)容,我們才不至于被機器人所代表的科技力量所擊潰。