2019-08-28 09:15:48分類:行業(yè)資訊4439
數(shù)據(jù)問題是企業(yè)的人工智能項目沒有達(dá)到預(yù)期目標(biāo)的主要原因。但是,如果企業(yè)能從錯誤中吸取教訓(xùn)并長期堅持,那么在人工智能方面的努力將會得到回報。
18個月前,Cooper公司為其客戶服務(wù)代理商推出了智能推薦系統(tǒng),以便為客戶問題提供解決方案。該公司前身為Nationstar公司,是美國最大的非銀行抵押貸款提供商,擁有380萬客戶,因此該項目被視為該公司一個令人關(guān)注的節(jié)省成本的項目。該公司首席信息官Sridhar Sharma說,該公司花費九個月的時間才發(fā)現(xiàn)代理商沒有使用它,又花了六個月的時間來弄清楚原因。
Sharma發(fā)現(xiàn),智能推薦系統(tǒng)提供的建議與客戶并不相關(guān),但問題不在于機器學(xué)習(xí)算法。相反,該公司依賴于基于客戶問題的技術(shù)術(shù)語描述訓(xùn)練數(shù)據(jù),而不是使用客戶自己的語言描述這些問題。
他說:“我們沒有很好地確??蛻籼岢鰡栴}的根源是沒有采用客戶使用的術(shù)語,這是因為是用我們內(nèi)部使用的技術(shù)術(shù)語編寫的。”
Sharma說,此外,智能推薦系統(tǒng)的反饋機制(代理記錄通話結(jié)果)有重疊的類別,這使得問題更加嚴(yán)重。他拒絕透露這個項目給該公司造成了多大的損失。
Cooper公司陷入人工智能的困境并不是異常現(xiàn)象。根據(jù)調(diào)研機構(gòu)IDC公司最近的一項調(diào)查,只有約30%的受訪者表示其人工智能項目的成功率為90%,大多數(shù)受訪者表示其失敗率為10%到49%,而3%的受訪者表示一半以上的人工智能項目已經(jīng)失敗。
超過四分之一的受訪者認(rèn)為,缺乏員工以及人工智能技術(shù)具有不切實際的期望是面臨的主要挑戰(zhàn)。另有23%的人表示他們的人工智能項目因為缺乏必要的數(shù)據(jù)而失敗。
Sharma說:“失敗的第一個征兆是有些人想退出這個項目。但如果這樣做,就注定要失敗。”
Cooper公司計劃明年將重新回到客戶服務(wù)項目,作為其客戶關(guān)系管理(CRM)系統(tǒng)改革的一部分,企業(yè)將繼續(xù)致力于人工智能技術(shù)的開發(fā)。其最新的機器學(xué)習(xí)項目涉及分析非結(jié)構(gòu)化數(shù)據(jù),已經(jīng)具有積極的商業(yè)利益,并有助于為未來創(chuàng)建更好的語言訓(xùn)練數(shù)據(jù)。
他補充說,“這些措施的成本并不低,當(dāng)事情不順利時,需要企業(yè)首席執(zhí)行官和首席財務(wù)官的支持。”
缺乏數(shù)據(jù)
數(shù)據(jù)問題是人工智能項目達(dá)不到預(yù)期目標(biāo)的主要原因。根據(jù)麥肯錫公司去年秋天發(fā)布的一份調(diào)查報告,限制人工智能技術(shù)應(yīng)用的兩大挑戰(zhàn)與數(shù)據(jù)有關(guān)。
首先,與Cooper公司一樣,許多公司很難獲得適當(dāng)標(biāo)記的數(shù)據(jù)來訓(xùn)練他們的機器學(xué)習(xí)算法。如果數(shù)據(jù)沒有正確分類,工作人員必須花費大量時間標(biāo)記,這可能會延遲項目或?qū)е马椖渴 5诙€數(shù)據(jù)問題是沒有項目的正確數(shù)據(jù)。
普華永道公司合伙人兼全球人工智能領(lǐng)導(dǎo)人Anand Rao表示,“企業(yè)通常沒有合適的數(shù)據(jù),如果無法使用未標(biāo)注的數(shù)據(jù)建立模型,就會感到沮喪。這就是企業(yè)實施人工智能項目一直失敗的地方。”
美國奧杜邦協(xié)會正在使用人工智能來幫助保護(hù)野生鳥類。例如,該組織在7月份發(fā)布了一項關(guān)于氣候變化如何影響38種草原鳥類的人工智能分析結(jié)果。
奧杜邦協(xié)會保護(hù)科學(xué)副總裁Chad Wilsey說,“如果我們不采取任何措施來減緩氣候變化的速度,那么42%的草原鳥類可能面臨滅絕,但如果我們能夠采取行動,那么可以將其比例降低到8%。”
并非所有奧杜邦協(xié)會的人工智能項目都取得了成功。去年夏天,該組織試圖利用機器學(xué)習(xí)來計算海灘上的褐鵜鶘和剪嘴鷗的數(shù)量。該試點項目基于一組志愿者收集的圖像,這些志愿者通過無人機在德克薩斯州海岸附近的一個島上進(jìn)行調(diào)查。
Wilsey說,“我們有興趣了解通過的颶風(fēng)如何影響鳥類種群。”
例如,大多數(shù)可用的鳥類圖片都是由地面上的工作人員拍攝的,而不是無人機直接拍攝。Wilsey說,由于這是一項試點研究,奧杜邦協(xié)會沒有資源拍攝更多的照片。
訓(xùn)練數(shù)據(jù)偏差
另一個人工智能項目因缺乏數(shù)據(jù)而受阻的例子是弗里茨實驗室試圖創(chuàng)建一個模型來識別照片中人們的頭發(fā)。弗里茨實驗室?guī)椭苿娱_發(fā)者構(gòu)建可以直接在手機上運行的人工智能模型,而無需將數(shù)據(jù)發(fā)送回中央服務(wù)器進(jìn)行處理。
該公司首席技術(shù)官Jameson Toole說,“我們希望建立一個能夠在實時視頻中檢測頭發(fā)并實時改變顏色的功能。”
他說,起初一切看起來都很好,但算法中存在一個重大缺陷,如果系統(tǒng)公開上市的話,其問題會非常嚴(yán)重。
Toole說,“值得慶幸的是,我們在辦公室和我們招募的人員之間進(jìn)行了大量的人工測試,我們意識到對于某些種族人群來說,這并不是一件好事,我們重新篩選了數(shù)據(jù)集,以確定數(shù)據(jù)集中沒有人是這些種族人群的一部分。”
他說,有很多圖像數(shù)據(jù)集可供訓(xùn)練,包括免費的和商業(yè)的數(shù)據(jù)集。但是企業(yè)必須檢查是否有他們需要的特定類型的足夠數(shù)據(jù)。
他說:“企業(yè)首先要花費一定的時間,努力構(gòu)建自己的代表用戶群的測試用例。”
弗里茨實驗室最終收集了丟失的圖像,并通過工作人員的處理對它們進(jìn)行注釋。Toole說,“這無疑凸顯了這樣一個事實,即當(dāng)受到可用數(shù)據(jù)的限制時,將偏見引入這樣的系統(tǒng)并不困難。”
根據(jù)普華永道公司最近的一項調(diào)查,一半以上的公司沒有評估人工智能偏見的正式流程。更糟糕的是,只有25%的受訪者表示他們會在實施之前優(yōu)先考慮人工智能解決方案的道德含義。
數(shù)據(jù)集成問題
有時,問題不在于缺乏數(shù)據(jù),而在于數(shù)據(jù)太多。普華永道公司零售業(yè)務(wù)方面的人工智能和數(shù)據(jù)的常務(wù)董事表示,一家全球性大型銀行就面臨這種情況。
他表示,如果能夠回到過去,這家銀行就會更早地開始將不同的數(shù)據(jù)渠道匯集在一起??。他說,“這是我們沒有做的事情,這是一個很大的錯誤。我們收集了數(shù)據(jù),其結(jié)果是我們沒有獲得完全的全方位的客戶視圖。”
他補充說,該數(shù)據(jù)整合??問題損害了這家銀行創(chuàng)建有效營銷信息的能力,導(dǎo)致收入損失,該銀行現(xiàn)在正轉(zhuǎn)向多渠道客戶數(shù)據(jù)視圖,包括在線、移動和面對面互動。
他說,“我們?nèi)匀徊辉谀抢?,孤立的?shù)據(jù)是我們擁有并仍然存在的最大挑戰(zhàn)之一。這個挑戰(zhàn)不是技術(shù)問題,而是商業(yè)問題,第一個問題是合規(guī)性。我們不允許混合某些類型的數(shù)據(jù)。”
他說,“另一個問題與企業(yè)優(yōu)先事項有關(guān)。還有很多其他項目正在運行。誰會為將數(shù)據(jù)混雜一起而支付費用?這本身并不是銀行的增值業(yè)務(wù)。”他表示,這是每個銀行都必須面對的挑戰(zhàn)。
他說,“如果再次開展這個項目,應(yīng)該在銀行首次開始處理人工智能用例時啟動數(shù)據(jù)集成過程。我不認(rèn)為我們真的會做到這一點,因為有太多的數(shù)據(jù)來源,我不認(rèn)為都能完全完成。”
他表示,該銀行預(yù)計在未來18至24個月內(nèi)將連接其主要數(shù)據(jù)源。他說,現(xiàn)在該銀行只有10%到15%左右。
數(shù)據(jù)漂移
人工智能項目面臨的另一個問題是企業(yè)依賴歷史數(shù)據(jù)而不是活動交易數(shù)據(jù)來進(jìn)行訓(xùn)練。埃森哲公司董事總經(jīng)理安德里Andreas Braun表示,在許多情況下,在轉(zhuǎn)換為實時數(shù)據(jù)時,對單個靜態(tài)歷史快照進(jìn)行過培訓(xùn)的系統(tǒng)表現(xiàn)不佳。
埃森哲公司負(fù)責(zé)歐洲數(shù)據(jù)和人工智能業(yè)務(wù)的Braun說,“企業(yè)可以卸載一些數(shù)據(jù),訓(xùn)練一些模型,并在實驗室中獲得相當(dāng)好的模型提升,但是一旦把它重新融入組織,就開始出現(xiàn)問題。”
歷史數(shù)據(jù)樣本和通過實時系統(tǒng)傳輸?shù)臄?shù)據(jù)之間可能存在顯著差異,例如,實時檢測欺詐或發(fā)現(xiàn)洗錢行為,因為這些模型沒有經(jīng)過訓(xùn)練,無法識別其行為的微小變化。
他說:“如果某個用戶在某個時間點(可能是晚上、周六或周日)復(fù)制數(shù)據(jù),那么這種情況將會凍結(jié)數(shù)據(jù)。這使得實驗室的分析非常容易。但是,當(dāng)機器學(xué)習(xí)模型重新融入到實時系統(tǒng)中時,其情況會更糟。”
Braun說,解決方案是將數(shù)據(jù)科學(xué)家從生產(chǎn)技術(shù)方面放入一個單獨的孤島中。特別是,當(dāng)使用實時數(shù)據(jù)構(gòu)建模型時,將模型集成到生產(chǎn)環(huán)境中要快得多。
他說:“而且成功的情況要好得多。它完全改變了游戲規(guī)則。”
未經(jīng)處理的非結(jié)構(gòu)化數(shù)據(jù)
根據(jù)咨詢機構(gòu)德勤公司最近的一項調(diào)查,62%的公司處理非結(jié)構(gòu)化數(shù)據(jù)仍然依賴電子表格,只有18%的公司在分析工作中利用了產(chǎn)品圖片、客戶音頻文件或社交媒體評論等非結(jié)構(gòu)化數(shù)據(jù)。
此外,德勤公司零售和消費產(chǎn)品戰(zhàn)略和分析實踐負(fù)責(zé)人Ben Stiller表示,該公司收集的大量歷史數(shù)據(jù)缺乏對人工智能有用的背景,或者以摘要形式存儲。
“數(shù)據(jù)限制當(dāng)然可以從一開始就為失敗做好準(zhǔn)備。”他說。
Stiller說,“然而,根據(jù)調(diào)查顯示,像Cooper這樣利用非結(jié)構(gòu)化數(shù)據(jù)的公司,其業(yè)務(wù)超出其業(yè)務(wù)目標(biāo)的可能性要高出24%。這真的需要企業(yè)對數(shù)據(jù)的看法發(fā)生根本性的轉(zhuǎn)變。”
例如,Cooper公司以大約15億個客戶文檔的形式擁有大量非結(jié)構(gòu)化數(shù)據(jù)。因此,客戶服務(wù)代理會花費太多時間查找?guī)椭蛻羲璧奈臋n,有時還需要與客戶溝通回訪。
因此,該公司使用機器學(xué)習(xí)技術(shù)掃描了所有15億份文件,并仔細(xì)分析了第一批1.5億份文件,這些文件屬于200種最常用的文件。
Cooper公司的Sharma說,“現(xiàn)在我們有一個機器學(xué)習(xí)項目,它帶來了價值,并且現(xiàn)在正在實施中。”
當(dāng)企業(yè)重返以前問題纏身的人工智能客戶服務(wù)項目時,除了加快客戶服務(wù)呼叫的速度,文檔分析還幫助創(chuàng)建一個更好的語言字典,供將來使用。
文化挑戰(zhàn)
除了數(shù)據(jù)外,組織問題對人工智能的成功提出了重大挑戰(zhàn)。
Sharma說,如果回到過去,他最初會專注于客戶在詳細(xì)解決問題時使用的語言,并讓主題專家與人工智能開發(fā)人員配合工作。
Sharma說,“必須讓客戶與我們的技術(shù)團隊一起合作,這樣的場景始終是最重要的,你必須讓他們一起共事,并使其成為一份全職工作。”
除非企業(yè)能從這些錯誤中吸取教訓(xùn),否則實現(xiàn)人工智能承諾的機會可能會減少,因為失敗的人工智能項目可能會讓投資團隊不再提供融資,并可能對員工和客戶滿意度產(chǎn)生負(fù)面影響。
Stiller說,“圍繞人工智能的早期失敗項目可能讓執(zhí)行團隊放棄在這個領(lǐng)域的重大投資。這可能會導(dǎo)致企業(yè)落后于競爭對手。”
這一切都從企業(yè)管理層開始。正如德勤公司的調(diào)查顯示,企業(yè)高層對于人工智能項目的支持至關(guān)重要。Stiller說,“如果企業(yè)首席執(zhí)行官提供支持,那么其業(yè)務(wù)目標(biāo)的成功率可能會超過77%。”
因此,不要讓挫折破壞企業(yè)對人工智能的組織承諾,因為人工智能的長期方法會得到回報,他說,“隨著時間的推移,企業(yè)實施的項目越多,投資回報率就會越高。”