兵以詐立。智能時代,顛覆性技術(shù)不斷涌現(xiàn),戰(zhàn)爭欺騙手段和形式亦不斷出新。“如果掌握你的數(shù)據(jù),我就能創(chuàng)造出各種方法欺騙你的人工智能系統(tǒng)。”研究實驗表明,智能化戰(zhàn)爭中一旦一方獲得對手的人工智能訓練數(shù)據(jù)集,就能夠找到其弱點和盲區(qū)并實施欺騙,人工智能必須警惕數(shù)據(jù)陷阱。
目前來看,人工智能分析處理數(shù)據(jù)的速度遠超人類分析師,并且能夠找出人腦難以發(fā)現(xiàn)的行為模式和規(guī)律,但是也會犯下人腦不會犯的錯誤。原因在于,機器學習算法必須依靠大量數(shù)據(jù)進行訓練,數(shù)據(jù)之于人工智能就如同血液之于人類,共享數(shù)據(jù)比設計算法更難。如果數(shù)據(jù)集過小、數(shù)據(jù)不準或是被對手惡意篡改,那么機器學習效果就會大打折扣,甚至被誤導出現(xiàn)誤判。尤其在國家安全和軍事領域,有害數(shù)據(jù)會造成嚴重后果。一旦人工智能的訓練數(shù)據(jù)集被對手掌握,對手就會設計數(shù)據(jù)陷阱、實施欺騙,提供假數(shù)據(jù)并誘導人工智能學習錯誤數(shù)據(jù)。更嚴重的是,由于機器學習算法的內(nèi)在工作機理晦澀難懂,人們通常并不清楚人工智能為何會出錯,特別是在沒有發(fā)生災難性后果的情況下,甚至難以察覺人工智能出錯,對人工智能陷入數(shù)據(jù)陷阱茫然不知。
那么,應如何避開數(shù)據(jù)陷阱呢?首先,需要人腦干預。只有人具備給數(shù)據(jù)分類打標簽的能力,因此不能簡單地把數(shù)據(jù)丟給機器算法,寄希望于人工智能解決所有問題而無須人腦干預。如果只提供大量數(shù)據(jù)而缺乏能夠辨別數(shù)據(jù)的“聰明人腦”,那么人工智能只能提供機械的答案,而非人們需要的正確答案。人腦干預不僅能夠確保人工智能獲得正確的數(shù)據(jù),還能夠檢查其是否在學習正確的數(shù)據(jù)。其次,打造跨領域團隊。能夠避開數(shù)據(jù)陷阱的“聰明人腦”必須來自跨領域團隊,計算機專家、程序員、大數(shù)據(jù)專家和人工智能專家必須與相關(guān)領域經(jīng)驗豐富的專業(yè)人員密切合作。今后,人工智能不斷發(fā)展成熟后將可能直接為作戰(zhàn)人員提供實時情報等,這就需要作戰(zhàn)人員不斷為“聰明人腦”團隊提供反饋,以便及時更新和修正數(shù)據(jù)。再次,進行多源數(shù)據(jù)互查。使用一種傳感器偵察目標很容易被對手蒙蔽,因此要采用視覺、雷達和紅外等多種傳感器偵測同一目標,將不同來源的數(shù)據(jù)進行對比核驗,才能夠辨別真?zhèn)?、發(fā)現(xiàn)隱藏的騙局。再者,給數(shù)據(jù)分類打標簽。當前,即使高級的人工智能也會犯下荒誕的低級錯誤,甚至會錯把牙刷認作棒球桿。因此不能給機器學習提供未經(jīng)加工的原始數(shù)據(jù),尤其在訓練初期更是如此,應該為機器算法提供正確分類、打了標簽的真實數(shù)據(jù),方能檢驗人工智能的結(jié)論是否正確,確保人工智能輔助決策準確、高效。最后,采取對抗式學習。組建智能藍軍,研發(fā)人工智能對手,讓互為對手、彼此對抗的人工智能展開互搏,在斗智過程中進行對抗式學習,在對抗式學習中提高識別數(shù)據(jù)陷阱的能力,實現(xiàn)以智取勝??傊?,當前人工智能還離不開人腦控制,避免數(shù)據(jù)陷阱最終還要靠人的經(jīng)驗和智慧。
關(guān)鍵詞: 人工智能 數(shù)據(jù)陷阱