本報記者 張佳星
證件、人臉,掃描對比,綠燈亮,通過,在經(jīng)過高鐵安檢閘口的這一流程時,你也許會想:機器認識我。而實際上,并不是。
“當前的人工智能(AI)識別做的只是比對,缺少信息進入大腦之后的‘加工、理解、思考’步驟,因此僅僅停留在‘感知’,而并非‘認知’。”6月18日,紀念吳文俊誕辰一百周年活動的“認知智能行業(yè)應用大會”舉行,中國人民大學高瓴人工智能學院執(zhí)行院長文繼榮表示,要讓AI有類似大腦的活動,走到認知階段,需要讓它掌握知識、進行推理。AI從“感知智能”走向“認知智能”的實踐目前在通用狀態(tài)下比較困難,但在一些諸如反洗錢、偵察等領域正在應用。
AI“大腦”長成要先建知識庫
“現(xiàn)在的AI處于弱人工智能狀態(tài),它沒有大腦,要讓它形成大腦,最核心的是要有‘知識’。”
微軟亞洲研究院前研究員、北京一覽群智數(shù)據(jù)科技有限責任公司首席執(zhí)行官胡健表示,如果現(xiàn)有的算法、模型是神經(jīng)或腦結構,那么知識是大腦能夠運轉起來的原動力。
讓AI獲得知識的知識庫在業(yè)界稱為“知識圖譜”,它不僅要關注知識點還要關注知識點間的關聯(lián)。這些關聯(lián)將賦予AI聯(lián)想力!疤岬剿,它要反應到密度、透明等多個性質,還要和澆水、能喝的功能聯(lián)系起來,更高級的是計算出用多大力道去取水!焙≌f。
知識圖譜的建立非常困難,人類海量的知識如何翻譯成機器的語言,并與之建立聯(lián)系,很成問題。尤其是之前這項工作一直是人工完成的,例如谷歌詞庫、百度百科、維基百科等都可以轉換為知識圖譜,但工作量大、內容異常龐雜。
“關聯(lián)密度不足是另一個難以達到應用的‘瓶頸’!焙〗忉,一個知識點可能最多出現(xiàn)在幾個關系中,能解決比爾·蓋茨的爸爸的鄰居的媽媽這種單維度的問題,但離反映現(xiàn)實世界中“蝴蝶效應”里的相互影響還差很遠。
在關聯(lián)密度不足的情況下,AI的“大腦”即便擁有一個上千萬詞條體量的通用知識圖譜也難以達到應用的級別。
行業(yè)知識圖譜能達“認知層面”
知識點的關聯(lián)密度更像是一個AI大腦皮層,越復雜密集AI將越“聰明”。
“聚焦到行業(yè),AI可以做到相對聰明一點!焙≌f,一些行業(yè)本身就有自己的基礎關聯(lián)圖,這為其制定圖譜提供了幫助。例如公安系統(tǒng)有一套體系,包括人、地、事、物、組織、機構以及關聯(lián),將出入境數(shù)據(jù)、第三方物流數(shù)據(jù)等加入進來之后,可固定成知識圖譜。
中國人民公安大學公共安全行為科學實驗室主任丁寧介紹,在做入室盜竊、公交扒竊等一些行為規(guī)律的研究時,知識圖譜中除了引入歷史數(shù)據(jù)的發(fā)展態(tài)勢、風險感知之外,還逐步加入了環(huán)境、天氣等數(shù)據(jù),包括PM2.5的值,結果發(fā)現(xiàn)PM2.5的值對公交扒竊是有影響的。
“我們也提出虛實網(wǎng)絡結合的方向,在掌握了實際的社交網(wǎng),和資金流、社交流聯(lián)系之后,我們對于團伙的刻畫就比較準確了!倍幷f,這將大大提高AI通過分析輔助決策的能力。
越密集越準確,AI知識圖譜的關系圖要做到像“福爾摩斯”一樣綜合分析,要形成凝集大量信息的知識圖譜,這對傳統(tǒng)的人工建立知識圖譜的效率提出了挑戰(zhàn)!盀榇耍覀冄邪l(fā)出人工智能的解決方式,能夠自動從海量的多源異構數(shù)據(jù)中抽取知識構建關系、理解語義以及與業(yè)務場景有效結合,更標準化、效率更高、關聯(lián)密度能做到更高。”胡健說。
“在此基礎上,我們研究出來跨境資金網(wǎng)絡可疑交易的一套AI模型!敝行陪y行反洗錢專家沈可生說,它習得“認知智能”后每年的可疑交易預警量從50萬份下降到10萬份,減少80%人工甄別的工作量,同時把結果的準確度提升了80%。