日前,《華爾街日?qǐng)?bào)》的一篇華為和騰訊正因用戶數(shù)據(jù),產(chǎn)生沖突的文章在業(yè)內(nèi)流傳,并經(jīng)國(guó)內(nèi)部分媒體的發(fā)酵(夸張的翻譯及再加工),演繹出了諸多不同的版本。但有一點(diǎn)可以確認(rèn)的是,此前工信部所屬的國(guó)內(nèi)權(quán)威的泰爾實(shí)驗(yàn)室已經(jīng)檢測(cè)確認(rèn)榮耀Magic并不存在侵犯用戶數(shù)據(jù)隱私,而諸多第三方的測(cè)試也顯示,榮耀Magic也不存在侵犯用戶數(shù)據(jù)隱私。我們這里需要強(qiáng)調(diào)的是,為了更好提升用戶的體驗(yàn)和提供更多、更好的服務(wù),用戶數(shù)據(jù)的搜集、利用與侵犯用戶數(shù)據(jù)隱私完全是兩個(gè)不同的概念。
其實(shí)通過(guò)此次《華爾街日?qǐng)?bào)》的報(bào)道,我們更關(guān)心的是AI時(shí)代下,相關(guān)企業(yè)到底該不該搜集和利用用戶的數(shù)據(jù)信息以及為何要搜集和利用用戶的數(shù)據(jù)信息。
熟悉AI的業(yè)內(nèi)人士知道,在當(dāng)下,如果把AI看成一個(gè)嗷嗷待哺、擁有無(wú)限潛力的嬰兒,某一領(lǐng)域?qū)I(yè)海量的深度數(shù)據(jù)就是喂養(yǎng)這個(gè)天才的“奶粉”。奶粉的數(shù)量決定了嬰兒是否能長(zhǎng)大,而“奶粉”的質(zhì)量則決定了嬰兒后續(xù)的智力發(fā)育水平。正是基于此,在進(jìn)入AI時(shí)代,數(shù)據(jù)搜集及基于數(shù)據(jù)的分析已經(jīng)是業(yè)內(nèi)大佬的共識(shí)。
眾所周知,亞馬遜的大數(shù)據(jù)分析系統(tǒng)在電商行業(yè)獨(dú)領(lǐng)風(fēng)騷,其會(huì)追蹤用戶在電商網(wǎng)站和APP上的一切行為,盡可能多地收集數(shù)據(jù)。只要看一下亞馬遜的“賬戶”部分,就會(huì)發(fā)現(xiàn)其強(qiáng)大的賬戶管理,這也是為收集用戶數(shù)據(jù)服務(wù)的。主頁(yè)上有不同的部分,例如“愿望清單”、“為你推薦”、“瀏覽歷史”、“與你瀏覽過(guò)的相關(guān)商品”、“購(gòu)買此商品的用戶也買了”,亞馬遜保持對(duì)用戶行為的追蹤,為用戶提供卓越的個(gè)性化購(gòu)物體驗(yàn)。而作為亞馬遜最大對(duì)手的沃爾瑪,其也通過(guò)店內(nèi)的Wi-Fi搜集了將近1.45億美國(guó)客戶(相當(dāng)于美國(guó)成年人的60%)的詳盡數(shù)據(jù),包括他們購(gòu)買的物品、住的地方,以及喜歡的產(chǎn)品等。與此同時(shí),其還通過(guò)分析用戶在Walmart.com的點(diǎn)擊行為,消費(fèi)者在店內(nèi)和線上購(gòu)買的物品以及推特上的趨勢(shì),判斷當(dāng)?shù)氐幕顒?dòng)和天氣變化將如何影響用戶的購(gòu)買模式等。根據(jù)大數(shù)據(jù)分析出的結(jié)果,沃爾瑪可以靈活調(diào)控倉(cāng)庫(kù)中的貨物存儲(chǔ),動(dòng)態(tài)調(diào)整價(jià)格,以短信和直郵的形式對(duì)用戶進(jìn)行精準(zhǔn)營(yíng)銷,同時(shí)實(shí)現(xiàn)自身銷售利潤(rùn)的最大化。
再如傳統(tǒng)IT企業(yè)的IBM,其知名AI系統(tǒng)沃森,從2015 年 4 月進(jìn)入醫(yī)療領(lǐng)域至今,為了讓沃森商業(yè)化,IBM先后花了40 多億收購(gòu)其他公司,而并購(gòu)的目的是這些公司擁有大量的醫(yī)療數(shù)據(jù)資源,比如記帳記錄,患者病史,X 射線和 M.R.I 圖片等。與沃森類似,谷歌著名的AI系統(tǒng)DeepMind目前也已經(jīng)進(jìn)入醫(yī)療行業(yè)。去年11月,公司獲得了首個(gè)付費(fèi)項(xiàng)目,與NHS公立醫(yī)院皇家自由倫敦醫(yī)院(Royal Free London)簽下五年的合同,為其處理170萬(wàn)份病歷。此外,DeepMind還獲得了訪問(wèn)其它倫敦醫(yī)院兩個(gè)數(shù)據(jù)庫(kù)的權(quán)限,即DeepMind利用AI軟件分析了約100萬(wàn)份視網(wǎng)膜掃描報(bào)告成功找到了退行性眼疾的早期征兆,或通過(guò)頭頸部癌癥圖像讓AI軟件學(xué)會(huì)區(qū)分健康和癌組織之間的不同。
從上述沃森、DeepMind的商業(yè)化看,均需要首先獲取現(xiàn)實(shí)世界的大數(shù)據(jù),即使擁有大量數(shù)據(jù)的可供挖掘的谷歌,運(yùn)用AI及機(jī)器學(xué)習(xí)技術(shù)改進(jìn)醫(yī)院、電網(wǎng)及工廠等系統(tǒng)時(shí),獲取其詳細(xì)的數(shù)據(jù)也非常重要。
最后是目前業(yè)內(nèi)熱炒和效仿的亞馬遜智能音箱Echo和其對(duì)手Google Home,在某種意義上,購(gòu)買 Echo 或 Google Home 表示消費(fèi)者已經(jīng)接受了購(gòu)買互聯(lián)網(wǎng)設(shè)備的事實(shí):通過(guò)內(nèi)建的麥克風(fēng),這些設(shè)備的工作方式就是 24 小時(shí)不停地監(jiān)聽(tīng)周遭環(huán)境,以便及時(shí)對(duì)用戶的呼叫做出反應(yīng);同時(shí)相應(yīng)公司會(huì)收集用戶數(shù)據(jù)進(jìn)行分析以不斷提高自己的服務(wù)質(zhì)量。
由上述我們不難看到,無(wú)論是傳統(tǒng)企業(yè)還是全球的科技大佬,在AI時(shí)代來(lái)臨之際,都在千方百計(jì)獲得用戶的數(shù)據(jù)或者信息(搜集和利用用戶的信息是充分發(fā)揮AI不可或缺的重要一環(huán),否則AI將成為無(wú)水之源,無(wú)本之木),更好地服務(wù)于用戶。
當(dāng)然,我們?cè)诖瞬⒎欠裾J(rèn)數(shù)據(jù)安全和用戶數(shù)據(jù)隱私的重要,只是不能因噎廢食,即為了所謂安全和隱私而忽視,甚至放棄獲取數(shù)據(jù),而是如何在獲取數(shù)據(jù)的同時(shí),利用協(xié)議、技術(shù)等手段告知和保證用戶的數(shù)據(jù)和隱私安全,盡量做到獲取和利用數(shù)據(jù)與安全的平衡。而提到平衡,我們不得不提及蘋果。
業(yè)內(nèi)知道,蘋果在AI 領(lǐng)域的研究進(jìn)程要晚于競(jìng)爭(zhēng)對(duì)手,根本原因就是他們不想像谷歌和Facebook 那樣“侵犯”用戶的個(gè)人數(shù)據(jù)。為此,蘋果擁有大型的隱私保護(hù)項(xiàng)目。該項(xiàng)目使用了在學(xué)術(shù)領(lǐng)域被稱為差分隱私的概念,并且將這個(gè)概念用在了iPhone 上的AI 程序上。差分隱私的工作方式是在好數(shù)據(jù)中插入噪音或是壞數(shù)據(jù),一次來(lái)混淆那些試圖侵犯?jìng)(gè)人隱私的人。例如,為了讓蘋果的軟件將所有含有狗的照片放在同一個(gè)相冊(cè)里,它需要收集大量狗的圖片。蘋果會(huì)收集這些圖片,但是在收集之前,他們會(huì)對(duì)數(shù)據(jù)進(jìn)行加密,然而將這些數(shù)據(jù)和其他一些無(wú)關(guān)的數(shù)據(jù)放在一起,這樣一來(lái),如果有人試圖恢復(fù)原始數(shù)據(jù),他們也無(wú)法得知哪些數(shù)據(jù)來(lái)自哪些用戶。這個(gè)技術(shù)被認(rèn)為是最好的隱私保護(hù)技術(shù),其防護(hù)程度要高于現(xiàn)有的其他數(shù)據(jù)保護(hù)方式。
對(duì)此,業(yè)內(nèi)分析認(rèn)為,蘋果在隱私保護(hù)方面的嘗試,盡管可能會(huì)拖慢他們的產(chǎn)品開(kāi)發(fā)速度,但是這樣的犧牲卻能夠獲得用戶的信任。蘋果正在使用一些非常艱深的技術(shù)來(lái)保護(hù)用戶的隱私,這使得谷歌和Facebook 將會(huì)在未來(lái)某一天感到壓力,因?yàn)樘O果提供了能和他們的產(chǎn)品匹敵的產(chǎn)品,而且更安全。
與蘋果類似,榮耀在信息獲取層面,不僅嚴(yán)格遵循必須通過(guò)用戶授權(quán)的原則,即Magic Live系統(tǒng)以及APP在獲取或者使用用戶的個(gè)人數(shù)據(jù):日歷、短信、電話、通訊錄、提醒事項(xiàng)、照片和位置等之前,都必須要得到用戶的許可。其次,在數(shù)據(jù)處理層面,遵循信息本地化處理原則。就地分析,不上傳云端,也不對(duì)第三方開(kāi)放。此外,在這兩個(gè)原則之上,其還設(shè)置了兩層防護(hù),即在榮耀Magic搭載的海思麒麟芯片內(nèi)部,設(shè)有TEE安全區(qū),用戶敏感數(shù)據(jù)基于芯片進(jìn)行加密。秘鑰的保存和加解密過(guò)程都是在芯片內(nèi)部完成的,Android側(cè)無(wú)法接觸到秘鑰和加解密過(guò)程。Magic Live還增加了防root及入侵檢測(cè)功能。一旦發(fā)現(xiàn)Android系統(tǒng)異常,例如異常獲取用戶數(shù)據(jù)的行為等,Magic Live會(huì)拒絕執(zhí)行用戶隱私數(shù)據(jù)的解密功能,確保安全。
綜上所述,我們認(rèn)為,此次《華爾街日?qǐng)?bào)》報(bào)道的華為與騰訊因用戶數(shù)據(jù)之爭(zhēng),從一個(gè)側(cè)面反映出數(shù)據(jù)搜集和利用對(duì)于AI和用戶的重要價(jià)值,同時(shí)也提醒業(yè)內(nèi),保護(hù)用戶數(shù)據(jù)和信息隱私的重要性,且不能因噎廢食,即過(guò)分強(qiáng)調(diào)一方,忽視,甚至放棄另一方,對(duì)于AI的發(fā)展及其給用戶帶來(lái)的價(jià)值都是弊大于利。