移動(dòng)互聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)等技術(shù)的快速發(fā)展,孕育并產(chǎn)生了各種新的服務(wù)模式和應(yīng)用,例如打車、外賣等基于位置的服務(wù),互聯(lián)網(wǎng)金融、小額貸款等基于征信的服務(wù)等。這些服務(wù)和應(yīng)用一方面采集用戶的相關(guān)信息,另一方面為用戶提供精準(zhǔn)化、個(gè)性化的服務(wù),給人們的生活帶來了極大便利。根據(jù)IDC發(fā)布的數(shù)據(jù),截止到2018年底,中國大數(shù)據(jù)解決方案市場軟硬服總額達(dá)到388.8億元人民幣,并有望在2023年超過800億元人民幣,全球市場則將超過3000億美元。
然而,這些服務(wù)所采集的信息中往往含有大量包括病史、收入、身份、興趣及位置等在內(nèi)的敏感信息,對(duì)這些信息的共享、收集、發(fā)布、分析與利用等操作會(huì)直接或間接地泄露用戶隱私,給用戶帶來極大的威脅和困擾。因此,用戶隱私保護(hù)已成為人們廣泛關(guān)注的焦點(diǎn)。
去年5月《通用數(shù)據(jù)保護(hù)條例》(即GDPR)在歐盟范圍內(nèi)正式執(zhí)行。該條例規(guī)定,企業(yè)處理個(gè)人數(shù)據(jù)的業(yè)務(wù)流程必須在設(shè)計(jì)和默認(rèn)情況下構(gòu)建數(shù)據(jù)保護(hù),這意味著個(gè)人數(shù)據(jù)必須使用假名(Pseudonymization)或完全匿名(data anonymisation)進(jìn)行存儲(chǔ),并且默認(rèn)使用盡可能最高的隱私設(shè)置,以避免公開數(shù)據(jù)未經(jīng)明確同意被使用。
為了應(yīng)對(duì)日益嚴(yán)峻的隱私保護(hù)監(jiān)管措施,科技公司不得不對(duì)自己的服務(wù)和隱私政策作出修改。以谷歌為例,其不斷修訂的隱私政策中除了在用語及措辭上具有很大的風(fēng)格轉(zhuǎn)變,創(chuàng)建了用戶可以部分或者全部刪除自己的信息的體系,還向用戶提供視頻、示例、注解、鏈接跳轉(zhuǎn)等方式供用戶更進(jìn)一步了解其隱私政策的整體條款、所收集的用戶信息、收集數(shù)據(jù)的目的、用戶的隱私控制項(xiàng)等,以保證實(shí)現(xiàn)用戶的知情權(quán)。
該條例無疑為蓬勃發(fā)展的大數(shù)據(jù)行業(yè)套上了沉重的枷鎖。對(duì)于數(shù)據(jù)提供方來說,數(shù)據(jù)的獲取、保存成本都會(huì)極大的提高,而保障數(shù)據(jù)的更正權(quán)和被遺忘權(quán)則需要更多的人工和時(shí)間成本。對(duì)于數(shù)據(jù)的利用方來說,使用范圍、使用方式都被限制在了很小的范圍內(nèi),更不論GDPR對(duì)其提出的匿名化、加密化的成本提升。
除了外部因素之外,隱私數(shù)據(jù)的處理過程當(dāng)中還面臨著三個(gè)內(nèi)部矛盾:效率、安全、數(shù)據(jù)孤島。 安全方面,目前的大數(shù)據(jù)行業(yè)主要依托于可信第三方的計(jì)算服務(wù)。這些第三方包括主要應(yīng)用于科研領(lǐng)域的超算中心和主要應(yīng)用于商業(yè)領(lǐng)域的數(shù)據(jù)中心。大數(shù)據(jù)行業(yè)的高性能、高投入需求讓規(guī)模化、集中化的運(yùn)算成為了市場主流,2011年起,我國規(guī)劃建設(shè)了255個(gè)數(shù)據(jù)中心,總設(shè)計(jì)服務(wù)器規(guī)模728萬臺(tái),承擔(dān)了我國大部分民用數(shù)據(jù)的計(jì)算服務(wù)。
但這些集中化、規(guī)模化的數(shù)據(jù)中心未免讓人心生疑慮:如何保障企業(yè)的“數(shù)字黃金”是安全的?就在今年2月,由于阿里云代碼托管平臺(tái)的項(xiàng)目權(quán)限設(shè)置存在歧義,導(dǎo)致開發(fā)者操作失誤,造成至少40家以上企業(yè)的200多個(gè)項(xiàng)目代碼泄露,其中涉及到萬科集團(tuán)、咪咕音樂、51信用卡旗下51足跡、百度無人車合作伙伴ecarx等知名企業(yè)。
可信第三方不一定一直可信,而數(shù)據(jù)中心可能出現(xiàn)的問題也并不是空穴來風(fēng):我國網(wǎng)絡(luò)信息安全監(jiān)管要求,經(jīng)營增值電信業(yè)務(wù)的外商投資電信企業(yè)外資占股不得超過50%。這意味著外資企業(yè)若要在華提供公有云服務(wù),須與國內(nèi)的云服務(wù)企業(yè)合作,才能確保服務(wù)落地。網(wǎng)絡(luò)信息安全中云計(jì)算是其中重要的內(nèi)容,即外企進(jìn)入到中國市場,須受到電信監(jiān)管、牌照、數(shù)據(jù)安全等方面的政策限制。對(duì)外如此,對(duì)內(nèi)也如此,第三方帶來的風(fēng)險(xiǎn)是不能被忽視的。
效率方面,在隱私信息的生命周期中,受益于二戰(zhàn)及其后軍事目的的密碼學(xué)發(fā)展,隱私的加密化、匿名化和脫敏技術(shù)都已經(jīng)非常成熟,可以大規(guī)模應(yīng)用在隱私獲取、儲(chǔ)存、流轉(zhuǎn)等環(huán)節(jié)中。但大數(shù)據(jù)時(shí)代的到來,讓隱私數(shù)據(jù)的處理成為了一個(gè)難題:大規(guī)模的加密數(shù)據(jù)處理一定會(huì)導(dǎo)致計(jì)算性能下降,而非加密數(shù)據(jù)處理又一定會(huì)導(dǎo)致隱私信息的泄露。
最后一點(diǎn),隨著大數(shù)據(jù)技術(shù)的日益發(fā)展,企業(yè)間的數(shù)據(jù)孤島問題也愈發(fā)嚴(yán)重。隨著大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,政府、企業(yè)和其他主體掌握著大量的數(shù)據(jù)資源,然而由于缺乏數(shù)據(jù)共享交換協(xié)同機(jī)制,“數(shù)據(jù)孤島”現(xiàn)象逐漸顯現(xiàn)。
以保險(xiǎn)行業(yè)為例,為了進(jìn)一步吸引客戶,保險(xiǎn)公司已經(jīng)從過去的比質(zhì)量、拼價(jià)格過度到“比個(gè)性”。各家保險(xiǎn)公司都在“服務(wù)個(gè)性化”上下功夫,相繼推出了一些吸引客戶的創(chuàng)新服務(wù)方式。基于人工智能的定制化保險(xiǎn)成為了市場關(guān)注的焦點(diǎn):根據(jù)投保人的生活習(xí)慣、駕駛習(xí)慣、醫(yī)療記錄等數(shù)據(jù)為每個(gè)投保人生成針對(duì)性的保險(xiǎn)服務(wù)。在這個(gè)過程當(dāng)中,保險(xiǎn)服務(wù)提供商希望獲得用戶的消費(fèi)數(shù)據(jù)、駕駛習(xí)慣、醫(yī)療數(shù)據(jù)等。但鑒于數(shù)據(jù)可復(fù)制的特性,愿意將自己企業(yè)獲得的數(shù)據(jù)進(jìn)行分享的企業(yè)卻沒有幾家,無法獲得這些個(gè)性化數(shù)據(jù)的個(gè)性化保險(xiǎn)也就無從談起。
針對(duì)這些問題,學(xué)術(shù)界和企業(yè)界都開展了大量的研究工作,并在社交網(wǎng)絡(luò)、位置服務(wù)、云計(jì)算、大數(shù)據(jù)、智能醫(yī)療、智能電網(wǎng)、智能交通等方面提出了諸多具體的隱私保護(hù)方案。區(qū)塊鏈行業(yè)也出現(xiàn)了一些比較有代表性的項(xiàng)目,其中包括萬象區(qū)塊鏈、公信寶、ARPA等。
其中,ARPA采用了Layer 2解決方案。ARPA聯(lián)合創(chuàng)始人兼CEO徐茂桐表示,ARPA是全球唯一的MPC可用的layer2計(jì)算網(wǎng)絡(luò)。Layer 2即數(shù)據(jù)鏈路層,是OSI參考模型第二層,位于物理層與網(wǎng)絡(luò)層之間,負(fù)責(zé)網(wǎng)絡(luò)尋址、錯(cuò)誤偵測和改錯(cuò),以太網(wǎng)、無線局域網(wǎng)(Wi-Fi)和通用分組無線服務(wù)(GPRS)等都屬于Layer 2。
如麻省理工學(xué)院媒體實(shí)驗(yàn)室數(shù)字貨幣計(jì)劃(MITDCI)的負(fù)責(zé)人Neha Narula所講,區(qū)塊鏈行業(yè)中Layer2的關(guān)鍵特征是“計(jì)算被移除至鏈下,以實(shí)現(xiàn)隱私或節(jié)省計(jì)算資源的目的”。大數(shù)據(jù)行業(yè)中的計(jì)算一直有巨規(guī)模、多樣化、高增速的特征,將所有數(shù)據(jù)上鏈進(jìn)行計(jì)算,一方面讓儲(chǔ)存、通信成本急劇上升,另一方面也使隱私銷毀無法實(shí)現(xiàn)。
因此,Layer 2隱私計(jì)算的特征是,鏈上僅僅作為賬本,對(duì)數(shù)據(jù)資產(chǎn)實(shí)現(xiàn)確權(quán)和記錄,實(shí)際上的計(jì)算全部發(fā)生在鏈下。鏈下計(jì)算的過程中,為避免數(shù)據(jù)泄露,計(jì)算過程往往會(huì)發(fā)生在TEE(可信硬件)中,或采用MPC的方式進(jìn)行計(jì)算。ARPA采用的是MPC(安全多方計(jì)算,Secure Multi-Party Computation)技術(shù)。MPC是一種在無可信第三方的情況下,安全地計(jì)算一個(gè)約定函數(shù)的方式,也是電子選舉、門限簽名以及電子拍賣等諸多應(yīng)用得以實(shí)施的密碼學(xué)基礎(chǔ)。MPC由我國目前唯一圖靈獎(jiǎng)獲得者姚期智院士提出,其提出場景為百萬富翁問題:在沒有可信第三方的前提下,兩個(gè)百萬富翁如何不泄露自己的真實(shí)財(cái)產(chǎn)狀況來比較誰更有錢。MPC可以在保證各方數(shù)據(jù)安全的同時(shí),聯(lián)合使用各方數(shù)據(jù)來達(dá)到特定的效果,從而充分發(fā)揮數(shù)據(jù)的價(jià)值。
多個(gè)持有各自私有數(shù)據(jù)的參與方,共同執(zhí)行一個(gè)計(jì)算邏輯計(jì)算邏輯(如,求最大值計(jì)算),并獲得計(jì)算結(jié)果。但過程中,參與的每一方均不會(huì)泄漏各自數(shù)據(jù)的計(jì)算,被稱之為MPC,MPC可以在Layer 2上實(shí)現(xiàn),而不用依賴于可信第三方進(jìn)行計(jì)算。 這種模式的優(yōu)勢在于,可以在協(xié)議層上解決上述的三個(gè)問題:安全、效率、數(shù)據(jù)孤島。
首先,安全方面,由于采用了區(qū)塊鏈技術(shù),去中心化的架構(gòu)可以避免將數(shù)據(jù)集中在第三方的服務(wù)器上。同樣,得益于MPC的引入,計(jì)算過程和結(jié)果都處于加密當(dāng)中,并不會(huì)導(dǎo)致數(shù)據(jù)的泄露。
其次,在效率方面,ARPA聯(lián)合創(chuàng)始人兼CEO徐茂桐告訴鏈得得App,MPC在執(zhí)行計(jì)算的過程中,的確無法避免密態(tài)數(shù)據(jù)計(jì)算必然產(chǎn)生的低效率問題。與明文數(shù)據(jù)計(jì)算相比,MPC的計(jì)算速度約為前者的百分之一到數(shù)百分之一,并且計(jì)算方越多,效率就會(huì)越低。但從實(shí)際使用的角度來說,這個(gè)速度已經(jīng)足夠應(yīng)對(duì)大多數(shù)的計(jì)算場景了:得出計(jì)算結(jié)果的時(shí)間從毫秒級(jí)上升到了秒級(jí),對(duì)于大部分用戶來說是可以接受的。另一方面,雖然計(jì)算方越多,效率就會(huì)越低,但大多數(shù)的商用場景并不需要太多節(jié)點(diǎn)進(jìn)行運(yùn)算,所產(chǎn)生的效率問題也處于可以接受的范圍之內(nèi)。
最后,在打破數(shù)據(jù)孤島方面,區(qū)塊鏈+MPC更有先天的優(yōu)勢。金融機(jī)構(gòu)在查詢征信數(shù)據(jù)的時(shí)候,經(jīng)過多家銀行和金融機(jī)構(gòu)的協(xié)同計(jì)算,最終只會(huì)得出“是”或“否”的結(jié)果,過程當(dāng)中無法獲得其他節(jié)點(diǎn)的數(shù)據(jù),其他節(jié)點(diǎn)也無法獲得個(gè)人姓名等信息。
ARPA聯(lián)合創(chuàng)始人兼CEO徐茂桐認(rèn)為,區(qū)塊鏈+隱私計(jì)算的發(fā)展,必然會(huì)重構(gòu)當(dāng)前大數(shù)據(jù)行業(yè)的業(yè)態(tài)。
在傳統(tǒng)的業(yè)態(tài)中,企業(yè)想要利用數(shù)據(jù),首先需要自己收集或購買其他來源的數(shù)據(jù),然后利用規(guī)模化、集中化的數(shù)據(jù)中心提供的計(jì)算資源進(jìn)行計(jì)算,最終得到結(jié)果。在這個(gè)過程當(dāng)中,從第三方數(shù)據(jù)源購買或出售數(shù)據(jù)、通過第三方數(shù)據(jù)中心進(jìn)行計(jì)算,都存在數(shù)據(jù)泄露的風(fēng)險(xiǎn)。以銀行貸款為例,銀行想要獲得申請(qǐng)人的征信數(shù)據(jù),首先需要查詢央行提供的征信數(shù)據(jù)庫,還需要在銀行內(nèi)部查詢申請(qǐng)人的資金流水和標(biāo)簽,至于申請(qǐng)人是否還在螞蟻金服等互聯(lián)網(wǎng)金融服務(wù)提供商有不良信用記錄就無從查起了。查詢的過程發(fā)生在數(shù)據(jù)中心里,存在較高的風(fēng)險(xiǎn)。
而被重構(gòu)之后的業(yè)態(tài)中,企業(yè)可以直接通過MPC在保護(hù)企業(yè)數(shù)據(jù)的同時(shí)與其他節(jié)點(diǎn)進(jìn)行聯(lián)合計(jì)算,從而將第三方數(shù)據(jù)源和數(shù)據(jù)中心從體系內(nèi)排除出去,減少工作流程,從而達(dá)到降低成本、提高效率的目的。在該體系下,銀行可以直接利用MPC查詢其他銀行、金融服務(wù)機(jī)構(gòu),甚至個(gè)人提供的征信數(shù)據(jù),最終得到一份征信報(bào)告,顯示申請(qǐng)人在多少機(jī)構(gòu)存在不良記錄,其他機(jī)構(gòu)也無法獲取申請(qǐng)人的信息。
2018年信通院發(fā)布的《數(shù)據(jù)流通關(guān)鍵技術(shù)白皮書》中認(rèn)為,多方安全計(jì)算對(duì)解決網(wǎng)絡(luò)環(huán)境下的信息安全具有重要價(jià)值。ARPA聯(lián)合創(chuàng)始人兼CEO徐茂桐告訴鏈得得App,ARPA依托其強(qiáng)大的技術(shù)團(tuán)隊(duì),正在與中國信通院合作編寫多方安全計(jì)算行業(yè)標(biāo)準(zhǔn),將MPC性能、效率等關(guān)鍵指標(biāo)進(jìn)行規(guī)范,以促進(jìn)隱私計(jì)算和區(qū)塊鏈行業(yè)的快速發(fā)展。
徐茂桐告訴鏈得得App,ARPA的目標(biāo)是構(gòu)建分布式的商業(yè)社會(huì),各行各業(yè),甚至個(gè)人都能在保證隱私的前提下將自己的數(shù)據(jù)分享出來,最終創(chuàng)造更大的價(jià)值。(本文首發(fā)鈦媒體)
更多精彩內(nèi)容,關(guān)注鈦媒體微信號(hào)(ID:taimeiti),或者下載鈦媒體App