經(jīng)濟(jì)觀察網(wǎng) 記者 田進(jìn) 8月31日,在2019中國(guó)500強(qiáng)企業(yè)高峰論壇分論壇第三屆信息安全產(chǎn)業(yè)發(fā)展論壇上,中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心副主任謝高崗發(fā)表演講表示,目前國(guó)家互聯(lián)網(wǎng)發(fā)展迅速,在人、物體、信息的三維融合中,帶來(lái)了數(shù)據(jù)量的激增,此時(shí),如何存儲(chǔ)數(shù)據(jù)并獲得數(shù)據(jù)的價(jià)值成為了一項(xiàng)巨大的挑戰(zhàn)。
根據(jù)IDC的預(yù)測(cè),全球的數(shù)據(jù)量將從2018年的32個(gè)ZB,增至2025年的125個(gè)ZB,其中中國(guó)的數(shù)據(jù)增長(zhǎng)量最為迅速,預(yù)計(jì)到2025年中國(guó)的數(shù)據(jù)量將會(huì)增加48個(gè)ZB,成為全球擁有最大數(shù)據(jù)的國(guó)家。
高崗表示,當(dāng)前,數(shù)據(jù)存儲(chǔ)主要面臨安全性及高能耗兩方面難題。以下為經(jīng)濟(jì)觀察網(wǎng)整理的現(xiàn)場(chǎng)演講文字精簡(jiǎn)。
數(shù)據(jù)的安全性
此前,北京的一個(gè)醫(yī)院感染了勒索病毒,勒索病毒傳到社保系統(tǒng),接著從社保系統(tǒng)傳到更多的醫(yī)院,很長(zhǎng)一段時(shí)間很難恢復(fù)數(shù)據(jù),導(dǎo)致我們回到20年前醫(yī)院掛號(hào)的流程,最后把數(shù)據(jù)解密打開(kāi),也花費(fèi)了很多的錢(qián)財(cái)。
其次,對(duì)于大數(shù)據(jù)泄露,從企業(yè)到國(guó)家網(wǎng)絡(luò)空間,都是非常嚴(yán)峻的問(wèn)題。
2018年8月28日,華住旗下酒店(漢庭、禧玥、桔子、宜必思等10余個(gè)品牌)發(fā)生用戶(hù)數(shù)據(jù)泄露,包括酒店開(kāi)房記錄,住客姓名、手機(jī)號(hào)、郵箱、身份證號(hào)、登錄賬號(hào)密碼等約5億條數(shù)據(jù),被賣(mài)家打包出售。后來(lái)就黑客如何突破數(shù)據(jù)進(jìn)行溯源分析發(fā)現(xiàn),8月4日,黑客通過(guò)VPI服務(wù)器登陸進(jìn)入,然后把黑客軟件下載在服務(wù)器上,從而通過(guò)服務(wù)器把殺毒軟件關(guān)閉,8月5號(hào)就開(kāi)始傳出一部分?jǐn)?shù)據(jù),接著通過(guò)數(shù)據(jù)得到更重要的服務(wù)器用戶(hù)名稱(chēng)和密碼,8月14日,整個(gè)核心數(shù)據(jù)庫(kù)就被導(dǎo)出。
國(guó)家網(wǎng)絡(luò)空間層面,比如說(shuō)斯諾登曝出來(lái)的美國(guó)棱鏡計(jì)劃——美國(guó)和相關(guān)的科技公司合作,通過(guò)互聯(lián)網(wǎng)實(shí)時(shí)監(jiān)控所有的EMAIL 、volp、社交網(wǎng)絡(luò),同時(shí)監(jiān)聽(tīng)互聯(lián)網(wǎng)終端設(shè)備、軟件等。
面對(duì)這些威脅,信息防護(hù)卻是非常困難的,以前系統(tǒng)可以設(shè)置黑名單、白名單來(lái)允許哪些用戶(hù)可以訪問(wèn),哪些不可以訪問(wèn)。在現(xiàn)有的信息系統(tǒng)下,5G和4G的用戶(hù)訪問(wèn)地點(diǎn)是不確定的,所有信息系統(tǒng)永遠(yuǎn)會(huì)存在不知道的漏洞,或者存在漏洞還沒(méi)有修復(fù)的情況,因此也沒(méi)有辦法設(shè)置一些非常確定性的規(guī)則來(lái)應(yīng)對(duì)非確定性的攻擊。
高能耗
第二,數(shù)據(jù)量的激增會(huì)造成非常大的能耗。工信部2018年2月份做的一份統(tǒng)計(jì)顯示,2017年國(guó)家有28.5萬(wàn)個(gè)數(shù)據(jù)中心,總耗電量超過(guò)1200億千瓦時(shí),占整個(gè)國(guó)家2%的用電量。預(yù)計(jì)到2020年用電量還將翻一倍,達(dá)到2962億千瓦時(shí)。因此隨著數(shù)據(jù)的增加,把能耗控制住也成為一個(gè)很大的問(wèn)題。
存儲(chǔ)的介質(zhì)不同,對(duì)應(yīng)的能耗也不一樣。如光存儲(chǔ)的優(yōu)點(diǎn)是能耗非常低、存儲(chǔ)的時(shí)間非常長(zhǎng),同時(shí)只能讀取、病毒無(wú)法感染等,但缺點(diǎn)是吞吐量比較低,只有28兆/S讀寫(xiě)的速度.
因此,我們?cè)谔接懻f(shuō)有無(wú)可能建立一個(gè)新的存儲(chǔ)的方案,用大數(shù)據(jù)分析的方式來(lái)確定數(shù)據(jù)訪問(wèn)的模式,這樣的數(shù)據(jù)訪問(wèn)模式能改造硬件系統(tǒng)、軟件系統(tǒng),把適合不同模式的數(shù)據(jù)放在不同的存儲(chǔ)介質(zhì)上,既保證性能,又降低能耗。
只是,想起來(lái)簡(jiǎn)單做起來(lái)很難。比如如何建立在線學(xué)習(xí)用戶(hù)數(shù)據(jù)訪問(wèn)的模式,能隨時(shí)做出調(diào)整。其次,每個(gè)業(yè)務(wù)和數(shù)據(jù)目標(biāo)都不太一樣,有些數(shù)據(jù)是冷數(shù)據(jù),訪問(wèn)的效率性能不需要太高等。為了構(gòu)建這樣的性能,我們做了一些前期的工作,比如不要用安全的規(guī)則來(lái)控制數(shù)據(jù)訪問(wèn),完全按照數(shù)據(jù)訪問(wèn)的行為來(lái)做安全檢測(cè)。
具體而言,即根據(jù)用戶(hù)對(duì)數(shù)據(jù)訪問(wèn)的模式,將數(shù)據(jù)放在冷數(shù)據(jù)或熱數(shù)據(jù)的位置。我們分析用戶(hù)訪問(wèn)互聯(lián)網(wǎng)視頻的數(shù)據(jù)——不同視頻的流行度與不同訪問(wèn)的途徑。比如說(shuō)有些用戶(hù)是通過(guò)WIFI來(lái)或4G訪問(wèn)視頻,其中10%的視頻會(huì)產(chǎn)生90%的流量。因此如果能把這10%的視頻存儲(chǔ)在SSD上,把剩下的視頻存儲(chǔ)在光存儲(chǔ)上,那么既可以保障存儲(chǔ)的性能,又可以降低存儲(chǔ)的能耗。這些,都需要人工智能不斷的發(fā)展應(yīng)用。
京公網(wǎng)安備 11010802028547號(hào)