by徐卓菁
這僅僅是大數(shù)據(jù)時代的一個小故事。我們的身后都拖著一條數(shù)字信息組成的長長的尾巴——IDC最新的數(shù)字宇宙研究預(yù)計,到2020年,世界的數(shù)據(jù)存儲總額將達到35ZB,1ZB等于一萬億GB字節(jié)——我們的生活已經(jīng)變成了一堆數(shù)字,但大部分人對互聯(lián)網(wǎng)的認知仍處于初級階段。
年初,騰訊推出“QQ圈子”使用體驗,“圈子”能智能識別用戶每位好友及潛在好友的真實姓名,并根據(jù)社交關(guān)系進行智能分組,熱情地為用戶實名推薦好友。“圈子”功能引起多數(shù)用戶的反感乃至恐慌。這種恐慌多半緣于隱私問題。即使是那些自認為沒有隱私可瞞的用戶,仍然覺得背后冷汗直冒。他們不理解,騰訊是如何做到這樣精準地了解用戶身份的,是否調(diào)用了聊天記錄等隱私資料?雖然,在法律意識以及對人們心理、情感的認知方面顯得很幼稚,但騰訊無疑成功地炫耀了一把龐大的用戶數(shù)據(jù)庫和后臺算法。
“圈子”背后是強大的數(shù)據(jù)挖掘。QQ把服務(wù)器里的二度好友關(guān)系、群成員關(guān)系、朋友網(wǎng)、班級校友關(guān)系、微博聽眾關(guān)系等等關(guān)系鏈資源整合到一起,完整勾勒出用戶的社交圈,數(shù)據(jù)量越大,結(jié)果越精準。
數(shù)據(jù)是什么?使用手機、點擊網(wǎng)頁、切換電視頻道、開車穿過自動收費站、用借記卡或信用卡購物……我們每時每刻都制造數(shù)據(jù),但我們不會意識到雅虎、Google正在捕獲它們,不會意識到一群新興的數(shù)學精英正千方百計以驚人的準確度剖析它們。這群如狼似虎的數(shù)據(jù)恐怖分子可以洞悉我們的每個舉動,預(yù)測我們的行動計劃,他們神不知鬼不覺地將我們買了什么、對什么感興趣、與誰墜入愛河盡收眼底。對大數(shù)據(jù)投入關(guān)注的人的確存在于金字塔頂端。
我們對數(shù)據(jù)的重視足夠嗎?涂子沛在新書《大數(shù)據(jù)》的“尾聲”里寫道:“中國人數(shù)據(jù)意識的淡薄,由來已久,甚至可以稱之為國民性的一部分。”他引用了黃仁宇的論點:在中國傳統(tǒng)的學問——理學或道學當中,一直都分不清倫理之“理”與物理之“理”的區(qū)別。這兩個“理”混沌不分的結(jié)果,是中國人傾向于粗略的主觀定性、排斥精確的客觀定量,從而養(yǎng)成了重形象、重概括、輕邏輯、輕數(shù)據(jù)的文化習慣。這種文化習慣,使中國人長期沉浸在含蓄、模糊的審美意識當中,凡事只能在美術(shù)化的角度來印證,滿足于基于相似的“模糊聯(lián)想”,止步于用邏輯來分析、用數(shù)據(jù)來證明,最終將表象上的相似,當作本質(zhì)上的相同。
也許“圈子”事件可以是進行普世教育的一個機會,讓我們從最切身的體會出發(fā),領(lǐng)教“數(shù)據(jù)”的威力;社交是可以計算的(Social Computing),情感是可以計算的(Affective Computing)。《大數(shù)據(jù)》以美國為主體,為試圖進一步認識大數(shù)據(jù)究竟有多大、這一世界大潮的來龍去脈為何的普通中國人提供了很好的梳理和參照。
就算不是說故事的高手,涂子沛至少也是個故事數(shù)據(jù)庫。《大數(shù)據(jù)》吸引人的地方,是其中鮮活有趣的故事。不妨把它們分為兩類。
一類是硬故事,政府面對大數(shù)據(jù)做出的應(yīng)對首當其沖。數(shù)據(jù)技術(shù)變革推動政府信息公開、公共財政透明以及其中的曲折;《數(shù)據(jù)質(zhì)量法》背后的隱情;全民醫(yī)改法案的波瀾;統(tǒng)一身份證的百年糾結(jié);美國礦難的悲情記憶,《大數(shù)據(jù)》講述了美國半個多世紀信息開放、技術(shù)創(chuàng)新的歷史(從這點來看,它更像一本社會學而非科技類的書)。
“我們信上帝。除了上帝,任何人都必須用數(shù)據(jù)來說話。”這句話寫在故事的開端。后半句把數(shù)據(jù)提到了和上帝相提并論的高度。可以想象,隨著大數(shù)據(jù)時代的不斷深入,美國人對于上帝的態(tài)度可能會越來越糾結(jié);而對數(shù)據(jù)將會越來越“迷信”。這種“迷信”對聯(lián)邦政府而言,已經(jīng)不僅僅停留在“用數(shù)據(jù)來說話”的層次上了。隨著大數(shù)據(jù)的迅猛增加,各個政府部門都在嘗試“用數(shù)據(jù)來決策”、“用數(shù)據(jù)來管理”、“用數(shù)據(jù)來創(chuàng)新”。涂子沛喜歡用奧巴馬的故事。他說:“我認為奧巴馬是了不起的總統(tǒng)。奧巴馬當時去Google拜票,就表示要設(shè)立國家的首席信息官。到了2010年,他還率先設(shè)置了首席數(shù)據(jù)官。奧巴馬在簽署的首份總統(tǒng)備忘案是《透明和開放的政府》,強調(diào)建立一個開放透明、公民參與、多方合作的政府。第二份備忘案則是《信息自由法》。這是一場數(shù)據(jù)民主化的運動,奧巴馬政府正在把信息的力量放到美國人民的手中。”
Data.gov(www.data.gov)是書中提到的一個十分有趣的例子。美國政府搞的這個網(wǎng)站匯集了各種學科、不同政府部門的有關(guān)數(shù)值數(shù)據(jù),供人們開放檢索、下載,從美國的海外貸款和贈款數(shù)據(jù)、醫(yī)療保險數(shù)據(jù)、美國能源部和國家核安全局的數(shù)據(jù),到食品原料數(shù)據(jù)、性別和種族人員趨勢、農(nóng)貿(mào)市場地理數(shù)據(jù),還有現(xiàn)役軍人的婚姻狀況,甚至改良種用瀕危野馬種類、重量在10公斤以下的野豬種類等等令人意想不到的數(shù)據(jù)信息。涂子沛說:“由政府主導、向全社會開放政府擁有的公共數(shù)據(jù),這種做法本身就是一種創(chuàng)新。”與此同時,美國政府在數(shù)據(jù)公開過程面臨的威脅與困難,或許也能讓我們看到一些借鑒意義。
涂子沛從太平洋對面看到中美兩國的差距,深知這里缺少什么、需要什么。他將十多年觀察、思索所得,淘洗成這一本書。美國是全書主體,但又處處反觀中國當下的現(xiàn)實。涂子沛說:“雖然一談到透明和公開,大多數(shù)人都會認可這是正確的價值觀,但一旦要自己透明、要自己公開,那公開和透明就會立刻轉(zhuǎn)化為一種威脅,政府也不例外。近幾年,世界各國政府的信息公開工作有了新的基點和態(tài)勢。政府信息的公開工作,定位新的G點。”
京公網(wǎng)安備 11010802028547號