我們?cè)倩氐絼倓偟睦樱瑸槭裁茨兀克麄兒髞斫?jīng)過檢測(cè),發(fā)現(xiàn)西藏和新疆的男性總是給太太和愛人許下諾言,有一天我要帶你去看海,可是一下子去不了,怎么辦呢?先買一個(gè)筆記本表示一下心意,這是解釋的一種,但這是不是一個(gè)知識(shí)?最多的解釋,數(shù)據(jù)挖掘能發(fā)現(xiàn)一些新的知識(shí),而我們知道的,數(shù)據(jù)挖掘不僅僅是挖掘數(shù)據(jù),還會(huì)挖掘圖像,挖掘文本,挖掘視頻。現(xiàn)在的數(shù)據(jù)挖掘是非常強(qiáng)大的,我們周圍有很多的攝像頭,你在這個(gè)鏡頭出現(xiàn)過,挖掘一下你有沒有在那個(gè)鏡頭出現(xiàn)過,如果它都監(jiān)控過,就可以挖掘到今天同一個(gè)人在哪里哪里出現(xiàn)過,這就牽涉到我們公民生活一個(gè)很重要的方面--隱私,在這個(gè)時(shí)代還有沒有隱私。
另外還有一個(gè)很有名的事,有一個(gè)百貨店,有一個(gè)父親生氣來質(zhì)問這個(gè)銷售經(jīng)理,“你為什么給我未成年的女兒寄這個(gè)東西”,經(jīng)理一看是一個(gè)懷孕婦女的用品,過幾天父親發(fā)現(xiàn)他的女兒居然懷孕了,那么他現(xiàn)在對(duì)這些企業(yè)而言,已經(jīng)是一個(gè)很基本的數(shù)據(jù)挖據(jù)。現(xiàn)在對(duì)企業(yè)最大的挑戰(zhàn)是什么?挑戰(zhàn)是我要讓你不知道我知道你懷孕了,要是知道,我作為一個(gè)顧客,我要知道你知道我懷孕了,我會(huì)覺得被冒犯了,下次我恐怕不會(huì)來你這里買東西,這就是平衡。但是商家他不想冒犯你,他用很巧妙的形式來隱瞞自己的意圖,他把這個(gè)廣告放在其他的廣告里面,好像裝作自己不經(jīng)意,數(shù)據(jù)挖掘已經(jīng)到達(dá)一個(gè)很普遍而且大家都在用的東西。
到2004年的時(shí)候又出現(xiàn)了一個(gè)新的現(xiàn)象,就是facebook。我們回到創(chuàng)新這個(gè)話題,facebook是不是創(chuàng)新?那肯定是創(chuàng)新。前一段時(shí)間我看國內(nèi)有很多制度來鼓勵(lì)創(chuàng)新,我當(dāng)時(shí)也跟幾個(gè)朋友討論了,說可不可行呢?馬克?扎克伯格為什么要建facebook?他建facebook的理由很簡(jiǎn)單,就是想多認(rèn)識(shí)一些漂亮的女孩子,后來他就是想幫助別人多認(rèn)識(shí)一些漂亮的女孩子。facebook開始就是一個(gè)大學(xué)交流平臺(tái),就這么簡(jiǎn)單,后來他就去見硅谷的投資商,人家給了他1000萬,覺得這個(gè)東西有前途。創(chuàng)新不是一個(gè)制度化的東西可以鼓勵(lì)出來的,它是真正源于一種在自由的情況下的一種內(nèi)在的能量的爆發(fā)。
facebook給人類社會(huì)大數(shù)據(jù)的現(xiàn)象是一個(gè)“一錘定音”。為什么這么說呢?我們說以前是信息系統(tǒng)在收集數(shù)據(jù),這時(shí)候是每個(gè)人都在貢獻(xiàn)數(shù)據(jù),你也發(fā)微博,他也發(fā)微博,而且你發(fā)了一條微博可能有視頻,有圖像。原來的信息系統(tǒng)收集恐怕就是數(shù)據(jù),記錄一個(gè)商業(yè)過程,這時(shí)候全世界的人開始貢獻(xiàn)數(shù)據(jù),而且這種數(shù)據(jù)有一個(gè)不同的名字叫“非結(jié)構(gòu)保持性”,跟以前的數(shù)據(jù)不一樣。大家想想什么叫非結(jié)構(gòu)化?就是格式大小不一定一致。你發(fā)了一條微博大小肯定跟他發(fā)的不一致,你可能有三張圖片,他可能沒圖片,你可能140個(gè)字,他可能只有20個(gè)字,這種數(shù)據(jù)的挖掘也很難,這時(shí)候人類的數(shù)據(jù)一下子就開始爆炸了,大數(shù)據(jù)已經(jīng)成為一個(gè)不可挽回的現(xiàn)象,為什么呢?因?yàn)?0%的數(shù)據(jù)都是這種數(shù)據(jù),原來信息系統(tǒng)收集的數(shù)據(jù)變成20%,變成少數(shù)了,這就是不折不扣的進(jìn)入大數(shù)據(jù)時(shí)代。
我們看到中國社會(huì)因?yàn)槲⒉┮舶l(fā)生了很多深刻的變化,很多事情都是由微博出發(fā)的,帶表局長的事,高鐵的事等等。我記得高鐵的事的時(shí)候,我正在美國,我一直跟蹤在微博上看,就是大家對(duì)這個(gè)事情的評(píng)論,事情不斷地推進(jìn)。比如盲人的事件的時(shí)候我也在里頭,而且這些事件,你們能很快地從微博當(dāng)中跟蹤到最新的消息。你看微博被另外一個(gè)交流協(xié)同的影響比地震波還快,首先在微博可以看到那個(gè)地方地震了,幾秒鐘之后感到地震波,有振動(dòng)。所以我們可以多說兩句,因?yàn)檫@個(gè)東西太重要了,微博把這個(gè)平臺(tái),把互聯(lián)網(wǎng)的交流溝通的功能推向了一個(gè)登峰造極的地步。我個(gè)人認(rèn)為我們很難再超越在現(xiàn)有的互聯(lián)網(wǎng)架構(gòu)上很難有再超越微博新的發(fā)明和應(yīng)用產(chǎn)生,要超越的話只有把現(xiàn)有的互聯(lián)網(wǎng)架構(gòu)重新推倒了再來。這就是Web3.0或者是Web2.0。
王總和姜總他們兩個(gè)人都很博學(xué),我今天下午和他們交流的時(shí)候已經(jīng)學(xué)到了很多東西。王總是投資公司的老總,他剛才跟我說,他投資的項(xiàng)目100%全是基于微博的力量。我們?cè)倩氐?ldquo;大數(shù)據(jù)”上,2010年的時(shí)候“大數(shù)據(jù)”就成了一個(gè)很普遍的現(xiàn)象,2012年的時(shí)候“大數(shù)據(jù)”成了一個(gè)美國的國家戰(zhàn)略。奧巴馬把這個(gè)提得很高,他認(rèn)為是跟互聯(lián)網(wǎng)的超級(jí)計(jì)算一樣重要。美國聯(lián)邦政府投互聯(lián)網(wǎng)的時(shí)候投了5億,現(xiàn)在他們宣布給了2億多。也是“大數(shù)據(jù)”很常見的一個(gè)解釋,我就不多說了。
我們最后來分析一下,這種種的現(xiàn)象最后導(dǎo)致了數(shù)據(jù)的增加,特別是社交媒體,使數(shù)據(jù)量大到物聯(lián)網(wǎng)上,最后這個(gè)“大數(shù)據(jù)”的現(xiàn)象意味著什么呢?它代表的是什么呢?我個(gè)人認(rèn)為,是一個(gè)新的時(shí)代來臨,什么時(shí)代呢?信息時(shí)代和知識(shí)時(shí)代,正在向智能時(shí)代邁進(jìn)。最簡(jiǎn)單的解釋就是,我們從數(shù)據(jù)當(dāng)中能有能力去發(fā)現(xiàn)更多的智慧,這是以前發(fā)現(xiàn)不了的,我們說我們?cè)谛畔r(shí)代最大的標(biāo)志是什么?信息無所不在,你想找一個(gè)你不知道的信息,你一百度幾秒鐘就可以找到了答案。信息時(shí)代就像這個(gè)三角形,在上面是知識(shí)時(shí)代,信息要成為知識(shí),什么是知識(shí)?知識(shí)是有規(guī)律的信息,經(jīng)過系統(tǒng)化的信息才成為知識(shí),我們說現(xiàn)在正在一個(gè)知識(shí)的時(shí)代。我們舉幾個(gè)例子,這幾年教育領(lǐng)域近一兩年在發(fā)生很深刻的變化,大家都是在大學(xué)教育,現(xiàn)在是在線教育。斯坦福大學(xué)的英文課現(xiàn)在已經(jīng)有10萬人在上,10萬人同步在聽,有一個(gè)教授在上課,斯坦福大學(xué)的學(xué)生沒有100人,還有99900人都在全世界同步在聽。大家現(xiàn)在要問,這個(gè)技術(shù)是不是以前就成熟了?以前的技術(shù)跟現(xiàn)在的不一樣,他們除了上課之外還做作業(yè),全世界10萬個(gè)人跟這100個(gè)人做的作業(yè)是一樣的,同一個(gè)平臺(tái),在一個(gè)智能學(xué)習(xí)平臺(tái)。
智能學(xué)習(xí)平臺(tái)后面也是“大數(shù)據(jù)”,它能記錄你所有的學(xué)習(xí)行為,然后分析你的學(xué)習(xí)行為,給后來的學(xué)習(xí)者提供建議。你進(jìn)入它所有的鼠標(biāo),你在每一個(gè)PPT上面的停留,你什么地方做錯(cuò)了,它是大量的數(shù)據(jù)之后是不是能積累到很多很多的知識(shí),你一上來如果告訴它我是個(gè)大一的學(xué)生,他就知道大一的學(xué)生學(xué)習(xí)行為應(yīng)該是什么樣子;她是一個(gè)女生,而且學(xué)的是物理學(xué),它這里面有智能的系統(tǒng)會(huì)不斷的引導(dǎo)你。這是以前沒有的,大家可以想象這會(huì)發(fā)生什么變化呢?就是說每一門課都會(huì)有一個(gè)視頻出來,這個(gè)視頻是世界上最好的老師講的,你學(xué)這門課恐怕大家都會(huì)有興趣世界上最好的老師,哈佛的老師,斯坦福的老師講課的時(shí)候是怎么講的,更絕的事是什么,還有好多學(xué)者在進(jìn)行編輯,他們把他們認(rèn)為最好的視頻匯編到一起,不同學(xué)習(xí)者不停地打分,不停地呈現(xiàn),大家可以想象最后出現(xiàn)什么結(jié)果?就是每一門課都會(huì)有一個(gè)最好的視頻,大家都要看這個(gè)視頻,而且是免費(fèi)的,所以說知識(shí)在變?yōu)闊o所不在。
這跟我們的公民生活也都是相關(guān)的,等會(huì)兒我們?cè)倬唧w的闡釋,這個(gè)跟公民生活到底怎么相關(guān)?所以說未來的老師也面臨一個(gè)革命,他上課的時(shí)候就會(huì)想,我們是不是大家都先看看哈佛的老師怎么講,他會(huì)成為一個(gè)課堂的組織者,而不是像以前一樣的是一個(gè)知識(shí)的傳授者。
我們說從知識(shí)時(shí)代進(jìn)入智能時(shí)代還有很多的標(biāo)志,比如說IBM能獲勝,2011年時(shí)候戰(zhàn)勝人類回答問題的冠軍,我們記得,90年代的時(shí)候有一部計(jì)算機(jī)很有名叫“深藍(lán)”,它下象棋戰(zhàn)勝了人類的冠軍。這個(gè)沃森是怎么回事,美國有一個(gè)節(jié)目叫“危險(xiǎn)邊緣”,主持人就是對(duì)參加比賽的人問問題,什么問題都問?天文、地理、語文、數(shù)學(xué)、明星、八卦、做菜、家務(wù)等等什么都問,終于有一個(gè)冠軍出來了,回答戰(zhàn)勝了所有的人,他的知識(shí)面是最廣的,結(jié)果沃森把他戰(zhàn)勝了。就是直接有人向他發(fā)問,然后沃森就回答,把人類冠軍戰(zhàn)勝了,這背后也是一個(gè)大數(shù)據(jù),就是智能。它在快速的處理大量的信息時(shí),一聽到有人問,最后就回答。大家都知道谷歌,谷歌的無人駕駛汽車已經(jīng)快上市了,現(xiàn)已經(jīng)在路面上跑了,它也是一個(gè)大數(shù)據(jù),很快就能決定什么情況應(yīng)該剎車,什么情況應(yīng)該轉(zhuǎn)彎,什么時(shí)候應(yīng)該減速,還有很多繼續(xù)學(xué)習(xí)等等,因?yàn)橹挥邪雮€(gè)小時(shí),我就不展開了。