王煜全:我覺得悖論是你想象出來的悖論,不是一個真實的,因為首先我們現(xiàn)在所說的預(yù)測基于個人行為數(shù)據(jù)歷史數(shù)據(jù)的預(yù)測,未來行為的預(yù)測并不是去預(yù)測這個人某年某月某日會在某地做某事,不是這種預(yù)測,是你今天收發(fā)了郵件明天可能還會發(fā)郵件,是這種預(yù)測,不是預(yù)測你某年某月會遇到某個貴人,你們兩個人會怎么著,這是真是變成了算命了,這個不是算命,一種行為推理,你可能會發(fā)生這樣一件事,所以你說的你知道那個未來會發(fā)生什么悖論就是根本不存在,因為你知道你明天肯定會發(fā)郵件你就不活到明天了嗎?這是兩回事。
Keso:我覺得這本書就是偏重一個技術(shù)的感覺去看它,可能你會到七八十年代剛有機器人技術(shù)出來的時候,所有人都在懷疑是不是以后機器人要去操縱人類要統(tǒng)治世界,但是實際到今天大家可能也不會考慮太多這些問題,機器更多是給人體夠一個便利,我現(xiàn)在對于大數(shù)據(jù)的挖掘預(yù)測今后可能也是同樣的道理,他們可能會在你的生活里面提供更多的你買機票、買東西給你提供一些推薦和預(yù)測的是一個便利的服務(wù),他不太會走到一個真正的操縱的感覺上。
羅振宇:其實剛才Keso講的是書里面有一段講這個問題,他說比如說給我打電話,你再預(yù)測說我下一秒鐘打電話的可能性甭管是0.1%還是99%,其實對我都沒有意義,但是對誰有意義?對上一個層級的人有意義,比如說附近機站的工程師對他就有意義了,能夠預(yù)測出我們這一群人在下一秒鐘打電話的可能性有多少,他那個機站的帶寬設(shè)到多少對他就有意義,所以這個Keso講的不是從層次上看矛盾對象,一旦層次拉開。
問:我對剛才說的話題有一個可能不太一樣的意見,我覺得巴拉巴西這個書是從數(shù)據(jù)去看未來這是一個方法,但是數(shù)據(jù)是歷史,有一個行為巴拉巴西這點沒有辦法去想到的,那就是我們在座可能每個人都有的能力,創(chuàng)作,我去構(gòu)想一個新的東西,這個不是歷史,這個是未來,因為我隨時可以改變它,我可以去設(shè)計我要講的一個東西可能是什么樣子,這個書對于我來說,那我有了這樣一個歷史的數(shù)據(jù)意味著什么,意味著說我有了對現(xiàn)在更好的一個把握和理解,在我去構(gòu)建這些新的事件的時候我可以做出更好的選擇,所以說我可以去預(yù)測未來,實際上不是預(yù)測未來而是更好地幫助我們?nèi)ミx擇,我覺得是7%實際上我理解的是創(chuàng)造力,因為你說現(xiàn)在人類歷史上很有價值的東西,藝術(shù)作品他們有一個特點是他們不可重復(fù),你沒有辦法預(yù)測一個達芬奇的蒙娜麗莎的誕生,但是它一旦誕生你去重復(fù)也沒有意義,但是一旦誕生會打開一個新的世界,給我們帶來一個新的視角,這個就是7%所存在的意義。我們在了解到我們現(xiàn)在的93%的基礎(chǔ)之上,我們?nèi)プ?%的這樣一個開拓,我對于這個書所講的預(yù)測未來的理解。
羅振宇:好,謝謝。
問:93%這個可能是基于數(shù)據(jù)就是統(tǒng)計方面已經(jīng)邏輯推導(dǎo)了,那7%不可預(yù)測,我先把剛才說的騰訊的圈子,他一出來我就很恐怖,他將我整個社會關(guān)系都給完整地挖了出來,很快做了一個問題他并沒有意識到我跟人關(guān)系的深淺,這個就是確值這個概念,他不知道我最喜歡的姑娘是誰,他沒有反應(yīng)出來,我跟哪個哥們最鐵他也沒有反應(yīng)出來,就是說當(dāng)然他們都在圈子里面,93%預(yù)測這個方面他是相當(dāng)于是物理方面的,統(tǒng)計加邏輯,對于確值這個方面因為我們都知道毛毛細雨和滂沱大雨是兩個概念,雖然都是雨,對于這一塊布我不知道如何要我們?nèi)ミM行策略,以及關(guān)于確值這塊我可以預(yù)測以及7%具體包含哪些東西呢?這是我想知道的兩個問題。
羅振宇:你能再表述一下你的問題嗎?
問:數(shù)據(jù)可以預(yù)測,因為基于統(tǒng)計以及邏輯推導(dǎo),但是確值,我跟你關(guān)系的深淺這個濃度這個概念他沒有給我推導(dǎo)出來。
羅振宇:你的問題是什么?
問:我的問題就是能不能給我推導(dǎo)出來以及是否還有其他的推導(dǎo)出來的?
羅振宇:到什么程度才能推導(dǎo)他來他喜歡哪個姑娘?
女:我覺得是這樣的,從巴拉巴西那本書以及我現(xiàn)有部門的大數(shù)據(jù)這本書我們來看的話,其實大數(shù)據(jù)的專家們他們對于大數(shù)據(jù)他們的基本特征,他覺得在大數(shù)據(jù)時代有兩個特征是比較明顯的,第一他講的是概率性,因為這是海量數(shù)據(jù),另外他覺得精確性已經(jīng)是對他而言并不是非常非常在意的東西了,而是概率性,第二就是數(shù)據(jù)之間的相關(guān)性,這個相關(guān)性是說以前的時候我們這些數(shù)據(jù)都是因果的關(guān)系,現(xiàn)在是說不同的數(shù)據(jù)我們看似是沒有什么樣的,我們不再去挖最終的因果了,而是看是不是有相關(guān)的關(guān)聯(lián),而相關(guān)的關(guān)聯(lián)可能會對數(shù)據(jù)產(chǎn)生一個你覺得這個事情之前是完全沒有任何關(guān)聯(lián)的,但是忽然你覺得這些之間似乎是有某一種意義存在的,比如說就像是我總覺得像亞馬遜他背后的數(shù)據(jù)的統(tǒng)計的平臺,可能他就是根據(jù)用戶的一些習(xí)慣他把你一些不同的情況給關(guān)聯(lián)在一起了,所以我覺得大數(shù)據(jù)時代的兩個特征,一個是概率性,一個是相關(guān)性,這個是基本的特征,剛才您說的精確性他能做到,他是隨著世界上這種技術(shù)的發(fā)展,對于這種計算機也好,對于新的技術(shù)的演進也好精確性是能夠解決的,通過你的樣本的情況以及你一個更大量數(shù)據(jù)和你的操作平臺的控制,你的精確性是可以解決的,但是從商業(yè)發(fā)展而言來看,以及大數(shù)據(jù)的基本的特征來說,它的精確性反而不是過分強調(diào)的。我不知道是不是可以回答你的問題。
男:我理解你的問題是按照邏輯和量化分析之外還能做什么,我的答案是我認(rèn)為有巴拉巴西和大數(shù)據(jù)已經(jīng)有明顯的進展,這個進展不是哲學(xué)問題。第一個在量化分析里面實際上你提了幾個問題都提升到質(zhì),質(zhì)可不可以分析,我明確地提出可以分析,現(xiàn)在這個大數(shù)據(jù)在技術(shù)上有極端的特點,他從結(jié)構(gòu)化數(shù)據(jù)到非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)意味著什么,跟質(zhì)有關(guān)的幾位數(shù)據(jù)開始進行分析領(lǐng)域了,這個里面是圖像,包括語言,包括聲音這幾項都是包含了非邏輯性的因素,它可以由此進入到質(zhì)的分析,比如說我們進行語言分析的時候,從語型到語義要語用就是你言外之意這些分析,實際上是通過語言分析不是通過統(tǒng)計分析,這一點大數(shù)據(jù)可以大大地推進一步,第二我認(rèn)為就是在一時層面之下還有一些過去難以分析的潛意識層面的東西,比如情感的東西等等,你說到深度以后他涉及的是以往在業(yè)余分析的水平里頭佛洛依德曾經(jīng)做過這樣的一種分析,大數(shù)據(jù)現(xiàn)在可以得出明顯的結(jié)論,他可以在專業(yè)水平上做大,比如說你做的夢,你似乎覺得夢是不可以決定的,其實夢是可以決定的,當(dāng)你問你的小孩他夢見的是大灰狼還是老巫婆?這個東西他腦子里想的是什么呢?他夢見的是老巫婆的話是你的愛人對他太嚴(yán)厲了,如果夢見大灰狼是你對他他嚴(yán)厲了,小孩他只受到了壓力他并不做語言分析,但是和他的生活世界覺得最可怕男的動物就是大灰狼,女的動物就是老巫婆,這一點他也可以分析出來,這點只是時間早晚的問題不存在不可克服的障礙,但是有一點從這兩個問題都是屬于受力狀態(tài),自由意志都不是你這個問題,剛才那位說的創(chuàng)造性已經(jīng)逃離了問題的區(qū)域了。
張昕:我理解你還是想擴展93%,你剛才問題是想知道人際關(guān)系濃度的問題,我想反問一個問題,假如說能夠預(yù)測出你喜歡的人話的話你會喜歡這樣的產(chǎn)品嗎?
男:我會立刻拋棄它。
張昕:我不是QQ圈子的產(chǎn)品經(jīng)理我是做別的產(chǎn)品經(jīng)理,其實像你跟某個人的濃度,你跟誰經(jīng)常聊天,聊天的頻次這些都是能捕獲的,另外包括你聊天時間,你用了QQ的聊天,你又用了QQ的輸入法,你跟他發(fā)的時候是用什么樣的語氣詞去寫這個句子的,你包括說你在敲這個字的時候敲了一會兒又退回去,又在改,這些行為都可以給你捕獲的。