王煜全:支招談不上,就是姜老師講的挖煤的,這個里面是非常精彩的,因?yàn)橐磺卸紕傞_始,數(shù)據(jù)的收集剛剛能夠有機(jī)會,那數(shù)據(jù)的解讀也是史無前例的,斯坦福的一個教授(,東歐人,不知道為什么東歐人數(shù)學(xué)總是很好,那個哥們是我們學(xué)術(shù)領(lǐng)域的牛人,他)有一個說法,過去社會學(xué)有一個測本定理,就是三個東西不能全有:一個是全樣本,就是所有人都去檢測,第二個是實(shí)時(shí)數(shù)據(jù),第三個是連續(xù)數(shù)據(jù)。我實(shí)時(shí)采一個點(diǎn)可以知道現(xiàn)在所有人的位置,一個點(diǎn)衛(wèi)星一照沒問題,連續(xù)記錄衛(wèi)星也留不住,以前是沒有辦法,現(xiàn)在有個攝像頭一切都有了,網(wǎng)絡(luò)把你的行為全部連續(xù)記錄下來,而且是所有人的。這就跨到一個新的時(shí)代,我們對人的分析不再是以前說的用取樣分析了,我們可以用全樣本做分析。這時(shí)候就回來了,我們就大量的需要驗(yàn)證,以前只能取樣的理論,現(xiàn)在我們在全樣本上去驗(yàn)證,這里面就很好玩。舉個例子,一直有個說法,現(xiàn)在社會學(xué)那幫人對人研究的興趣還不如行為經(jīng)濟(jì)學(xué),因?yàn)樾袨榻?jīng)濟(jì)學(xué)是要看結(jié)果的,社會學(xué)太理論,我們總結(jié)“大數(shù)據(jù)”給我們的經(jīng)驗(yàn)教訓(xùn),太理論了沒有數(shù)據(jù)做支持就會脫離實(shí)際。其實(shí)行為經(jīng)濟(jì)學(xué)里面最愛做數(shù)據(jù)分析了,哪怕在學(xué)校里也是實(shí)證得來的。
行為經(jīng)濟(jì)學(xué)里面有個領(lǐng)軍人物,我估計(jì)他的那本書大家應(yīng)該能讀,叫“觀看行為學(xué)”,其實(shí)在國外的翻譯叫做“可以預(yù)測的非理性”就是說人都是非理性的,但是人的行為可以分析和預(yù)測,這個作者其實(shí)在另一個研究里面提到他很有趣的研究是什么,如果這個人身材更高,他談戀愛的時(shí)候會有優(yōu)勢,所以矮的人他能夠量化計(jì)算,他要每年多掙多少錢才能談到差不多同樣的女朋友數(shù)量,才能彌補(bǔ)這數(shù),所以個矮的各位趕緊學(xué)習(xí),趕緊掙錢吧,要不然在找朋友上很有劣勢。這個東西可以做到量化,背后的理論依據(jù)是什么?
其實(shí)我們原來在學(xué)校做學(xué)生研究的時(shí)候,專門找過高校的學(xué)生,跟蹤他們的行為也得到了驗(yàn)證,什么意思呢?說簡單點(diǎn)就是社會地位高的人傾向于占有更多的社會資源,在學(xué)生里社會地位高,比如說這人吉他彈的特好被別人崇拜或者這個人是他們的戲劇社的社長,被一堆小女孩追著,他傾向于占有更好的社會資源,他的女朋友一定漂亮。回去看看你們班女朋友漂亮的孩子,一定有出眾的地方,當(dāng)然不一定成績好,別的地方好,受別人追捧。當(dāng)然這事我們現(xiàn)在想辦法在干嘛?在微博里面做全樣本的量化分析,這個是據(jù)我所知國外也沒人干過,我們是干一些史無前例的事,我們跟高校有合作,目標(biāo)是把我們的文章登在頂尖論文期刊上,因?yàn)闆]人干過。怎么測呢?我也告訴大家,看看你們能不能做,能做大家合作:測某個人他擁有社會資源怎樣,就看他的微博里的雙向好友,代表你認(rèn)識的,互相互粉的好友,你的異性好友的年齡和你的平均年齡差,比如說我40歲,我是一個看校門的。另外一個人40歲,他是一個億萬富翁,你猜我們倆誰更有可能認(rèn)識更多年輕漂亮的女孩呢?我想把它量化出來,通過你的異性好友跟你年齡差來推算你是不是掌握更好的社會資源,在男性這個世界里說的比較現(xiàn)實(shí),雖然我們都認(rèn)為未來的共產(chǎn)主義很美好,但是現(xiàn)在我們還是活在真實(shí)世界里,對男性而言找年輕漂亮女孩,人說男性的追求永遠(yuǎn)都沒有變,愛好永遠(yuǎn)沒有變,不管是20歲、30歲、40歲永遠(yuǎn)愛那18歲的,所以你是可測的。這些以前都是調(diào)侃,我們現(xiàn)在把它搞成嚴(yán)肅的,學(xué)術(shù)的東西。因?yàn)槿坑袛?shù)據(jù)支持,所以就能知道數(shù)據(jù)來了以后會怎么樣。
我是師大畢業(yè)的,正好我們學(xué)校旁邊就北郵,我需要借這個機(jī)會在往那個學(xué)校的校長那兒扔只鞋過去,就是這些創(chuàng)新的東西其實(shí)在國外是潮流,是趨勢,就是國外講“大數(shù)據(jù)”的一堆,國外有一個網(wǎng)站所有的新思想在不斷的傳播,中國就需要涂老師從美國回來給我們帶,為什么呢?因?yàn)槟莻€倒霉的破校長搞了一個東西,叫“長城防火墻”。我不知道這和長城是什么關(guān)系?長城是干這個的嗎?把我們的創(chuàng)新思維阻斷了,但是我用我自己的親身經(jīng)歷告訴大家,未來是不可阻擋的,你今天想盡一切辦法去接觸最新的科學(xué),未來你一定收益。
你今天如果學(xué)過去的東西,20年前在師大讀書的時(shí)候,我們那教授說“為什么還要開這門課?”因?yàn)樗€沒退休,當(dāng)然了等他退休了,我們畢業(yè)了,我到哪兒去找飯碗去?我后來就改行了。所以我建議大家一定要面向未來,你如果學(xué)的是五年之后大行其道的東西,等你畢業(yè)出來你就是寶貝,所以你要突破那個倒霉的長城防火墻,去尋找知識,你多跟涂老師聯(lián)系,因?yàn)槟鞘俏磥怼?nbsp;
姜奇平:補(bǔ)充一個數(shù)據(jù)挖掘的問題,我有一個婚店網(wǎng)站的老板告訴我,說有一個數(shù)據(jù),第一點(diǎn)怎么談戀愛?這個數(shù)據(jù)特別常用,女孩子初戀成功率最高的是什么?長直發(fā),成功率是65%,最低的概率是短卷發(fā),這告訴我們,女孩子談戀愛的時(shí)候,千萬不要學(xué)別人是短卷發(fā),因?yàn)槎叹戆l(fā)給一個男孩子不單純、老謀深算的感覺,長直發(fā)讓他覺得這個女孩子青春可愛,沒什么心眼,可見“大數(shù)據(jù)”是多么有用。
主持人:謝謝姜老師。替同學(xué)問一下王老師您是北師大中文系畢業(yè)的?
王煜全:我是生物系的。
主持人:現(xiàn)在網(wǎng)友有生物系的同學(xué)嗎?有請舉手?這是你的榜樣,給你的師兄一點(diǎn)掌聲,謝謝!
王煜全:我們生物系離現(xiàn)實(shí)就比較遠(yuǎn),比較傻,沒面向未來,我那時(shí)候都是學(xué)過去。
主持人:謝謝王老師!涂老師在這本書里一直給我們講說,數(shù)據(jù)開放不等同于信息公開,就這個問題我想請涂老師再詳細(xì)給我們解讀一下。涂子沛:這個東西確實(shí)不一樣,也是我在各地都一直強(qiáng)調(diào)的一個觀念,信息公開不等同于數(shù)據(jù)開放。信息公開是作知情權(quán)層面上的概念,為什么要公開,因?yàn)槲覀冇袡?quán)利要知道。比如說現(xiàn)在談到的領(lǐng)導(dǎo)干部的財(cái)產(chǎn)公開,是這個層面上的概念,但是數(shù)據(jù)開放不僅僅是知情權(quán)方面的概念,主要說的不是權(quán)的問題,是一個推動我們當(dāng)前經(jīng)濟(jì)發(fā)展,轉(zhuǎn)型升級的問題,是推動網(wǎng)絡(luò)經(jīng)濟(jì)、知識經(jīng)濟(jì)向前發(fā)展的動力,因?yàn)殚_放了數(shù)據(jù)之后,這些數(shù)據(jù)會產(chǎn)生新的價(jià)值。剛才已經(jīng)舉了很多這樣的例子了。你的這個數(shù)據(jù)如何跟其他的數(shù)據(jù)進(jìn)行整合,如果實(shí)現(xiàn)1+1>2,推動知識經(jīng)濟(jì)、數(shù)據(jù)經(jīng)濟(jì)的發(fā)展,而不僅僅是知情權(quán)的問題,而且形式也是會一樣的。開放是把這個完整的格式,記錄在數(shù)據(jù)庫里的數(shù)據(jù)格式,電子化的放在網(wǎng)上,你可以免費(fèi)下載,而且對數(shù)據(jù)項(xiàng)也有原數(shù)據(jù)的說明,下來之后可以直接使用,信息公開是一條一條的,告訴你這個領(lǐng)導(dǎo)干部有多少財(cái)產(chǎn),這是一條信息,數(shù)據(jù)開放是一片一片的。我們以后談到數(shù)據(jù)的時(shí)候,就不要想公開,就不要用公開,數(shù)據(jù)就是開放,信息才是公開。