進入21世紀以來,人類在信息存儲和處理能力方面不斷涌現(xiàn)技術(shù)性的突破,目前被人們熱議和關(guān)注的大數(shù)據(jù)即代表著最新潮流。互聯(lián)網(wǎng)上每天產(chǎn)生的數(shù)據(jù)如潮水般涌現(xiàn)并被保存,當(dāng)數(shù)據(jù)量達到一定規(guī)模的時候,就會從量變到質(zhì)變,對人們的日常生活產(chǎn)生巨大影響,進而改變組織和社會的管理方式。
事實上,對海量數(shù)據(jù)的成功應(yīng)用早已有之。2009年全球爆發(fā)甲型H1N1流感,美國公共衛(wèi)生機構(gòu)的工作效率輸給了商業(yè)企業(yè)谷歌公司。原因是公共衛(wèi)生機構(gòu)的官員在統(tǒng)計疫情傳播的起源和渠道時,使用的是傳統(tǒng)的數(shù)據(jù)反饋方式,獲得的信息比疫情的真實傳播速度整整滯后了兩周;而谷歌公司通過美國人在網(wǎng)上檢索的海量詞條,迅速且成功地運用數(shù)字模型判斷出甲流傳播的途徑和趨勢,為官方提供了及時有效的數(shù)據(jù)。當(dāng)人們?yōu)檫@個案例驚嘆的同時,也不得不承認,《大數(shù)據(jù)時代:生活、工作和思維的改變》的作者、英國牛津大學(xué)教授維克托·舍恩伯格所斷言的大數(shù)據(jù)時代已經(jīng)來臨了!
提到大數(shù)據(jù)時代,人們的第一反應(yīng)就是數(shù)據(jù)量大。誠然,人類的信息存量正在以幾何倍數(shù)增加。據(jù)統(tǒng)計,一分鐘內(nèi),僅微博網(wǎng)站推特上新發(fā)的信息條數(shù)就超過10萬條;社交網(wǎng)絡(luò)臉譜上的瀏覽量則超過600萬;到2013年,全世界儲存的信息如果記錄在光盤上,這些光盤疊加起來,高度等于從地球到月球走一趟。用信息爆炸來形容今天的社會和時代毫不為過。
然而,在舍恩伯格看來,大數(shù)據(jù)的“大”,并不是指數(shù)據(jù)本身絕對數(shù)量大,而是指處理數(shù)據(jù)所使用的“大”模式:盡可能地收集全面數(shù)據(jù)、完整數(shù)據(jù)和綜合數(shù)據(jù),同時使用數(shù)學(xué)算法對其進行分析和建模,挖掘出背后的關(guān)系,從而預(yù)測某一事件發(fā)生的概率。美國計算機專家迪博德說過,在信息時代,通過信息加總和數(shù)據(jù)整合,對個人信息進行分析的穿透力要遠遠大于1+1的效果,它不需要對每個抽樣樣本進行精確提取,卻能獲得比抽樣調(diào)查更加精準的結(jié)果。通過全數(shù)據(jù)模式推演事物發(fā)展規(guī)律的成功案例已不在少數(shù)。
目前,人們已越來越多地認識到互聯(lián)網(wǎng)數(shù)據(jù)背后蘊涵的科學(xué)、經(jīng)濟和社會價值,把大數(shù)據(jù)模型系統(tǒng)地應(yīng)用到公共商業(yè)服務(wù)中,為政府、企業(yè)或個人提供服務(wù):對沖基金通過剖析推特上的數(shù)據(jù)來預(yù)測股市的走勢;亞馬遜公司根據(jù)用戶的查詢記錄來推薦產(chǎn)品;紐約政府使用犯罪數(shù)據(jù)和地圖進行城市管理……在中國,數(shù)據(jù)的挖掘也已經(jīng)起步:2012年,阿里巴巴提出大數(shù)據(jù)戰(zhàn)略,旨在通過資源共享與數(shù)據(jù)互通創(chuàng)造商業(yè)價值;去年“雙十一”銷售熱潮中,以云計算為基礎(chǔ)的聚石塔服務(wù),對數(shù)以億萬計的消費者需求信息進行捕捉匯總,幫助網(wǎng)商隨時調(diào)整商品和銷售決策,以提供精準、有效的服務(wù)。
盡管我們看到了大數(shù)據(jù)時代的無限機遇,但人類在互聯(lián)網(wǎng)領(lǐng)域不過才走了幾十年。除了要解決個人隱私和信息安全等問題外,整個網(wǎng)絡(luò)世界的數(shù)據(jù)仍然是局部的、碎片化的。如果能把散落在各個國家、各個機構(gòu)及個人手中的數(shù)據(jù)集中起來,那么,大數(shù)據(jù)所能發(fā)揮的作用更會超越我們的想象。