首頁 領跑大數據時代

第一章 大數據到底是什麽

對於“大數據”研究機構Gartner Group(高德納谘詢公司)給出了這樣的定義。大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。

大數據的“前世今生”

“大數據”是什麽?要回答這個問題首先要看看數據是怎樣產生的。

在信息化時代裏,我們每個人都在貢獻數據。上網、打電話、發短信、聽歌、拍照片、發帖子、看視頻,都會產生數據,就像涓涓細流匯聚成江河湖海,“大數據”出現了。

近年來,數據大爆炸的速度快得驚人。馬雲曾感慨地說:“大家還沒搞清PC的時候,移動互聯網來了,還沒搞清移動互聯網的時候,大數據時代來了。”

大數據時代來得太快,以至於人們對大數據的定義都有N多種。

按照美國國家標準與技術研究院發布的研究報告的定義:“大數據是用來描述在我們網絡的、數字的、遍布傳感器的、信息驅動的世界中呈現出數據泛濫的常用詞語。大量數據資源為解決以前不可能解決的問題帶來了可能性。”

按照業界權威高德納谘詢公司的定義:“大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。”

根據百度百科詞條的定義:“大數據,或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理並整理成為幫助企業經營決策更積極目的的資訊。”

“大數據”到底有多大?目前通行說法,“大數據”至少要達到PB量級。其中,1 PB=22.3萬張DVD光盤的容量,相當於800個人類大腦記憶總量,或90個人身體細胞數目總和。1 PB的MP3歌曲可以連續播放2000年。