大數據是指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高成長率和多樣化的資訊資產。特點:大量、高速、多元、低價值密度、真實性。
大數據(big data),IT行業術語,是指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高成長率和多樣化的資訊資產。
在維克多·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣捷徑,而採用所有數據進行分析處理。大數據的5V特性(IBM提出):
Volume(大量):龐大的資料量
集中儲存/集中計算已經無法處理龐大的資料量。
資料量呈指數成長:地震、錄井 、石油鑽塔的感測器一個月產生的資料量比全球所有的電影加在一起還要多。
新浪微博用戶數2.5億 ,高峰每天數億個。
Variety (多元):非結構化資料多樣性
文字/圖片/影片/文件等,如微地震,電磁以及光纖分散式溫度監測(DTS) 。
Velocity(高速):資料成長速度快
使用者基數龐大/裝置數量眾多/即時海量/資料指數層級成長。
Value(低價值密度):資料的價值性
每個鑽井平台有 40,000 感測器,但是通常只有 10% 的資料使用。
每個深水鑽井平台的投資可達到$150M,能有效利用所有的數據非常關鍵,關係到安全與優化運營 。
Vercity(真實性):資料的真實性
#想要查閱更多相關文章,請造訪PHP中文網! !
以上是什麼叫大數據?它有哪些特點的詳細內容。更多資訊請關注PHP中文網其他相關文章!