在當今的大數據時代,以大數據分析為基礎的人工智能時代已經到來,各行各業都基于大數據開啟了新時代,不僅IT行業需要了解大數據知識,而且傳統行業的從業者和普通大學生也應了解一些大數據知識。新的基礎架構定義未來,大數據分析系統技術將開始得到全面應用,大數據分析還將重塑整個產業結構。想了解大數據分析,需要了解它的以下幾個特點:
一、海量的數據量
大數據分析必然由海量的數據量支撐,對于大數據分析而言,有三個方面的因素定義:容量服務器數據恢復、許多不同的數據和文件類型、對于管理和更深入的分析數據。數據量本身就是聚合的概念。不是數據量大的數據被稱為大數據,傳統信息系統生成的“小數據”也是大數據分析的重要組成部分,這點必須清楚。當前,從大數據的數據源的角度來看,它主要集中在互聯網,物聯網和傳統信息系統三個渠道。當前物聯網數據的比例相對較大。
二、數據分析類型繁多
類型的多樣性也讓大數據分析被分為結構化數據分析和非結構化數據分析,相對于以往便于存儲的以文本為主的結構化數據,非結構化數據越來越多,包括網絡日志、音頻、視頻還有地理位置信息等,這些多類型的數據對數據的處理能力提出了更高要求。
三、數據價值密度
大數據分析大時代,越來越多數據都是半結構化和非結構化數據,比如網站訪問日志,里面大量內容都是沒價值的,真正有價值的比較少,雖然數據量比以前大了N倍,但價值密度確實低了很多。如果有海量的結構化數據,則需要靠大數據分析才能處理,價值卻能體現更大化,例如銀聯的交易數據,不僅數據密度大,價值也大。
大數據分析已經成為過去幾年中大部分行業的游戲規則,學者和其他知名的利益相關者都同意這一點,隨著大數據分析的服務商繼續滲透到我們的日常生活中,圍繞大數據的炒作正在轉向實際使用中的真正價值。當然大數據的出現,也讓商業智能BI逐漸火了起來。
?