對于選型軟件類產品來說,了解軟件平臺架構是必要的。平臺架構是為用戶提供一個整體解決方案的基礎,從技術層面實現業務層面的落地。包含了對研發過程的整理和規范、對軟件產品的整合和定義、對積累成果的融合和優化、對以往經驗的總結和封裝、對技術路線的規劃和升級、對實現方案的提升和突破、對產品發展的探索和預見。因此軟件平臺架構決定了軟件解決問題的能力。
隨著大數據在越來越多的企業當中落地,企業要開展大數據相關的業務,那么首先要搭建起自身的數據平臺。而企業搭建
大數據分析平臺,就需要對大數據平臺架構有一定的了解,今天我們就來聊聊主流的一些大數據分析平臺架構及其數據分析能力如何。
主流大數據分析平臺架構及其數據分析能力
從市場主流選擇來看,主流的企業大數據分析平臺架構,目前大致有以下幾種:
1、 傳統BI架構,基于cube實現
BI系統里面,核心的模塊是Cube。Cube是一個更高層的業務模型抽象,在Cube之上可以進行多種操作,例如上鉆、下鉆、切片等操作。
BI系統更多以分析業務數據產生的密度高、價值高的結構化數據為主,對于非結構化和半結構化數據的處理非常乏力。
2、MPP(大規模并行處理)架構
進入大數據時代以來,傳統的主機計算模式已經不能滿足需求了,分布式存儲和分布式計算才是王道。大家所熟悉的Hadoop MapReduce框架以及MPP計算框架,都是基于這一背景產生。
MPP架構的代表產品,就是Greenplum。Greenplum的數據庫引擎是基于Postgresql的,并且通過Interconnnect神器實現了對同一個集群中多個Postgresql實例的高效協同和并行計算。
3、Hadoop分布式系統架構
當然,大規模分布式系統架構,Hadoop依然站在不可代替的關鍵位置上。雅虎、Facebook、百度、淘寶等國內外大企,最初都是基于Hadoop來展開的。
Hadoop生態體系龐大,企業基于Hadoop所能實現的需求,也不僅限于數據分析,也包括機器學習、數據挖掘、實時系統等。企業搭建大數據系統平臺,Hadoop的大數據處理能力、高可靠性、高容錯性、開源性以及低成本,都使得它成為首選。
以上為目前大數據領域使用較多的幾種架構,當然還有非常多其他架構,不過這些架構也會迭代更新,我們還是要與時俱進,不斷更新自己的知識庫。
?