作為一名數據分析師或者想要轉行從事數據分析的人員,在用bi工具做
數據分析時,以下幾個概念是一定要知道的:數據庫、數據倉庫和數據中臺,下面我們就做展開做詳細介紹:
數據庫的概念
數據庫是一種邏輯概念,用來存放數據的倉庫,通過數據庫軟件來實現。數據庫由很多表組成,表是二維的,一張表里面有很多字段。字段一字排開,對數據就一行一行的寫入表中。數據庫的表,在于能夠用二維表現多維的關系。如:oracle、DB2、MySQL、Sybase、MSSQL Server等。
用永洪bi做數據分析怎么操作數據庫?
實際上用bi工具做數據分析時,只要簡單的在bi工具中做數據配置就可以了。由于很多bi工具廠商像永洪bi都支持很多類型的數據庫連接,點擊需要連接的數據庫類型SAP HANA,在URL輸入該數據庫所在站點地址,用戶名及密碼,永洪bi即可自動連接數據庫。
數據倉庫的概念
是數據庫概念的升級。從邏輯上理解,數據庫和數據倉庫沒有區別,都是通過數據庫軟件實現存放數據的地方,只不過從數據量來說,數據倉庫要比數據庫更龐大德多。數據倉庫主要用于數據挖掘和數據分析,輔助領導做決策。
數據庫和數據倉庫的區別
區別主要總結為以下幾點:
1.數據庫只存放當前值,數據倉庫存放歷史值;
2.數據庫內數據是動態變化的,只要有業務發生,數據就會被更新,而數據倉庫則是靜態的歷史數據,只能定期添加、刷新;
3.數據庫中的數據結構比較復雜,有各種結構以適合業務處理系統的需要,而數據倉庫中的數據結構則相對簡單;
4.數據庫中數據訪問頻率較高,但訪問量較少,而數據倉庫的訪問頻率低但訪問量卻很高;
5.數據庫中數據的目標是面向業務處理人員的,為業務處理人員提供信息處理的支持,而數據倉庫則是面向高層管理人員的,為其提供決策支持;
6.數據庫在訪問數據時要求響應速度快,其響應時間一般在幾秒內,而數據倉庫的響應時間則可長達數幾小時
數據中臺的概念
數據中臺是指通過數據技術,對海量數據進行采集、計算、存儲、加工,同時統一標準和口徑。數據中臺把數據統一之后,會形成標準數據,再進行存儲,形成大數據資產層,進而為客戶提供高效服務。
數據中臺負責全域數據采集、數據資產加工和管理、并向前臺業務部門和決策部門提供數據服務的所以數據中臺的核心應該是數據資產管理和數據賦能。通俗的講就是數據彈藥庫。
bi與數據倉庫和數據中臺的關系
很多人問在構建bi系統時需不需要搭建數據倉庫,其實這兩者是非必須的關系。對于小型企業來說,數據量小的基礎上,可以直接利用bi工具進行數據分析,而大企業由于數據量的繁多,需要在此基礎上搭建數據倉庫,提升數據分析效率。bi和數據中臺直接則完全是互不想干的,從上面數據倉庫的概念我們知道數據中臺是基于企業業務場景為數據倉庫提供標準數據口徑來源的,與bi的搭建沒有太大的關系。
?