數據倉庫,主要是將OLTP系統存儲的數據,經數據倉庫特有的理論以及架構體系,進行系統的分析整理。
一、數倉建設的目的 構建面向分析的集成化數據環境,為企業提提決策支持。
二、數倉建設的作用
全面了解業務結構及運行情況,按照業務特定的規律分門別類和程序化,改進業務的流程。
數據倉庫連接了上游的交易系統和下游的信息系統,是企業大數據的中樞。能把企業網絡中不同信息島上的商業數據集中到一起,存儲在一個單一的集成數據庫中,并提供各種手段對數據進行統計、分析。比如:數據倉庫在商業銀行的應用范圍包括存款分析、貸款分析、客戶市場分析、相關金融業分析決策(證券、外匯買賣)、風險預測、效益分析等,數據倉庫會為客戶關系系統、管會系統,監管報送系統等下游的信息系統提供經標準化、集成后的歷史數據。
三、數倉建設的特點
數倉的特點是面向主題的,集成的,穩定的,反向歷史變化的。
四、數倉建設知識點
數倉作為數據的搬運工,本身不產生數據,也不消費數據,數據來源于外部,也開放給外部系統。隨著大數據系統的發展,機器學習以及人工智能的崛起,數倉已經不僅僅作為為企業提供決策支持的商業智能BI,也是大量機器學習以及人工智能算法的底層支持。
五、數倉特點詳解
1、面向主題的
數據倉庫是?來分析特定主題域的,所以說數據倉庫是?向主題的。
電商業務主題域:交易域、商品域、用戶域、財務域
社交業務:內容域、會員域、互動域、交易域
2、集成的
數據倉庫集成了多個數據源,同?主題或產品相關數據可能來?不同系統不同類型的數據庫、?志?件等。
3、穩定的
數據?旦進?數據倉庫,則不可改變。數據倉庫的歷史數據是不應該被更新 的,同時存儲的穩定性較強。
4、反映歷史變化的
數據倉庫保存了歷史數據,這點是相對OLTP的數據庫??。因為性能考慮后者通常保存近期的熱數據。
5、數據倉庫核心組件
數據倉庫的核心組件有四個:源數據庫,ETL,數據倉庫,業務應用。