183.17.231.* 2020-11-09 13:42:01 |
數據可視化起源于圖形學、計算機圖形學、人工智能、科學可視化以及用戶界面等領域的相互促進和發展,是當前計算機科學的一個重要研究方向,它利用計算機對抽象信息進行直觀的表示,以利于快速檢索信息和增強認知能力。
數據可視化到底能干什么呢?數據可視化系統并不是為了展示用戶的已知的數據之間的規律,而是為了幫助用戶通過認知數據,有新的發現,發現這些數據所反映的實質。
從技術上來說,大數據可視化的實施步驟主要有四項:需求分析,建設數據倉庫/數據集市模型,數據抽取、清洗、轉換、加載(ETL),建立可視化分析場景。
一、需求分析
需求分析是大數據可視化項目開展的前提,要描述項目背景與目的、業務目標、業務范圍、業務需求和功能需求等內容,明確實施單位對可視化的期望和需求。包括需要分析的主題、各主題可能查看的角度、需要發泄企業各方面的規律、用戶的需求等內容。
二、建設數據倉庫/數據集市的模型
數據倉庫/數據集市的模型是在需求分析的基礎上建立起來的。數據倉庫/數據集市建模除了數據庫的ER建模和關系建模,還包括專門針對數據倉庫的維度建模技術。維度建模的關鍵在于明確下面四個問題:
1.哪些維度對主題分析有用?
2.如何使用現有數據生成維表?
3.用什么指標來"度量"主題?
4.如何使用現有數據生成事實表?
三、數據抽取、清洗、轉換、加載(ETL)
數據抽取是指將數據倉庫/集市需要的數據從各個業務系統中抽離出來,因為每個業務系統的數據質量不同,所以要對每個數據源建立不同的抽取程序,每個數據抽取流程都需要使用接口將元數據傳送到清洗和轉換階段。
數據清洗的目的是保證抽取的原數據的質量符合數據倉庫/集市的要求并保持數據的一致性。
數據轉換是整個ETL過程的核心部分,主要是對原數據進行計算和放大。數據加載是按照數據倉庫/集市模型中各個實體之間的關系將數據加載到目標表中。
四、建立可視化場景
建立可視化場景是對數據倉庫/集市中的數據進行分析處理的成果,用戶能夠借此從多個角度查看企業/單位的運營狀況,按照不同的主題和方式探查企業/單位業務內容的核心數據,從而作出更精準的預測和判斷。
大數據可視化有哪些分析步驟.中琛魔方大數據平臺(www.zcmorefun.com)表示隨著社會的發展,大數據可視化的新工具和圖表類型也不斷涌現,每一種都試圖創造出比以往更有吸引力,更有利于信息圖表的傳播,所以,可視化項目應該自己去親自感受總結方法,以及享受過程步驟,這樣才能更加易懂。 |