我們常聽到組織抱怨,他們想要從資料取得更多價值,但要擷取、存放和分析現代數位業務產生的所有資料則是困難重重。新的資料來源不斷出現,資料呈指數級增長,越來越多樣化,而且需要能在越來越短的時間內,供應用程式和人員安全地進行存取和分析。
企業會將這些資料存放在不同的獨立位置,導致分析更難執行。為了簡化程序,他們希望能將所有資料存放在單一資料儲存器,也就是資料湖。然後,他們希望以不同的方式靈活分析資料,透過各式各樣的分析引擎,確保能滿足現在和未來分析使用案例的需求。
資料湖是解決孤立資料區塊這個長期問題的辦法之一,而需要“現代分析架構”才能更好地進行分析。
我們將在此電子書中,討論企業對資料湖 (data lake) 和資料倉儲 (data warehouse) 的需求,以及“建立分析管道”,包括有效從來源系統擷取資料、處理資料,載入資料存放區以便進行分析,再分析和視覺化資料,透過商業智慧 (BI), 機器學習,最終預測未來成果。
您將了解: