- 敏捷數據分析工具箱:深入解析ADW+OAC
- 史躍東
- 15字
- 2024-01-22 19:34:04
第2章
自治數據庫(ADW)技術特征
2.1 ADW簡介
ADW的全稱是Autonomous Data Warehouse,即自治數據庫。它由Oracle于2018年3月發布。其定位是:為數據倉庫、數據集市、數據湖、機器學習等分析型工作負載提供最佳的運行平臺。當然,對于事務處理,也就是OLTP類型的工作負載,Oracle也于同年的8月發布了ATP(Autonomous Transaction Processing)。
對于ADW而言,可以用下面的簡圖(見圖2-1)來很好地說明。

圖2-1 什么是ADW
其實,在Oracle的售前工程師給客戶講解ADW時經常用到圖2-1,通過簡單的幾句說明,客戶就能夠完全理解什么是ADW了。而對于具有Oracle數據庫背景的IT人員而言,看一眼這張圖,就全部明白了。
簡而言之,ADW是Oracle公有云上的在線數據倉庫平臺,其底層硬件采用的是Oracle一體機Exadata技術,數據庫采用的是全球第一個自治數據庫18c,其運維管理由Oracle公有云后臺自動完成。不僅如此,ADW本身還融入了RAC、ADG等Oracle在高可用方面的諸多關鍵技術,在自身后臺維護中則應用了大量成熟的AI/機器學習技術來實現自動化。因此,在某種程度上,ADW可稱得上是Oracle基于自身數據技術的多年積累而推出的一款集大成的作品。
從Oracle公有云的體系架構來看,ADW隸屬于Generation 2 Cloud Infrastructure(第二代云基礎架構)中的Autonomous Database(自治數據庫)。
注:關于Oracle公有云的產品服務,我們將在第8章進行詳細介紹。
與傳統的數據庫管理技術相比,Oracle自治數據庫技術帶來了諸多的改變。
(1)自動供應。ADW基于Oracle的公有云平臺,能夠快速創建并供應ADW實例。稍后我們將會看到,在線申請ADW實例是多么簡單便捷。
(2)自治安全。ADW使用了包含DB Vault在內的諸多安全技術,能夠為數據提供最大的安全保護。并且,Oracle的公有云是業界唯一進化到了第二代的公有云平臺,安全性更高。
(3)自治管理。ADW能夠自動完成在線打補丁、執行所有OS和SYSDBA操作等任務,并且可以診斷錯誤、解決問題。
(4)自治保護。ADW實現了完全的在線自動備份及恢復,無須進行任何的停機操作,或者從故障中進行恢復操作。
(5)自治伸縮。ADW能夠在線伸縮,也可以配置自動伸縮功能。在能夠獲得最高性能的同時,保證實現按使用付費,從而實現最低成本。
(6)自治優化。ADW在后臺實現了基于機器學習的工作負載優化技術,它能夠持續優化每個工作負載,包括內存、數據存儲、索引、并行及執行計劃等。
ADW有如下特點。
(1)簡單。從業務上來說,可以在分鐘級完成ADW實例的申請和創建,并且通過數據探索來獲得業務洞察,還可以輕松地將分析過程轉換為可視化故事,從而供企業管理層在決策時參考。從技術上來說,數據庫管理的自動化、自動調優及兼容現有工具的數據遷移能力,都能夠讓企業IT人員體會到ADW的簡單,能夠在很大程度上降低學習成本。
(2)快速。從業務上來說,ADW能夠提供快速分析能力,從而加速創新,更快地獲取商業利益。它能夠支持大量用戶的并發訪問,從而提高團隊工作效率。從技術上來說,ADW底層基于Exadata技術,能夠提供極致的數據查詢與分析性能,和競爭對手相比,性能大幅度提升。
(3)彈性。從業務上來說,ADW可以根據需要來滿足不斷變化的業務需求,只需要為使用的服務付費,極大地降低了用戶成本,并且所有的操作都不會影響業務的連續性。從技術上來說,用戶可以自定義ADW實例的大小,按需擴展,然后在系統空閑時關閉實例。計算資源和存儲資源可以獨立擴展,并且不需要停機時間。
ADW架構簡圖如圖2-2所示。

圖2-2 ADW架構簡圖
從圖2-2所示的架構簡圖中可以看到,ADW分成四部分。
架構簡圖最左邊為ADW連接與接入部分,可以使用Oracle提供的SQL Developer或其他工具連接到ADW上。該部分可以是Oracle公有云的一些數據集成平臺或服務(如Oracle公有云Marketplace上的Oracle GoldenGate,或者ODI等),也可以是Oracle公有云上的第三方工具,還可以是用戶本地的第三方工具,如Informatica的Powercenter,或者是開源的ETL工具Kettle等。
注:上述架構簡圖源自Oracle官方文檔,具體鏈接為https://docs.oracle.com/en/cloud/paas/autonomous-data-warehouse-cloud/user/autonomous-intro-adw.html#GUID-4B91499D-7C2B-46D9-8E4D-A6ABF2093414。
架構簡圖的中上部分就是ADW了。這部分包括底層的自治數據庫,以及在此之上的管理界面和ADW內置的應用開發工具。這些工具包括:① Machine Learning,這是Oracle基于開源的Apache Zeppelin而生成的一個交互式Web數據分析工具,稱為Oracle ML;② SQL Developer Web,這是SQL Developer的網頁版;③ REST Data Services,這是為開發人員提供的ADW RESTful接口;④ Application Express,這是大名鼎鼎的數據庫開發工具APEX。
注:關于Oracle ML、APEX等開發方面的內容,將在本書第2部分進行詳細介紹。
架構簡圖中的中下部分是第三部分,這部分提供Oracle對象存儲服務,用于存儲Excel等非結構化的外部數據。這樣,我們就可以將一些數據加載到該對象存儲服務中,然后在ADW中對這些數據創建外部表,之后就可以使用了。
架構簡圖最右邊為BI工具部分,可以使用Oracle的分析云(OAC),或者OAC的簡化桌面版OAD,或者其他第三方的BI工具。
注:關于OAC的相關內容,將在本書第3部分進行詳細介紹。關于ADW能夠支持的BI和數據集成工具,以及第三方工具的詳細列表,可以參考鏈接https://www.oracle.com/database/adw-cloud-tools.html。
可以看到,Oracle在設計ADW的架構時,充分考慮了對用戶現有工具與技術的兼容,使得用戶可以在不大量增加學習成本的前提下,就能夠快速上手ADW。雖然Oracle的產品一向給人以功能強大、上手難度也大的印象,但是ADW,在某種程度上打破了這種印象。基于Oracle公有云出色的后臺自動化處理能力,與之前的Oracle產品相比,ADW的易用性明顯提升了一個檔次。
- MySQL數據庫進階實戰
- SQL Server 2016 數據庫教程(第4版)
- SQL Server 2012數據庫技術與應用(微課版)
- Learning Spring Boot
- 數據庫開發實踐案例
- Creating Dynamic UIs with Android Fragments(Second Edition)
- Spark大數據分析實戰
- SQL Server 2012數據庫管理教程
- TextMate How-to
- Power BI智能數據分析與可視化從入門到精通
- 數據庫技術及應用
- 聯動Oracle:設計思想、架構實現與AWR報告
- Expert Python Programming(Third Edition)
- MySQL性能調優與架構設計
- 數據時代的品牌智造