舉報

會員
目錄(133章)
倒序
- 封面
- 版權信息
- 作者簡介
- 內容簡介
- 前言
- 第1章 數字化轉型與數據技術
- 1.1 數字化轉型
- 1.2 基于數據進行數字化轉型
- 1.3 數據倉庫
- 1.4 大數據
- 1.5 數據湖
- 1.6 云計算中數據技術的演進
- 1.7 本書目標
- 第2章 數據存儲
- 2.1 數據存儲的發展與趨勢
- 2.1.1 集中式文件系統
- 2.1.2 網絡文件系統
- 2.1.3 分布式文件系統
- 2.1.4 云原生存儲
- 2.2 Azure Blob對象存儲
- 2.2.1 數據冗余策略
- 2.2.2 分層存儲
- 2.2.3 兼容HDFS的WASB文件系統
- 2.3 創建存儲賬號
- 2.3.1 訂閱
- 2.3.2 資源組
- 2.3.3 存儲賬號
- 2.4 Azure數據湖存儲
- 2.4.1 分層命名空間
- 2.4.2 兼容HDFS的ABFS文件系統
- 2.5 創建數據湖存儲
- 2.6 基于HDFS訪問數據湖存儲
- 2.7 在HDInsight中訪問數據湖存儲
- 2.8 本章小結
- 第3章 數據引入
- 3.1 什么是數據引入
- 3.2 數據引入面臨的挑戰
- 3.3 數據引入工具
- 3.4 數據工廠
- 3.4.1 什么是數據工廠
- 3.4.2 創建數據工廠
- 3.4.3 數據工廠的主要組件
- 3.5 引入數據
- 3.5.1 數據復制
- 3.5.2 管道設計
- 3.5.3 參數化
- 3.5.4 監控
- 3.6 本章小結
- 第4章 批量數據處理
- 4.1 數據處理概述
- 4.2 數據處理引擎
- 4.2.1 MapReduce
- 4.2.2 Spark
- 4.3 Databricks
- 4.4 使用Databricks處理批量數據
- 4.5 Databricks的特性
- 4.5.1 依賴庫管理
- 4.5.2 Databricks文件系統(DBFS)
- 4.5.3 密鑰管理
- 4.5.4 Delta Lake
- 4.6 使用數據工廠處理批量數據
- 4.6.1 設計Data Flow
- 4.6.2 Data Flow的設計模式
- 4.6.3 如何選擇Data Flow與Databricks
- 4.7 本章小結
- 第5章 實時數據處理
- 5.1 什么是實時數據處理
- 5.2 消息隊列
- 5.3 Kafka的使用
- 5.3.1 創建虛擬網絡
- 5.3.2 創建Kafka集群
- 5.3.3 配置IP Advertising
- 5.3.4 生產者發送數據
- 5.4 實時數據處理引擎
- 5.5 使用Spark Structured Streaming處理實時數據
- 5.5.1 連通Kafka與Databricks
- 5.5.2 在Databricks中處理數據
- 5.5.3 使用Cosmos DB保存數據
- 5.6 Event Hub
- 5.7 本章小結
- 第6章 數據倉庫
- 6.1 什么是數據倉庫
- 6.2 云原生數據倉庫
- 6.3 Synapse Analytics
- 6.3.1 什么是Synapse Analytics
- 6.3.2 Synapse SQL的架構
- 6.3.3 創建Synapse工作區
- 6.3.4 創建SQL池
- 6.3.5 連接SQL池
- 6.4 數據加載
- 6.4.1 數據加載方式
- 6.4.2 使用COPY導入數據
- 6.5 Synapse SQL的資源和負荷管理
- 6.5.1 資源類
- 6.5.2 并發槽
- 6.5.3 最大并發查詢數
- 6.5.4 工作負荷組
- 6.5.5 工作負荷分類器
- 6.6 數據倉庫發展趨勢
- 6.6.1 挑戰
- 6.6.2 趨勢
- 6.7 Synapse Analytics的高級特性
- 6.7.1 Synapse工作室
- 6.7.2 數據中心
- 6.7.3 無服務器SQL池
- 6.7.4 托管Spark
- 6.8 本章小結
- 第7章 數據可視化
- 7.1 數據可視化概述
- 7.2 數據可視化工具
- 7.3 Power BI
- 7.3.1 什么是Power BI
- 7.3.2 Power BI的構件
- 7.3.3 使用Power BI Desktop
- 7.3.4 使用Power BI服務
- 7.4 本章小結
- 第8章 機器學習
- 8.1 機器學習概述
- 8.1.1 算法類型
- 8.1.2 業務場景
- 8.2 機器學習的流程
- 8.3 機器學習的挑戰與云原生平臺的優勢
- 8.4 云原生機器學習平臺
- 8.4.1 創建工作區
- 8.4.2 創建數據存儲庫
- 8.4.3 創建數據集
- 8.4.4 創建計算資源
- 8.5 機器學習設計器
- 8.6 自動化機器學習
- 8.7 本章小結
- 參考文獻
- 反侵權盜版聲明
- 封底 更新時間:2024-03-22 19:18:07
推薦閱讀
- MySQL高可用解決方案:從主從復制到InnoDB Cluster架構
- 漫話大數據
- 在你身邊為你設計Ⅲ:騰訊服務設計思維與實戰
- 信息系統與數據科學
- MySQL基礎教程
- 企業級數據與AI項目成功之道
- 從0到1:JavaScript 快速上手
- 網站數據庫技術
- 圖數據實戰:用圖思維和圖技術解決復雜問題
- 辦公應用與計算思維案例教程
- 達夢數據庫運維實戰
- 數據庫原理與應用
- 一本書講透Elasticsearch:原理、進階與工程實踐
- 大數據技術原理與應用:概念、存儲、處理、分析與應用
- Spring Boot 2.0 Cookbook(Second Edition)
- Practical Convolutional Neural Networks
- 元宇宙基石:Web3.0與分布式存儲
- Hadoop與大數據挖掘
- 新一代信息技術基礎
- 圖解LeetCode初級算法(Python版)
- Oracle從入門到精通(視頻實戰版)
- 由淺入深學SQL Server:基礎、進階與必做300題
- Spark 3.x大數據分析實戰(視頻教學版)
- Oracle精髓(原書第5版)
- Visual C# 2005+SQL Server 2005數據庫與網絡開發
- 智能數據治理:基于大模型、知識圖譜
- ORACLE RAC日記
- Python數據分析
- 數據資源的管理與調度:云環境下數據與資源協同技術
- 分布式數據庫:原理與實踐