- Hadoop 3實(shí)戰(zhàn)指南
- 孫志偉
- 260字
- 2021-06-15 16:02:47
第 2 章 HDFS
HDFS是目前使用最多的分布式文件系統(tǒng)。各種大數(shù)據(jù)統(tǒng)計(jì)分析工具使用的底層數(shù)據(jù)大多數(shù)來源于HDFS,因此在工作中不僅要會(huì)用它,還要了解它內(nèi)部的一些原理。本章主要介紹HDFS,深入剖析其常用功能的原理,并介紹一些新特性。
本章的重點(diǎn)在前5節(jié),其中2.1節(jié)介紹HDFS的一些基礎(chǔ)知識(shí);2.2節(jié)介紹與NameNode的元數(shù)據(jù)及內(nèi)存結(jié)構(gòu)相關(guān)的內(nèi)容,為NameNode的優(yōu)化和管理提供知識(shí)儲(chǔ)備;2.3節(jié)介紹HDFS HA的原理,2.4節(jié)介紹HDFS的Federation,這兩節(jié)解決了在生產(chǎn)環(huán)境中遇到的單點(diǎn)問題和集群橫向擴(kuò)展問題;2.5節(jié)介紹糾刪碼副本策略,2.6節(jié)介紹下一代對(duì)象存儲(chǔ)系統(tǒng)Ozone,這兩節(jié)可為集群后續(xù)的發(fā)展和優(yōu)化提供一些方向。
推薦閱讀
- 程序員修煉之道:從小工到專家
- 數(shù)據(jù)挖掘原理與實(shí)踐
- Greenplum:從大數(shù)據(jù)戰(zhàn)略到實(shí)現(xiàn)
- 大數(shù)據(jù)可視化
- R數(shù)據(jù)科學(xué)實(shí)戰(zhàn):工具詳解與案例分析(鮮讀版)
- 深入淺出MySQL:數(shù)據(jù)庫開發(fā)、優(yōu)化與管理維護(hù)(第2版)
- 智慧的云計(jì)算
- 視覺大數(shù)據(jù)智能分析算法實(shí)戰(zhàn)
- 大數(shù)據(jù)技術(shù)原理與應(yīng)用:概念、存儲(chǔ)、處理、分析與應(yīng)用
- 改變未來的九大算法
- Oracle 11g+ASP.NET數(shù)據(jù)庫系統(tǒng)開發(fā)案例教程
- 數(shù)據(jù)分析思維:產(chǎn)品經(jīng)理的成長筆記
- 數(shù)字化轉(zhuǎn)型實(shí)踐:構(gòu)建云原生大數(shù)據(jù)平臺(tái)
- 數(shù)據(jù)挖掘算法實(shí)踐與案例詳解
- Machine Learning for Mobile