- HBase從入門到實戰(zhàn)
- 張文亮編著
- 596字
- 2024-12-24 10:45:54
1.1 HBase的發(fā)展歷程
傳統(tǒng)的數(shù)據(jù)處理主要使用關(guān)系數(shù)據(jù)庫(MySQL、Oracle等)來完成,不過關(guān)系數(shù)據(jù)庫在面對大規(guī)模的數(shù)據(jù)存儲時明顯力不從心。比如,在有關(guān)高并發(fā)操作和海量數(shù)據(jù)統(tǒng)計運算的應(yīng)用中,關(guān)系數(shù)據(jù)庫的性能就明顯下降。
大數(shù)據(jù)時代的數(shù)據(jù)規(guī)模大、增長快、格式多樣,因此傳統(tǒng)的關(guān)系數(shù)據(jù)庫已經(jīng)不能適應(yīng)新的需求。在這樣的背景下,非關(guān)系數(shù)據(jù)庫開始成為主流的選擇。為了更大地拓展數(shù)據(jù)庫的存儲潛力,谷歌(Google)公司首先研發(fā)了BigTable,這就是HBase的原型。
HBase是用Java編程語言實現(xiàn)的一個開源的非關(guān)系分布式數(shù)據(jù)庫,它參考了谷歌的BigTable數(shù)據(jù)建模白皮書。HBase是Apache軟件基金會的Hadoop項目的一部分,運行于HDFS之上,為Hadoop提供類似于BigTable規(guī)模的服務(wù)。因此,它能以容錯方式存儲海量的稀疏數(shù)據(jù)(注:稀疏數(shù)據(jù)是指數(shù)據(jù)庫中的二維表內(nèi)含有大量空值的數(shù)據(jù))。HBase是一個高可靠、高性能、面向列、可伸縮的分布式數(shù)據(jù)庫,主要用來存儲非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù),設(shè)計它的目的就是用于處理非常龐大的表——通過水平擴展的方式,用計算機集群就可以處理由超過10億行數(shù)據(jù)和數(shù)百萬列元素所組成的數(shù)據(jù)表。HBase有許多功能支持線性和模塊化擴展。HBase集群通過添加托管在商用服務(wù)器上的RegionServer進行擴展。例如,一個集群從10臺RegionServer擴展到20臺,它的存儲和處理能力都會翻倍。
以下是HBase的發(fā)展歷程:
· 2006年谷歌公司發(fā)表BigTable白皮書。
· 2006年開始開發(fā)HBase。
· 2008年HBase成為Hadoop的子項目,剛開始它只是Hadoop的一部分。
· 2010年HBase成為Apache的頂級項目。HBase幾乎實現(xiàn)了BigTable的所有特性。
- 劍指JVM:虛擬機實踐與性能調(diào)優(yōu)
- PaaS程序設(shè)計
- Learning Linux Binary Analysis
- 重學Java設(shè)計模式
- 自制編程語言
- Scala程序員面試算法寶典
- Getting Started with Greenplum for Big Data Analytics
- RISC-V體系結(jié)構(gòu)編程與實踐(第2版)
- Nginx Lua開發(fā)實戰(zhàn)
- 執(zhí)劍而舞:用代碼創(chuàng)作藝術(shù)
- Learning YARN
- 零基礎(chǔ)學C語言第2版
- UI設(shè)計基礎(chǔ)培訓教程(全彩版)
- 現(xiàn)代CPU性能分析與優(yōu)化
- Mastering Apache Camel