官术网_书友最值得收藏!

1.1 HBase的發(fā)展歷程

傳統(tǒng)的數(shù)據(jù)處理主要使用關(guān)系數(shù)據(jù)庫(MySQL、Oracle等)來完成,不過關(guān)系數(shù)據(jù)庫在面對大規(guī)模的數(shù)據(jù)存儲時明顯力不從心。比如,在有關(guān)高并發(fā)操作和海量數(shù)據(jù)統(tǒng)計運算的應(yīng)用中,關(guān)系數(shù)據(jù)庫的性能就明顯下降。

大數(shù)據(jù)時代的數(shù)據(jù)規(guī)模大、增長快、格式多樣,因此傳統(tǒng)的關(guān)系數(shù)據(jù)庫已經(jīng)不能適應(yīng)新的需求。在這樣的背景下,非關(guān)系數(shù)據(jù)庫開始成為主流的選擇。為了更大地拓展數(shù)據(jù)庫的存儲潛力,谷歌(Google)公司首先研發(fā)了BigTable,這就是HBase的原型。

HBase是用Java編程語言實現(xiàn)的一個開源的非關(guān)系分布式數(shù)據(jù)庫,它參考了谷歌的BigTable數(shù)據(jù)建模白皮書。HBase是Apache軟件基金會的Hadoop項目的一部分,運行于HDFS之上,為Hadoop提供類似于BigTable規(guī)模的服務(wù)。因此,它能以容錯方式存儲海量的稀疏數(shù)據(jù)(注:稀疏數(shù)據(jù)是指數(shù)據(jù)庫中的二維表內(nèi)含有大量空值的數(shù)據(jù))。HBase是一個高可靠、高性能、面向列、可伸縮的分布式數(shù)據(jù)庫,主要用來存儲非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù),設(shè)計它的目的就是用于處理非常龐大的表——通過水平擴展的方式,用計算機集群就可以處理由超過10億行數(shù)據(jù)和數(shù)百萬列元素所組成的數(shù)據(jù)表。HBase有許多功能支持線性和模塊化擴展。HBase集群通過添加托管在商用服務(wù)器上的RegionServer進行擴展。例如,一個集群從10臺RegionServer擴展到20臺,它的存儲和處理能力都會翻倍。

以下是HBase的發(fā)展歷程:

· 2006年谷歌公司發(fā)表BigTable白皮書。

· 2006年開始開發(fā)HBase。

· 2008年HBase成為Hadoop的子項目,剛開始它只是Hadoop的一部分。

· 2010年HBase成為Apache的頂級項目。HBase幾乎實現(xiàn)了BigTable的所有特性。

主站蜘蛛池模板: 喀什市| 三原县| 延边| 太康县| 金沙县| 鄂托克旗| 宁波市| 泗阳县| 克东县| 台安县| 东丰县| 丹阳市| 长岛县| 博爱县| 江陵县| 时尚| 辽中县| 新余市| 芜湖市| 海盐县| 林甸县| 陇川县| 南阳市| 扎兰屯市| 白玉县| 湘乡市| 乌拉特中旗| 东乡族自治县| 镇安县| 太仆寺旗| 九台市| 肥东县| 平顺县| 公安县| 吉木萨尔县| 射洪县| 定日县| 枣阳市| 东源县| 疏附县| 桃园市|