《大數(shù)據(jù)與云計(jì)算》課件-11.Hbase

上傳人：青*** IP屬地：福建上傳時(shí)間：2024-08-08 格式：PPTX 頁(yè)數(shù)：55 大小：4.36MB 積分：6 舉報(bào) 版權(quán)申訴

《大數(shù)據(jù)與云計(jì)算》課件-11.Hbase_第2頁(yè)

《大數(shù)據(jù)與云計(jì)算》課件-11.Hbase_第3頁(yè)

《大數(shù)據(jù)與云計(jì)算》課件-11.Hbase_第4頁(yè)

《大數(shù)據(jù)與云計(jì)算》課件-11.Hbase_第5頁(yè)

已閱讀5頁(yè)，還剩50頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)與云計(jì)算知識(shí)點(diǎn)HBASE數(shù)據(jù)庫(kù)簡(jiǎn)介存儲(chǔ)與管理貫穿大數(shù)據(jù)處理過(guò)程的始終。引言傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)難以應(yīng)對(duì)大數(shù)據(jù)挑戰(zhàn)。我們知道一臺(tái)普通PC機(jī)的硬盤大概可以存儲(chǔ)1Tb的數(shù)據(jù)，那么10Tb，100Tb，1000Tb怎么辦？再比如現(xiàn)在我們大多數(shù)同學(xué)都有云存儲(chǔ)空間，而且還不小有50GB的空間，那么10個(gè)、100個(gè)、10000個(gè)同學(xué)呢？我們說(shuō)1萬(wàn)個(gè)同學(xué)就有1萬(wàn)個(gè)50GB大小的空間,也就是500TB，這500TB的信息顯然不可能在一臺(tái)計(jì)算機(jī)上存儲(chǔ)。那又該如何存儲(chǔ)，如何查詢呢？分布式數(shù)據(jù)庫(kù)HBase是一個(gè)分布式的非關(guān)系型數(shù)據(jù)庫(kù)，一個(gè)高可靠、高性能、可伸縮的分布式數(shù)據(jù)庫(kù)，是Nosql數(shù)據(jù)庫(kù)，也就是NotOnly的縮寫。它的擴(kuò)展性強(qiáng)，并發(fā)性能好，數(shù)據(jù)模型靈活。屬于Hadoop的組件，它使用Java語(yǔ)言編寫，需要運(yùn)行在HDFS文件系統(tǒng)之上，使用Zookeeper作為協(xié)同服務(wù)組件。HBase與Hadoop當(dāng)中的其他組件一樣，可以運(yùn)行在多臺(tái)計(jì)算機(jī)上，可以提供數(shù)10億行乘以數(shù)百萬(wàn)列的大數(shù)據(jù)存儲(chǔ)、管理，以及隨機(jī)訪問(wèn)和實(shí)時(shí)讀、寫的能力。分布式數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)的核心目的是實(shí)現(xiàn)數(shù)據(jù)的高效管理，傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)一度占據(jù)商業(yè)數(shù)據(jù)庫(kù)應(yīng)用的主流位置分布式數(shù)據(jù)庫(kù)完備的關(guān)系理論基礎(chǔ)事務(wù)管理機(jī)制的支持高效的查詢優(yōu)化機(jī)制隨著web2.0應(yīng)用的發(fā)展，關(guān)系數(shù)據(jù)庫(kù)逐漸呈現(xiàn)不足：Schema-lessScalableNotransactions

Semi-structuredSchema

Hardtoscale

TransactionalStructured并發(fā)性可擴(kuò)展性可用性分布式數(shù)據(jù)庫(kù)HBase的原型是Google的分布式存儲(chǔ)系統(tǒng)BigTableBigTable使用谷歌分布式文件系統(tǒng)GFS作為底層數(shù)據(jù)存儲(chǔ)，配合MapReduce分布式并行計(jì)算模型來(lái)處理海量數(shù)據(jù)，采用Chubby提供協(xié)同服務(wù)管理可以擴(kuò)展到PB級(jí)別的數(shù)據(jù)和上千臺(tái)機(jī)器，具備廣泛應(yīng)用性、可擴(kuò)展性、高性能和高可用性等特點(diǎn)。作為BigTable的開源實(shí)現(xiàn)，HBase是一個(gè)高可靠、高性能、面向列、可伸縮的分布式數(shù)據(jù)庫(kù)，主要用來(lái)存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)。HBase的目標(biāo)是處理非常龐大的表，通過(guò)水平擴(kuò)展的方式，利用廉價(jià)計(jì)算機(jī)集群處理由超過(guò)10億行數(shù)據(jù)和數(shù)百萬(wàn)列屬性組成的數(shù)據(jù)表數(shù)據(jù)類型：關(guān)系數(shù)據(jù)庫(kù)采用關(guān)系模型，具有豐富的數(shù)據(jù)類型和存儲(chǔ)方式，比如我們剛才說(shuō)的同學(xué)的成績(jī)，這個(gè)就是整型的數(shù)據(jù)類型，只能是整數(shù)。姓名就是字符型，長(zhǎng)度也可以固定，比如10個(gè)字符（5個(gè)漢字的長(zhǎng)度）。HBase則采用了更加簡(jiǎn)單的數(shù)據(jù)模型，它把數(shù)據(jù)存儲(chǔ)為未經(jīng)解釋的字符串，全部都是字符串。HBase與關(guān)系數(shù)據(jù)庫(kù)的區(qū)別數(shù)據(jù)操作：關(guān)系數(shù)據(jù)庫(kù)中包含了豐富的操作，其中會(huì)涉及復(fù)雜的多表連接。比如我們?cè)陉P(guān)系型數(shù)據(jù)庫(kù)中有兩張表，有一張是我們的成績(jī)信息，有一張表是我們的寢室信息家庭信息等等。這兩張表有一個(gè)相同的字段姓名，這樣我們就可以通過(guò)這個(gè)相同的字段把兩張表連接起來(lái)。HBase操作則不存在復(fù)雜的表與表之間的關(guān)系，只有簡(jiǎn)單的插入、查詢、刪除、清空等，因?yàn)镠Base在設(shè)計(jì)上就避免了復(fù)雜的表和表之間的關(guān)系。所以HBase也就不支持復(fù)雜的條件查詢，只能是通過(guò)行鍵查詢。存儲(chǔ)模式：關(guān)系數(shù)據(jù)庫(kù)是基于行模式存儲(chǔ)的。我們說(shuō)每一行就是一條記錄。HBase是基于列存儲(chǔ)的，每個(gè)列簇都由幾個(gè)文件保存，不同列簇的文件是分離的。并且列簇中的列是可以動(dòng)態(tài)增加的，而關(guān)系數(shù)據(jù)庫(kù)需要一開始就設(shè)計(jì)好。除此之外，HBase可以自動(dòng)切分?jǐn)?shù)據(jù)，關(guān)系型數(shù)據(jù)庫(kù)則需要我們?nèi)斯で蟹謹(jǐn)?shù)據(jù)。數(shù)據(jù)索引：關(guān)系數(shù)據(jù)庫(kù)通常可以針對(duì)不同列構(gòu)建復(fù)雜的多個(gè)索引，以提高數(shù)據(jù)訪問(wèn)性能。HBase只有一個(gè)索引——行鍵，通過(guò)巧妙的設(shè)計(jì)，HBase中的所有訪問(wèn)方法，或者通過(guò)行鍵訪問(wèn)，或者通過(guò)行鍵掃描，從而使得整個(gè)系統(tǒng)不會(huì)慢下來(lái)?？缮炜s性：關(guān)系數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)橫向擴(kuò)展，縱向擴(kuò)展的空間也比較有限。相反，HBase分布式數(shù)據(jù)庫(kù)就是為了實(shí)現(xiàn)靈活的水平擴(kuò)展而開發(fā)的，能夠輕易地通過(guò)在集群中增加或者減少硬件數(shù)量來(lái)實(shí)現(xiàn)性能的伸縮。數(shù)據(jù)維護(hù)：在關(guān)系數(shù)據(jù)庫(kù)中，更新操作會(huì)用最新的當(dāng)前值去替換記錄中原來(lái)的舊值，舊值被覆蓋后就不會(huì)存在。而在HBase中執(zhí)行更新操作時(shí)，并不會(huì)刪除數(shù)據(jù)舊的版本，而是生成一個(gè)新的版本，舊的版本仍然保留。數(shù)據(jù)庫(kù)的核心目的是實(shí)現(xiàn)數(shù)據(jù)的高效管理，傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)一度占據(jù)商業(yè)數(shù)據(jù)庫(kù)應(yīng)用的主流位置完備的關(guān)系理論基礎(chǔ)事務(wù)管理機(jī)制的支持高效的查詢優(yōu)化機(jī)制隨著信息化浪潮和互聯(lián)網(wǎng)應(yīng)用的興起，傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)在一些業(yè)務(wù)上開始呈現(xiàn)不足：無(wú)法滿足海量數(shù)據(jù)的管理需求無(wú)法滿足數(shù)據(jù)高并發(fā)的需求無(wú)法滿足高可擴(kuò)展性和高可用性的需求NoSQL最初被理解為一味用新型數(shù)據(jù)庫(kù)替代傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)，但兩者各有優(yōu)缺點(diǎn)，無(wú)法完全取代NoSQL是對(duì)非關(guān)系型數(shù)據(jù)庫(kù)的統(tǒng)稱，具有以下幾個(gè)特點(diǎn)：靈活的可擴(kuò)展性靈活的數(shù)據(jù)模型與云計(jì)算緊密融合典型的NoSQL數(shù)據(jù)庫(kù)通常包括：鍵值數(shù)據(jù)庫(kù)列存儲(chǔ)數(shù)據(jù)庫(kù)文檔數(shù)據(jù)庫(kù)圖數(shù)據(jù)庫(kù)典型NoSQL數(shù)據(jù)庫(kù)鍵值數(shù)據(jù)庫(kù)(Key-Value)將數(shù)據(jù)存儲(chǔ)為鍵值對(duì)集合，其中鍵作為唯一標(biāo)識(shí)符，可以用來(lái)定位值。鍵值數(shù)據(jù)庫(kù)值對(duì)數(shù)據(jù)庫(kù)而言是不可見(jiàn)的，不能對(duì)值進(jìn)行索引和查詢。鍵是一個(gè)字符串對(duì)象，值可以是任意類型的數(shù)據(jù)，比如整型、字符型、數(shù)組、列表、集合等鍵值數(shù)據(jù)庫(kù)可以進(jìn)一步分為內(nèi)存鍵值數(shù)據(jù)庫(kù)和持久化鍵值數(shù)據(jù)庫(kù)內(nèi)存鍵值數(shù)據(jù)庫(kù)。鍵值數(shù)據(jù)庫(kù)是高度可分區(qū)的，具有高可擴(kuò)展性。列存儲(chǔ)數(shù)據(jù)庫(kù)列存儲(chǔ)數(shù)據(jù)庫(kù)主要面向海量數(shù)據(jù)的分布式存儲(chǔ)。列存儲(chǔ)數(shù)據(jù)庫(kù)一般采用列族數(shù)據(jù)庫(kù)模型，數(shù)據(jù)庫(kù)由多行構(gòu)成，每行數(shù)據(jù)包含多個(gè)列族，不同行可具有不同數(shù)量的列。每行數(shù)據(jù)通過(guò)行鍵進(jìn)行定位，行鍵對(duì)應(yīng)多個(gè)列，列以列族為單位組織存儲(chǔ)。典型的列數(shù)據(jù)庫(kù)包括Cassandra,HBase，HyperTable等。{"firstName":

"Bob","lastName":

"Smith","address":

{"street":"21

2ndStreet","city":

"New

York","state":

"NY","postalCode":

"10021"},"phoneNumbers":

[{"type":

“cell","number":

"(123)

555-0178"},{"type":

"Work","number":

"(890)

555-0133"},]}<contact><firstname>Bob</firstname><lastname>Smith</lastname><phone

type="Cell">(123)

555-0178</phone><phone

type="Work">(890)

555-0133</phone><address><type>Home</type><street>21

2nd

Street</street><city>New

York</city><state>NY</state><zip>10021</zip><country>US</country></address></contact>文檔數(shù)據(jù)庫(kù)“文檔”是處理信息的基本單位，相當(dāng)于關(guān)系數(shù)據(jù)庫(kù)中的一條記錄。旨在將半結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)為文檔，通常用XML、JSON等文檔格式來(lái)封裝和編碼數(shù)據(jù)文檔數(shù)據(jù)庫(kù)用于存儲(chǔ)、檢索和管理面向文檔的信息。使用文檔內(nèi)容來(lái)構(gòu)建索引典型的文檔數(shù)據(jù)庫(kù)包括CouchDB,MongoDB，RavenDB等文檔數(shù)據(jù)庫(kù)文檔能夠?qū)Π臄?shù)據(jù)類型和內(nèi)容進(jìn)行“自我描述”。文檔數(shù)據(jù)庫(kù)一個(gè)文檔可以包含非常復(fù)雜的數(shù)據(jù)結(jié)構(gòu)，如嵌套對(duì)象，且每個(gè)文檔可以有完全不同的數(shù)據(jù)結(jié)構(gòu)。文檔數(shù)據(jù)庫(kù)圖數(shù)據(jù)庫(kù)圖數(shù)據(jù)庫(kù)(GraphDatabase)使用圖作為數(shù)據(jù)模型，通過(guò)節(jié)點(diǎn)、邊和屬性來(lái)表示和存儲(chǔ)數(shù)據(jù)。圖數(shù)據(jù)庫(kù)專門用于管理具有高度相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)。如社交網(wǎng)絡(luò)、依賴分析、推薦系統(tǒng)以及路徑尋找等問(wèn)題。典型的圖數(shù)據(jù)庫(kù)包括Neo4J、InfiniteGraph、GraphDB等。NoSQL對(duì)比關(guān)系數(shù)據(jù)庫(kù)關(guān)系數(shù)據(jù)庫(kù)優(yōu)勢(shì)以完善的關(guān)系代數(shù)理論作為基礎(chǔ)，有嚴(yán)格的標(biāo)準(zhǔn)，支持事務(wù)ACID，借助索引機(jī)制可以實(shí)現(xiàn)高效的查詢，技術(shù)成熟，有專業(yè)公司的技術(shù)支持?？蓴U(kuò)展性較差，無(wú)法較好支持海量數(shù)據(jù)存儲(chǔ)，數(shù)據(jù)模型不夠靈活、無(wú)法較好支持Web2.0應(yīng)用，事務(wù)機(jī)制影響了系統(tǒng)的整體性能等。劣勢(shì)NoSQL對(duì)比關(guān)系數(shù)據(jù)庫(kù)NoSQL數(shù)據(jù)庫(kù)優(yōu)勢(shì)可以支持超大規(guī)模數(shù)據(jù)存儲(chǔ)，靈活的數(shù)據(jù)模型可以很好地支持Web2.0應(yīng)用，具有強(qiáng)大的橫向擴(kuò)展能力等。缺乏數(shù)學(xué)理論基礎(chǔ)，復(fù)雜查詢性能不高，大都不能實(shí)現(xiàn)事務(wù)強(qiáng)一致性，很難實(shí)現(xiàn)數(shù)據(jù)完整性，缺乏專業(yè)團(tuán)隊(duì)的技術(shù)支持，維護(hù)較困難等。劣勢(shì)存儲(chǔ)業(yè)務(wù)數(shù)據(jù)：交通工具GPS信息，司機(jī)點(diǎn)位信息，訂單信息，物流信息，設(shè)備訪問(wèn)信息，用戶行為信息等存儲(chǔ)日志數(shù)據(jù)：架構(gòu)監(jiān)控?cái)?shù)據(jù)（登錄日志，中間件訪問(wèn)日志，推送日志，短信郵件發(fā)送記錄等），業(yè)務(wù)操作日志信息等存儲(chǔ)業(yè)務(wù)附件：UDFS系統(tǒng)存儲(chǔ)圖像，視頻，文檔等附件信息，智慧城市系統(tǒng)的監(jiān)控圖像、流量數(shù)據(jù)等。HBase常見(jiàn)應(yīng)用場(chǎng)景1本節(jié)介紹了分布式數(shù)據(jù)庫(kù)Hbase的概念。2介紹了分布式數(shù)據(jù)庫(kù)Hbase與關(guān)系數(shù)據(jù)庫(kù)的區(qū)別，HBase數(shù)據(jù)庫(kù)是BigTable的開源實(shí)現(xiàn)，支持大規(guī)模海量數(shù)據(jù)的存儲(chǔ)與管理。3介紹了NoSQL數(shù)據(jù)庫(kù)，NoSQL數(shù)據(jù)庫(kù)主要包括鍵值數(shù)據(jù)庫(kù)、列族數(shù)據(jù)庫(kù)、文檔型數(shù)據(jù)庫(kù)和圖數(shù)據(jù)庫(kù)四種類型。4介紹了分布式數(shù)據(jù)庫(kù)的常見(jiàn)應(yīng)用場(chǎng)景。本章小結(jié)知識(shí)點(diǎn)HBASE數(shù)據(jù)庫(kù)入門3hbase與分布式文件系統(tǒng)hdfs的區(qū)別1hbase的結(jié)構(gòu)2hbase的特性HBASE數(shù)據(jù)庫(kù)入門HBase本質(zhì)上是一個(gè)稀疏、多維度、排序的映射表，這張表的索引是行鍵、列族、列限定符和時(shí)間戳。hbase的結(jié)構(gòu)用戶在表中存儲(chǔ)數(shù)據(jù)，每一行都有一個(gè)可排序的行鍵和任意多的列。表中的值是未經(jīng)解釋的字符串，沒(méi)有數(shù)據(jù)類型。行鍵列族

cf1列族

cf2列限定符3個(gè)時(shí)間戳有些列的值是空的，所以HBase是稀疏的hbase的結(jié)構(gòu)邏輯視圖vs.物理視圖hbase的結(jié)構(gòu)關(guān)系型數(shù)據(jù)庫(kù)當(dāng)中要修改表的結(jié)構(gòu)就是很復(fù)雜的一件事，比如增加一個(gè)字段。舉個(gè)例子來(lái)說(shuō)，如果我們的成績(jī)表當(dāng)中忘記了計(jì)算機(jī)成績(jī)這一列，你都錄入了一大半數(shù)據(jù)才發(fā)現(xiàn)，這個(gè)時(shí)候你要先修改表的結(jié)構(gòu)增加一列，然后在一行一行的輸入每個(gè)同學(xué)的計(jì)算機(jī)成績(jī)。如果是hbase就簡(jiǎn)單了，我把這一列直接擴(kuò)充到hbase里面就可以了。hbase的結(jié)構(gòu)29列族支持動(dòng)態(tài)擴(kuò)展，可以很輕松地添加一個(gè)列族或列，無(wú)需預(yù)先定義列的數(shù)量以及類型，所有列均以字符串形式存儲(chǔ)，用戶需要自行進(jìn)行數(shù)據(jù)類型轉(zhuǎn)換。hbase的結(jié)構(gòu)HBase中執(zhí)行更新操作時(shí)，并不會(huì)刪除數(shù)據(jù)舊的版本，而是生成一個(gè)新的版本，舊有的版本仍然保留。若不提供時(shí)間戳則默認(rèn)返回最新版本。數(shù)據(jù)是按照時(shí)間戳順序存儲(chǔ)的，客戶端可以選擇獲取距離某個(gè)時(shí)間最近的版本，或者獲取所有版本。表：HBase采用表來(lái)組織數(shù)據(jù)，表由行和列組成，列劃分為若干個(gè)列族hbase的結(jié)構(gòu)行：每個(gè)HBase表都由若干行組成，每個(gè)行由行鍵（row

key）來(lái)標(biāo)識(shí)。列族：一個(gè)HBase表被分組成許多“列族”（Column

Family）的集合，它是基本的訪問(wèn)控制單元列限定符：列族里的數(shù)據(jù)通過(guò)列限定符（或列）來(lái)定位hbase的結(jié)構(gòu)單元格：在HBase表中，通過(guò)行、列族和列限定符確定一個(gè)“單元格”（cell），單元格中存儲(chǔ)的數(shù)據(jù)沒(méi)有數(shù)據(jù)類型，總被視為字節(jié)數(shù)組byte[

]時(shí)間戳：每個(gè)單元格都保存著同一份數(shù)據(jù)的多個(gè)版本，這些版本采用時(shí)間戳進(jìn)行索引HBase中需要根據(jù)行鍵、列族、列限定符和時(shí)間戳來(lái)確定一個(gè)單元格，因此可視為一個(gè)“四維坐標(biāo)”[行鍵,列族,列限定符,時(shí)間戳]；如果把坐標(biāo)看成“鍵”，單元格數(shù)據(jù)看成“值”，HBase也可看成一個(gè)鍵值數(shù)據(jù)庫(kù)。hbase的結(jié)構(gòu)為空的列并不占用存儲(chǔ)空間，表可以設(shè)計(jì)的非常稀疏稀疏性每一列存儲(chǔ)的數(shù)據(jù)可以有多個(gè)version。多版本單表可以有百億行、百萬(wàn)列，數(shù)據(jù)矩陣橫向和縱向兩個(gè)維度所支持的數(shù)據(jù)量級(jí)都非常具有彈性。數(shù)據(jù)容量大HBase特性讀寫強(qiáng)一致，非“最終一致性”的數(shù)據(jù)存儲(chǔ)，使得它非常適合高速的計(jì)算聚合。自動(dòng)分片，通過(guò)Region分散在集群中，當(dāng)行數(shù)增長(zhǎng)的時(shí)候，Region也會(huì)自動(dòng)的切分和再分配。Hadoop/HDFS集成，和HDFS開箱即用，不用太麻煩的銜接。擴(kuò)展性強(qiáng)，只需要增加DataNode就可以增加存儲(chǔ)空間。HBase特性豐富的“簡(jiǎn)潔，高效”API（應(yīng)用程序接口），提供了Thrift/RESTAPI，JavaAPI等方式對(duì)HBase進(jìn)行訪問(wèn)。塊緩存，布隆過(guò)濾器，可以高效的列查詢優(yōu)化。操作管理，Hbase提供了內(nèi)置的web界面來(lái)操作，還可以監(jiān)控JMX指標(biāo)。高可靠，保證了系統(tǒng)的容錯(cuò)能力，WAL機(jī)制使得數(shù)據(jù)寫入時(shí)不會(huì)因?yàn)榧寒惓６鴮?dǎo)致寫入數(shù)據(jù)丟失。故HBase選擇了CAP中的CP。HBase特性面向列的存儲(chǔ)和權(quán)限控制，并支持獨(dú)立檢索，可以動(dòng)態(tài)的增加列。列式存儲(chǔ)：其數(shù)據(jù)在表中是按照某列存儲(chǔ)的，這樣在查詢只需要少數(shù)幾個(gè)字段的時(shí)候，能大大減少讀取的數(shù)據(jù)量。高性能：具備海量數(shù)據(jù)的隨機(jī)訪問(wèn)和實(shí)時(shí)讀寫能力。HBase特性分布式文件系統(tǒng)(HDFS)是指文件系統(tǒng)管理的物理存儲(chǔ)資源不僅存儲(chǔ)在本地節(jié)點(diǎn)上，還可以通過(guò)網(wǎng)絡(luò)連接存儲(chǔ)在非本地節(jié)點(diǎn)上。計(jì)算機(jī)集群的基本架構(gòu)HBase與HDFS的區(qū)別HBase與HDFS的區(qū)別

分布式文件系統(tǒng)改變了數(shù)據(jù)存儲(chǔ)和管理方式，相對(duì)于本地文件系統(tǒng)具有很存儲(chǔ)和管理分布式多優(yōu)勢(shì)：低成本易擴(kuò)展強(qiáng)可靠高可用1

用戶無(wú)需關(guān)心數(shù)據(jù)是存儲(chǔ)在哪個(gè)節(jié)點(diǎn)上，可以如同使用本地文件系統(tǒng)一樣文件系統(tǒng)里的數(shù)據(jù)。2HDFS優(yōu)點(diǎn)HDFS是面向批量的訪問(wèn)模式，其類型為文件系統(tǒng)，存儲(chǔ)的是文件類型的數(shù)據(jù)。HBase與HDFS的區(qū)別HBase是面向隨機(jī)訪問(wèn)和實(shí)時(shí)讀寫模式，其類型為數(shù)據(jù)庫(kù)服務(wù)，存儲(chǔ)的是非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)。HBase使用HDFS作為底層的文件系統(tǒng)，HBase的數(shù)據(jù)最終會(huì)寫到HDFS中。就像其他的數(shù)據(jù)庫(kù)一樣，真正的數(shù)據(jù)是存儲(chǔ)在操作系統(tǒng)里的文件系統(tǒng)中的。HDFS是文件系統(tǒng)，Hbase是數(shù)據(jù)庫(kù)。你可以把Hbase當(dāng)做是MySQL，把HDFS當(dāng)做是硬盤。Hbase只是一個(gè)NoSQL數(shù)據(jù)庫(kù)，數(shù)據(jù)時(shí)存放在HDFS上的，Hbase在HDFS上提供了高并發(fā)的隨機(jī)寫和支持實(shí)時(shí)查詢，這是HDFS不具備的。HBase與HDFS的區(qū)別原生的ApacheHadoopCDH：ClouderaDistributedHadoopHDP：HortonworksD

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

中文字字幕乱码视频,亚洲av无码乱码在线观看富二代,亚洲乱妇亚洲乱妇xinglu,亚洲日韩乱码中文无码蜜桃臀,亚洲精品无码久久久久久久

《大數(shù)據(jù)與云計(jì)算》課件-11.Hbase

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

中文字字幕乱码视频,亚洲av无码乱码在线观看富二代,亚洲乱妇亚洲乱妇xinglu,亚洲日韩乱码中文无码蜜桃臀,亚洲精品无码久久久久久久

《大數(shù)據(jù)與云計(jì)算》課件-11.Hbase

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔