<strike id="uohm1"></strike>
  • <label id="uohm1"><sub id="uohm1"><rt id="uohm1"></rt></sub></label>
  • <ol id="uohm1"><optgroup id="uohm1"></optgroup></ol>
    <label id="uohm1"><sub id="uohm1"><rt id="uohm1"></rt></sub></label><label id="uohm1"></label>

  • <label id="uohm1"></label><label id="uohm1"></label>

    大數據培訓之淺談Hive和HBase有哪些區別與聯系及適用場景

    2018-03-16 關鍵詞:蘇州網站建設  蘇州網站制作  蘇州網站開發  蘇州做網站   3266

    在現如今,零基礎學員學習大數據分析的過程中,Hive和HBase是兩個非常重要的內容,對于初學者而言容易混淆。所以比較兩者的聯系與差別,能夠幫助我們對這兩個組件有一個清晰的認識和定位。那么,Hive和HBase有哪些區別與聯系以及適用于哪些場景呢?


    蘇州網站建設認為首先還要從兩者的概念入手。Hive是運行在Hadoop上的一個工具,準確地講是一個搜索工具。當對海量數據進行搜索時,Hadoop的計算引擎是MapReduce。但是對MapReduce的操作和編程是非常復雜的。于是Hive的存在就讓復雜的編程過程簡化成了用SQL語言對海量數據的操作。這大大減輕了程序員的工作量??梢哉f,Hive的存在讓海量數據的增刪改查更加方便。其實從Hive的logo就可以看出Hive讓大象變成了小蜜蜂,化繁為簡是它最本質的亮點。

    再來說說HBase,它是Hadoop的子項目,當然也可以理解為一個工具。Hadoop的數據運算是由MapReduce完成的,而數據存儲是由HDFS完成的。HDFS是分布式存儲,這是Hadoop存儲數據的特點,但由此帶來的問題就是數據的無序和散亂。HBase的產生,很好地解決了這一問題。HBase能夠把這些數據映射成一張哈希表,那么,這些數據一旦成為具有實際存儲意義的表之后,就由無序變得有序,從而對數據搜索和操作的效率大大提高了。


    做一個總結,Hive和HBase都是Hadoop集群下的工具,Hive是對MapReduce的優化,而HBase則是HDFS數據存儲的大管家。那么,這兩者各適用于哪些場景呢?


    1.Hive中的表為純邏輯表,僅僅對表的元數據進行定義。Hive沒有物理存儲的功能,它完全依賴HDFS和MapReduce。尚學堂陳老師指出這樣就可以將結構化的數據文件映射為為一張數據庫表,并提供完整的SQL查詢功能,并將SQL語句最終轉換為MapReduce任務進行運行。HBase表則是物理表,適合存放非結構化的數據。
    2.Hive是在MapReduce的基礎上對數據進行處理,而MapReduce的數據處理依照行模式;而HBase為列模式,這樣使得對海量數據的隨機訪問變得可行。
    3.HBase的存儲表存儲密度小,因而用戶可以對行定義成不同的列;而Hive是邏輯表,屬于稠密型,即定義列數,每一行對列數都有固定的數據。
    4.Hive使用Hadoop來分析處理數據,而Hadoop系統是批處理系統,所以數據處理存在延時的問題;而HBase是準實時系統,可以實現數據的實時查詢。
    5.Hive沒有row-level的更新,它適用于大量append-only數據集(如日志)的批任務處理。而基于HBase的查詢,支持和row-level的更新。
    6.Hive全面支持SQL,一般可以用來進行基于歷史數據的挖掘、分析。而HBase不適用于有join,多級索引,表關系復雜的應用場景。

    兩者使用場景的區別:
    HBase的應用場景通常是采集網頁數據的存儲,因為它是key-value型數據庫,從而可以到各種key-value應用場景,例如存儲日志信息,對于內容信息不需要完全結構化出來的類CMS應用等。注意hbase針對的仍然是OLTP應用為主。
    hive主要針對的是OLAP應用,其底層是hdfs分布式文件系統,重點是基于一個統一的查詢分析層,支撐OLAP應用中的各種關聯,分組,聚合類SQL語句。hive一般只用于查詢分析統計,而不能是常見的CUD操作,要知道HIVE是需要從已有的數據庫或日志進行同步最終入到hdfs文件系統中,當前要做到增量實時同步都相當困難。
    首頁 網站建設 小程序 品牌設計 服務項目 案例展示 售后保障 聯系方式 新聞中心 關于我們 人才招聘
    我們的優勢

    細致入微的前期服務
    精準的策劃服務
    精湛的網頁設計
    穩定 可靠 極速的域名和服務器
    任何問題,24小時回復并處理

    版權所有:蘇州謝謝網絡傳媒有限公司  蘇ICP備11087090號   

    首頁 電話 服務項目
    久久久国产99久久国产久首页|真人无码视频|免费一级无码婬片A|国产激情久久久久影院老熟女|伊人热热久久原色播放www
    <strike id="uohm1"></strike>
  • <label id="uohm1"><sub id="uohm1"><rt id="uohm1"></rt></sub></label>
  • <ol id="uohm1"><optgroup id="uohm1"></optgroup></ol>
    <label id="uohm1"><sub id="uohm1"><rt id="uohm1"></rt></sub></label><label id="uohm1"></label>

  • <label id="uohm1"></label><label id="uohm1"></label>