Mi az Azure HDInsight az Apache HBaseWhat is Apache HBase in Azure HDInsight

Az Apache HBase egy nyílt forráskódú nosql-alapú adatbázis-alapú Apache Hadoop és modellezett után Google BigTable.Apache HBase is an open-source, NoSQL database that is built on Apache Hadoop and modeled after Google BigTable. A HBase véletlenszerű hozzáférést és erős konzisztenciát biztosít a nagy mennyiségű strukturálatlan és félig strukturált adatok számára egy séma nélküli adatbázisban oszlopcsaládok szerint rendezve.HBase provides random access and strong consistency for large amounts of unstructured and semistructured data in a schemaless database organized by column families.

Felhasználói szempontból a HBase hasonlít egy adatbázishoz.From user perspective, HBase is similar to a database. A sorok és a egy tábla oszlopait tárolt adatokat, és a sorokon belüli adatok oszlopcsalád szerint vannak csoportosítva.Data is stored in the rows and columns of a table, and data within a row is grouped by column family. A HBase egy séma nélküli adatbázis abban az értelemben, hogy az oszlopokat és a bennük tárolt adattípusokat sem kell meghatározni a használatuk előtt.HBase is a schemaless database in the sense that neither the columns nor the type of data stored in them need to be defined before using them. A nyílt forráskód lineáris módon méreteződik át a több ezer csomópontnyi adat petabájtjainak kezelése érdekében.The open-source code scales linearly to handle petabytes of data on thousands of nodes. Az adatredundanciára, a kötegelt feldolgozásra és más olyan szolgáltatásokra támaszkodhat, amelyeket elosztott alkalmazások nyújtanak a Hadoop rendszerben.It can rely on data redundancy, batch processing, and other features that are provided by distributed applications in the Hadoop ecosystem.

Hogyan megvalósítása az Azure HDInsight az Apache HBase?How is Apache HBase implemented in Azure HDInsight?

A HDInsight HBase az Azure környezetbe integrált felügyelt fürtként érhető el.HDInsight HBase is offered as a managed cluster that is integrated into the Azure environment. A fürtök úgy vannak konfigurálva, közvetlenül a adatok tárolásához Azure Storage biztosító alacsony késést és nagyobb rugalmasságot, a teljesítménnyel és költségekkel kapcsolatos választások során.The clusters are configured to store data directly in Azure Storage which provides low latency and increased elasticity in performance and cost choices. Ez lehetővé teszi, hogy az ügyfelek olyan interaktív webhelyeket építsenek, amelyek nagy adatkészletekkel működnek, hogy a több millió végpontból származó érzékelői és telemetriai adatokat tároló szolgáltatásokat építhessenek, és hogy ezeket az adatokat Hadoop-feladatokkal elemezzék.This enables customers to build interactive websites that work with large datasets, to build services that store sensor and telemetry data from millions of end points, and to analyze this data with Hadoop jobs. A HBase és a Hadoop jó kezdőpont a big data-projektekhez az Azure rendszerben; különösképpen azt teszik lehetővé, hogy a valós idejű alkalmazások nagy adatkészletekkel dolgozhassanak.HBase and Hadoop are good starting points for big data project in Azure; in particular, they can enable real-time applications to work with large datasets.

A HDInsight-implementáció kihasználja a HBase méretezhető architektúráját, hogy a táblák automatikus árnyalását, az írások és olvasások erős következetességét és automatikus feladatátvételt nyújtson.The HDInsight implementation leverages the scale-out architecture of HBase to provide automatic sharding of tables, strong consistency for reads and writes, and automatic failover. A teljesítményt a memóriába való gyorsítótárazás növeli az olvasáshoz, és a nagy streaming-kapacitás az írásokhoz.Performance is enhanced by in-memory caching for reads and high-throughput streaming for writes. A HBase-fürt a virtuális hálózaton belül hozható létre.HBase cluster can be created inside virtual network. További információ: HDInsight-fürtök létrehozása az Azure Virtual Networkön.For details, see Create HDInsight clusters on Azure Virtual Network.

Hogyan történik az adatok kezelése a HDInsight HBase-ben?How is data managed in HDInsight HBase?

Az adatok a HBase-ben a(z) create, get, put és scan parancsokkal kezelhetők a HBase rendszerhéjból.Data can be managed in HBase by using the create, get, put, and scan commands from the HBase shell. Az adatok a(z) put paranccsal írhatók, és a(z) get paranccsal olvashatók az adatbázisban.Data is written to the database by using put and read by using get. A(z) scan paranccsal szerezhetők be adatok a táblák több sorából.The scan command is used to obtain data from multiple rows in a table. Az adatok a HBase C# API-val is kezelhetők, amely egy ügyfélkönyvtárat biztosít a HBase REST API-n felül.Data can also be managed using the HBase C# API, which provides a client library on top of the HBase REST API. A HBase adatbázisok használatával is lekérdezhetők Apache Hive.An HBase database can also be queried by using Apache Hive. Ezen programozási modellek bemutatását lásd: Apache hadooppal a HDInsight Apache HBase használatának első lépései.For an introduction to these programming models, see Get started using Apache HBase with Apache Hadoop in HDInsight. Coprocessors is rendelkezésre állnak, amelyek lehetővé teszik az adatfeldolgozást a csomópontok az adatbázist.Coprocessors are also available, which allow data processing in the nodes that host the database.

Megjegyzés

A HBase nem támogatja a Thriftet a HDInsightban.Thrift is not supported by HBase in HDInsight.

Alkalmazási helyzetek: Az Apache HBase használati eseteiScenarios: Use cases for Apache HBase

A kanonikus használati eset, amely BigTable (és továbbgyűrűzéseként HBase) létrejött, a webes keresés.The canonical use case for which BigTable (and by extension, HBase) was created from web search. A keresőmotorok indexeket építenek, amelyek kifejezéseket képeznek le az azokat tartalmazó weblapokra.Search engines build indexes that map terms to the web pages that contain them. A HBase azonban sok más használati esethez megfelelő – amelyek közül több ebben a szakaszban van felsorolva.But there are many other use cases that HBase is suitable for—several of which are itemized in this section.

  • Kulcs-érték tárolóKey-value store

    A HBase használható kulcs-érték tárolóként, és megfelelő az üzenetkezelési rendszerek kezeléséhez.HBase can be used as a key-value store, and it is suitable for managing message systems. A Facebook a HBase eszközt használja az üzenetkezelési rendszeréhez, amely ideális az internetes kommunikációk tárolásához és kezeléséhez.Facebook uses HBase for their messaging system, and it is ideal for storing and managing Internet communications. A WebTable a HBase eszközt használja a weblapokról kinyert táblázatok keresésére és kezelésére.WebTable uses HBase to search for and manage tables that are extracted from webpages.

  • Érzékelői adatokSensor data

    A HBase hasznos a növekményesen, különböző forrásokból gyűjtött adatok rögzítéséhez.HBase is useful for capturing data that is collected incrementally from various sources. Ebbe tartozik a közösségi hálók adatainak elemzése, az idősorozat, az interaktív irányítópultok naprakészen tartása trendekkel és számlálókkal, valamint a naplórendszerek kezelése.This includes social analytics, time series, keeping interactive dashboards up-to-date with trends and counters, and managing audit log systems. Példák lehetnek erre a Bloomberg Trader terminál és az Open Time Series Database (OpenTSDB), amelyek a kiszolgálórendszerek állapotával kapcsolatos mérőszámokat tárolnak és tesznek elérhetővé.Examples include Bloomberg trader terminal and the Open Time Series Database (OpenTSDB), which stores and provides access to metrics collected about the health of server systems.

  • Valós idejű lekérdezésReal-time query

    Az Apache Phoenix Apache hbase SQL lekérdezési motorja van.Apache Phoenix is a SQL query engine for Apache HBase. JDBC-illesztőként érhető el, és lehetővé teszi a HBase táblák SQL eszközzel végzett lekérdezését és kezelését.It is accessed as a JDBC driver, and it enables querying and managing HBase tables by using SQL.

  • A HBase platformkéntHBase as a platform

    Az alkalmazások a HBase felett futhatnak adattárolóként.Applications can run on top of HBase by using it as a datastore. Ilyenek például a Phoenix, OpenTSDB, Kiji és a Titan.Examples include Phoenix, OpenTSDB, Kiji, and Titan. Az alkalmazások integrálhatók is a HBase eszközzel.Applications can also integrate with HBase. Ilyenek például Apache Hive, Apache Pig, Solr, Apache Storm, Apache Flume, Apache Impala, Apache Spark , Ganglia, és Apache Drill.Examples include Apache Hive, Apache Pig, Solr, Apache Storm, Apache Flume, Apache Impala, Apache Spark , Ganglia, and Apache Drill.

További lépésekNext steps