Co je Apache HBA ve službě Azure HDInsightWhat is Apache HBase in Azure HDInsight

Apache HBA je open source databáze NoSQL, která je postavená na Apache Hadoop a modelována po Google BigTable.Apache HBase is an open-source, NoSQL database that is built on Apache Hadoop and modeled after Google BigTable. HBA poskytují náhodný přístup a silnou konzistenci pro velké objemy dat v databázi bez schématu.HBase provides random access and strong consistency for large amounts of data in a schemaless database. Databáze je uspořádána podle rodin sloupců.The database is organized by column families.

V perspektivě uživatele je adaptér HBA podobný databázi.From user perspective, HBase is similar to a database. Data jsou uložená v řádcích a sloupcích tabulky a data v rámci řádku se seskupují podle řady sloupců.Data is stored in the rows and columns of a table, and data within a row is grouped by column family. HBA je databáze bez schématu.HBase is a schemaless database. Sloupce a datové typy lze před použitím nedefinovat.The columns and data types can be undefined before using them. Kód open-source se škáluje lineárně pro manipulaci s petabajty dat na tisících uzlech.The open-source code scales linearly to handle petabytes of data on thousands of nodes. Může spoléhat na redundanci dat, dávkové zpracování a další funkce, které jsou poskytovány distribuovanými aplikacemi v prostředí Hadoop.It can rely on data redundancy, batch processing, and other features that are provided by distributed applications in the Hadoop environment.

Jak se ve službě Azure HDInsight implementuje Apache HBA?How is Apache HBase implemented in Azure HDInsight?

HDInsight HBase je nabízena jako spravovaný cluster, který je integrován do prostředí Azure.HDInsight HBase is offered as a managed cluster that is integrated into the Azure environment. Clustery jsou nakonfigurovány k přímému ukládání dat v Azure Storage, což zajišťuje nízkou latenci a zvýšení pružnosti ve volbách výkonu a nákladů.The clusters are configured to store data directly in Azure Storage, which provides low latency and increased elasticity in performance and cost choices. Tato vlastnost umožňuje zákazníkům vytvářet interaktivní weby, které pracují s velkými datovými sadami.This property enables customers to build interactive websites that work with large datasets. Pro vytváření služeb, které ukládají data ze senzorů a telemetrie z milionů koncových bodů.To build services that store sensor and telemetry data from millions of end points. A k analýze těchto dat pomocí úloh Hadoop.And to analyze this data with Hadoop jobs. HBA a Hadoop jsou dobrým počátečním bodem pro projekty s velkými objemy dat v Azure.HBase and Hadoop are good starting points for big data project in Azure. Služby umožňují aplikacím v reálném čase pracovat s velkými datovými sadami.The services can enable real-time applications to work with large datasets.

Implementace HDInsight využívá architekturu pro škálování na více instancí HBA k poskytování automatických horizontálního dělení tabulek.The HDInsight implementation uses the scale-out architecture of HBase to provide automatic sharding of tables. A silná konzistence pro čtení a zápisy a automatické převzetí služeb při selhání.And strong consistency for reads and writes, and automatic failover. Výkon je zvýšen ukládáním do mezipaměti pro čtení a vysokou propustností datových proudů pro zápis.Performance is enhanced by in-memory caching for reads and high-throughput streaming for writes. Cluster HBase můžete vytvořit uvnitř virtuální sítě.HBase cluster can be created inside virtual network. Podrobnosti najdete v tématu Vytváření clusterů HDInsight v síti Azure Virtual Network.For details, see Create HDInsight clusters on Azure Virtual Network.

Jakým způsobem jsou data spravována v HDInsight HBase?How is data managed in HDInsight HBase?

Data mohou být spravována v HBase pomocí příkazů create, get, put, a scan z prostředí HBase.Data can be managed in HBase by using the create, get, put, and scan commands from the HBase shell. Data se zapisují do databáze pomocí put a čtou se pomocí get.Data is written to the database by using put and read by using get. Příkaz scan se používá k načítání dat z více řádků v tabulce.The scan command is used to obtain data from multiple rows in a table. Data lze také spravovat pomocí rozhraní API HBase C#, které poskytuje knihovna klienta nad HBase REST API.Data can also be managed using the HBase C# API, which provides a client library on top of the HBase REST API. K databázi HBA je také možné zadat dotaz pomocí Apache Hive.An HBase database can also be queried by using Apache Hive. Úvod do těchto programovacích modelů najdete v tématu Začínáme používat Apache HBA s Apache Hadoop ve službě HDInsight.For an introduction to these programming models, see Get started using Apache HBase with Apache Hadoop in HDInsight. Jsou k dispozici i spoluprocesory, které umožňují zpracování dat v uzlech, které jsou hostiteli databáze.Coprocessors are also available, which allow data processing in the nodes that host the database.

Poznámka

Thrift není podporovaný HBase v HDInsight.Thrift is not supported by HBase in HDInsight.

Případy použití pro Apache HBAUse cases for Apache HBase

Kanonický případ použití, pro který se vytvořilo BigTable (a podle rozšíření, adaptérů HBA) z hledání na webu.The canonical use case for which BigTable (and by extension, HBase) was created from web search. Vyhledávací stroje sestavují indexy, které mapují termíny na webové stránky, které je obsahují.Search engines build indexes that map terms to the web pages that contain them. Ale existuje mnoho dalších případů použití, pro které je HBase vhodné – několik z nich je uvedeno v této části.But there are many other use cases that HBase is suitable for—several of which are itemized in this section.

ScénářScenario PopisDescription
Ukládání hodnot klíčeKey-value store HBA lze použít jako úložiště hodnot klíčů a je vhodné pro správu systémů zpráv.HBase can be used as a key-value store, and it's suitable for managing message systems. Facebook používá pro svůj systém zasílání zpráv HBA a je ideální pro ukládání a správu internetové komunikace.Facebook uses HBase for their messaging system, and it's ideal for storing and managing Internet communications. WebTable využívá HBase k hledání a správě tabulek, které jsou extrahovány z webových stránek.WebTable uses HBase to search for and manage tables that are extracted from webpages.
Data snímačeSensor data HBase je užitečné pro zaznamenání dat shromážděných přírůstkově z různých zdrojů.HBase is useful for capturing data that is collected incrementally from various sources. Tato data zahrnují sociální analýzy a časové řady.This data includes social analytics, and time series. A udržování interaktivních řídicích panelů v aktuálním stavu díky trendům a čítačům a správě systémů protokolů auditu.And keeping interactive dashboards up to date with trends and counters, and managing audit log systems. Mezi příklady patří terminál Bloomberg účastník a databáze Open Time Series (OpenTSDB).Examples include Bloomberg trader terminal and the Open Time Series Database (OpenTSDB). OpenTSDB ukládá a poskytuje přístup ke metrikám shromážděným o stavu serverových systémů.OpenTSDB stores and provides access to metrics collected about the health of server systems.
Dotaz v reálném časeReal-time query Apache Phoenix je DOTAZOVACÍ modul SQL pro Apache HBA.Apache Phoenix is a SQL query engine for Apache HBase. Je k němu přistupované jako ovladač JDBC a umožňuje dotazování a správu v tabulkách HBA pomocí SQL.It's accessed as a JDBC driver, and it enables querying and managing HBase tables by using SQL.
HBase jako platformaHBase as a platform Aplikace lze nad HBase spouštět v případě použití jako datového úložiště.Applications can run on top of HBase by using it as a datastore. Mezi příklady patří Phoenix, OpenTSDB, Kiji a Titan.Examples include Phoenix, OpenTSDB, Kiji, and Titan. Aplikace lze také integrovat s HBase.Applications can also integrate with HBase. Mezi příklady patří: Apache Hive, Apache prasete, Solr, Apache Storm, Apache Flume, Apache Impala, Apache Spark, Ganglia a Apache.Examples include: Apache Hive, Apache Pig, Solr, Apache Storm, Apache Flume, Apache Impala, Apache Spark, Ganglia, and Apache Drill.

Další krokyNext steps