Informazioni su Apache HBase in Azure HDInsightWhat is Apache HBase in Azure HDInsight

Apache HBase è un database NoSQL open source basato su Apache Hadoop e modellato su Google BigTable.Apache HBase is an open-source, NoSQL database that is built on Apache Hadoop and modeled after Google BigTable. HBase offre accesso casuale e coerenza assoluta per quantità elevate di dati in un database senza schema.HBase provides random access and strong consistency for large amounts of data in a schemaless database. Il database è organizzato per famiglie di colonne.The database is organized by column families.

Dal punto di vista dell'utente, HBase è simile a un database.From user perspective, HBase is similar to a database. I dati sono archiviati nelle righe e nelle colonne di una tabella e i dati di ogni riga sono raggruppati in base al tipo di colonna.Data is stored in the rows and columns of a table, and data within a row is grouped by column family. HBase è un database senza schema.HBase is a schemaless database. Non è necessario definire colonne e tipi di dati prima di usarli.The columns and data types can be undefined before using them. Il codice open source offre scalabilità lineare, in modo da gestire petabyte di dati in migliaia di nodi.The open-source code scales linearly to handle petabytes of data on thousands of nodes. Può contare su ridondanza dei dati, elaborazione batch e altre funzionalità offerte dalle applicazioni distribuite nell'ambiente di Hadoop.It can rely on data redundancy, batch processing, and other features that are provided by distributed applications in the Hadoop environment.

Modalità di implementazione di Apache HBase in Azure HDInsightHow is Apache HBase implemented in Azure HDInsight?

HBase di HDInsight è offerto come cluster gestito integrato nell'ambiente di Azure.HDInsight HBase is offered as a managed cluster that is integrated into the Azure environment. I cluster sono configurati per archiviare i dati direttamente in Archiviazione di Azure, che offre bassa latenza e maggiore flessibilità nelle opzioni relative a prestazioni e costi.The clusters are configured to store data directly in Azure Storage, which provides low latency and increased elasticity in performance and cost choices. Questa proprietà consente ai clienti di creare siti Web interattivi compatibili con set di dati di grandi dimensioni,This property enables customers to build interactive websites that work with large datasets. allo scopo di creare servizi che archiviano dati di sensori e telemetria da milioni di endpointTo build services that store sensor and telemetry data from millions of end points. e di analizzare questi dati con processi Hadoop.And to analyze this data with Hadoop jobs. HBase e Hadoop costituiscono validi punti di partenza per progetti Big Data in Azure.HBase and Hadoop are good starting points for big data project in Azure. Grazie ai servizi è possibile consentire ad applicazioni in tempo reale di usare set di dati di grandi dimensioni.The services can enable real-time applications to work with large datasets.

L'implementazione di HDInsight usa l'architettura di scale-out di HBase per offrire il partizionamento orizzontale automatico delle tabelle,The HDInsight implementation uses the scale-out architecture of HBase to provide automatic sharding of tables. oltre a coerenza assoluta per operazioni di lettura e scrittura e failover automatico.And strong consistency for reads and writes, and automatic failover. Le prestazioni sono ottimizzate dalla cache in memoria per le operazioni di lettura e da flussi a velocità effettiva elevata per quelle di scrittura.Performance is enhanced by in-memory caching for reads and high-throughput streaming for writes. È possibile creare un cluster HBase in una rete virtuale.HBase cluster can be created inside virtual network. Per informazioni dettagliate, vedere Creare cluster HDInsight nella rete virtuale di Azure.For details, see Create HDInsight clusters on Azure Virtual Network.

Modalità di gestione dei dati in HBase di HDInsightHow is data managed in HDInsight HBase?

I dati possono essere gestiti in HBase tramite i comandi create, get, put e scan dalla shell di HBase.Data can be managed in HBase by using the create, get, put, and scan commands from the HBase shell. I dati vengono scritti nel database tramite put e letti tramite get.Data is written to the database by using put and read by using get. Il comando scan viene usato per ottenere i dati da più righe in una tabella.The scan command is used to obtain data from multiple rows in a table. I dati possono essere gestiti anche tramite l'API C# di HBase, che offre una libreria client, oltre all'API REST di HBase.Data can also be managed using the HBase C# API, which provides a client library on top of the HBase REST API. È anche possibile eseguire query in un database di HBase tramite Apache Hive.An HBase database can also be queried by using Apache Hive. Per informazioni introduttive su questi modelli di programmazione, vedere Introduzione a Apache HBase con Apache Hadoop in HDInsight.For an introduction to these programming models, see Get started using Apache HBase with Apache Hadoop in HDInsight. Sono anche disponibili coprocessori che consentono l'elaborazione dei dati nei nodi che ospitano il database.Coprocessors are also available, which allow data processing in the nodes that host the database.

Nota

Thrift non è supportato da HBase in HDInsight.Thrift is not supported by HBase in HDInsight.

casi di utilizzo per Apache HBaseUse cases for Apache HBase

Il caso di utilizzo tipico per cui è stato creato BigTable, e per estensione HBase, dalla ricerca Web.The canonical use case for which BigTable (and by extension, HBase) was created from web search. I motori di ricerca costruiscono indici per il mapping di termini alle pagine Web che li contengono.Search engines build indexes that map terms to the web pages that contain them. Tuttavia, HBase è adatto a molti altri casi di utilizzo, alcuni dei quali sono descritti in dettaglio in questa sezione.But there are many other use cases that HBase is suitable for—several of which are itemized in this section.

ScenarioScenario DescrizioneDescription
Archivio chiave-valoreKey-value store HBase può essere usato come archivio di tipo chiave-valore ed è adatto alla gestione di sistemi di messaggistica.HBase can be used as a key-value store, and it's suitable for managing message systems. Facebook usa HBase per il proprio sistema di messaggistica ed è ideale per l'archiviazione e la gestione delle comunicazioni Internet.Facebook uses HBase for their messaging system, and it's ideal for storing and managing Internet communications. WebTable usa HBase per eseguire ricerche e gestire tabelle estratte da pagine Web.WebTable uses HBase to search for and manage tables that are extracted from webpages.
Dati di sensoriSensor data HBase è utile per l'acquisizione di dati raccolti in modo incrementale da varie origini,HBase is useful for capturing data that is collected incrementally from various sources. incluse analisi di social media e serie temporali,This data includes social analytics, and time series. e permette di mantenere aggiornati i dashboard interattivi con tendenze e contatori e di gestire i sistemi di log di controllo.And keeping interactive dashboards up to date with trends and counters, and managing audit log systems. Alcuni esempi includono il terminale per trader di Bloomberg e Open Time Series Database (OpenTSDB).Examples include Bloomberg trader terminal and the Open Time Series Database (OpenTSDB). OpenTSDB archivia e offre l'accesso alle metriche raccolte sullo dei sistemi server.OpenTSDB stores and provides access to metrics collected about the health of server systems.
Query in tempo realeReal-time query Apache Phoenix è un motore di query SQL per Apache HBase.Apache Phoenix is a SQL query engine for Apache HBase. Vi si accede mediante un driver JDBC e permette di eseguire query e di gestire le tabelle HBase tramite SQL.It's accessed as a JDBC driver, and it enables querying and managing HBase tables by using SQL.
HBase come piattaformaHBase as a platform Le applicazioni possono essere eseguite su HBase, usato come un archivio dati.Applications can run on top of HBase by using it as a datastore. Alcuni esempi sono Phoenix, OpenTSDB, Kiji e Titan.Examples include Phoenix, OpenTSDB, Kiji, and Titan. Le applicazioni possono anche essere integrate con HBase.Applications can also integrate with HBase. Gli esempi includono: Apache Hive, Apache Pig, Solr, Apache Storm, Apache Flume, Apache Impala, Apache Spark, Ganglia e Apache Drill.Examples include: Apache Hive, Apache Pig, Solr, Apache Storm, Apache Flume, Apache Impala, Apache Spark, Ganglia, and Apache Drill.

Passaggi successiviNext steps