Azure HDInsight, Apache HBase nedirWhat is Apache HBase in Azure HDInsight

Apache HBase üzerinde oluşturulan bir açık kaynak, NoSQL veritabanıdır Apache Hadoop ve sonra Modellenen Google BigTable.Apache HBase is an open-source, NoSQL database that is built on Apache Hadoop and modeled after Google BigTable. HBase, sütun aileleri tarafından veritabanında büyük miktarlardaki yapılandırılmamış ve yarı yapılandırılmış veriler için rasgele erişim ve güçlü tutarlılık sağlar.HBase provides random access and strong consistency for large amounts of unstructured and semistructured data in a schemaless database organized by column families.

Kullanıcı açısından bakıldığında, HBase, veritabanına benzer.From user perspective, HBase is similar to a database. Verileri satırlar ve sütunlar bir tablo biçiminde depolanır ve satır içindeki veriler sütun ailesi tarafından gruplandırılır.Data is stored in the rows and columns of a table, and data within a row is grouped by column family. HBase, kullanılmadan önce sütunların ya da bunlarda depolanan veri türünün tanımlanmasına gerek duyulmayan, şemasız bir veritabanıdır.HBase is a schemaless database in the sense that neither the columns nor the type of data stored in them need to be defined before using them. Açık kaynak kodu, binlerce düğümdeki petabaytlarca verileri işlemek için doğrusal olarak ölçeklendirir.The open-source code scales linearly to handle petabytes of data on thousands of nodes. Veri yedekleme, toplu işleme ve Hadoop ekosistemindeki dağıtılmış uygulamalar tarafından sağlanan diğer özelliklere dayanabilir.It can rely on data redundancy, batch processing, and other features that are provided by distributed applications in the Hadoop ecosystem.

Apache HBase, Azure HDInsight nasıl uygulanır?How is Apache HBase implemented in Azure HDInsight?

HDInsight HBase, Azure ortamına tümleştirilmiş yönetilen bir küme olarak sunulur.HDInsight HBase is offered as a managed cluster that is integrated into the Azure environment. Kümeler verileri doğrudan depolamak için yapılandırılmıştır Azure depolama düşük gecikme süresi ve performans ve maliyet seçeneklerinde artan esneklik sağlar.The clusters are configured to store data directly in Azure Storage which provides low latency and increased elasticity in performance and cost choices. Bu, müşterilerin milyonlarca uç noktadan gelen algılayıcı ve telemetri verilerini depolayan hizmetleri oluşturmak ve bu verileri Hadoop işleriyle çözümlemek üzere etkileşimli web siteleri oluşturmalarını sağlar.This enables customers to build interactive websites that work with large datasets, to build services that store sensor and telemetry data from millions of end points, and to analyze this data with Hadoop jobs. HBase ve Hadoop Azure’da büyük veri projeleri için yi başlangıç noktalarıdır; bunlar özellikle büyük veri kümeleriyle çalışmak üzere gerçek zamanlı uygulamaları etkinleştirebilir.HBase and Hadoop are good starting points for big data project in Azure; in particular, they can enable real-time applications to work with large datasets.

HDInsight uygulaması, tabloların otomatik parçalanmasını, okumalar ve yazmalar için yüksek tutarlılık ve otomatik yük devretme sağlamak için HBase’in ölçek genişletmeli mimarisinden yararlanır.The HDInsight implementation leverages the scale-out architecture of HBase to provide automatic sharding of tables, strong consistency for reads and writes, and automatic failover. Performans, okumalar için bellek içi önbelleğe alma ve yazmalar için yüksek verimlilikli akış tarafından geliştirilmiştir.Performance is enhanced by in-memory caching for reads and high-throughput streaming for writes. HBase kümesi sanal ağda oluşturulabilir.HBase cluster can be created inside virtual network. Ayrıntılar için bkz. Azure Sanal Ağ'da HDInsight kümeleri oluşturma.For details, see Create HDInsight clusters on Azure Virtual Network.

Veriler HDInsight HBase’de nasıl yönetilir?How is data managed in HDInsight HBase?

Veriler HBase kabuğunda create, get, put ve scan komutları kullanılarak HBase tarafından yönetilebilir.Data can be managed in HBase by using the create, get, put, and scan commands from the HBase shell. Veriler put kullanılarak veritabanına yazılır ve get kullanarak okunur.Data is written to the database by using put and read by using get. scan komutu, bir tablodaki birden çok satırdaki verileri almak için kullanılır.The scan command is used to obtain data from multiple rows in a table. Veriler, HBase REST API’sinin üstünde bir istemci kitaplığı sağlayan HBase C# API’si kullanılarak da yönetilebilir.Data can also be managed using the HBase C# API, which provides a client library on top of the HBase REST API. Bir HBase veritabanı kullanarak da sorgulanabilir Apache Hive.An HBase database can also be queried by using Apache Hive. Bu programlama modellerine giriş için bkz HDInsight, Apache Hadoop ile Apache HBase kullanmaya başlama.For an introduction to these programming models, see Get started using Apache HBase with Apache Hadoop in HDInsight. Coprocessors de veritabanı barındıran düğümlerde veri işlemeye olanak tanıyan sunulur.Coprocessors are also available, which allow data processing in the nodes that host the database.

Not

Thrift, HDInsight’ta HBase tarafından desteklenmez.Thrift is not supported by HBase in HDInsight.

Senaryolar: Apache HBase kullanım örnekleriScenarios: Use cases for Apache HBase

Web araması olan kurallı kullanım örneği bigtable (ve uzantılarının, HBase) oluşturuldu.The canonical use case for which BigTable (and by extension, HBase) was created from web search. Arama motorları terimleri bunları içeren web siteleriyle eşleştiren dizinler oluşturur.Search engines build indexes that map terms to the web pages that contain them. Ancak HBase için uygun olan diğer birçok kullanım örneği vardır; bunların birkaçı bu bölümde listelenmektedir.But there are many other use cases that HBase is suitable for—several of which are itemized in this section.

  • Anahtar değeri deposuKey-value store

    HBase bir anahtar değeri deposu olarak kullanılabilir ve ileti sistemlerini yönetmeye uygundur.HBase can be used as a key-value store, and it is suitable for managing message systems. Facebook kendi ileti sistemi için HBase kullanır ve Internet iletişimlerini depolamak ve yönetmek için idealdir.Facebook uses HBase for their messaging system, and it is ideal for storing and managing Internet communications. WebTable web sayfalarından çıkarılan tabloları aramak ve yönetmek için HBase kullanır.WebTable uses HBase to search for and manage tables that are extracted from webpages.

  • Algılayıcı verileriSensor data

    HBase çeşitli kaynaklardan artımlı olarak toplanan verileri yakalamak için yararlıdır.HBase is useful for capturing data that is collected incrementally from various sources. Bu, sosyal analizler, zaman serileri, etkileşimli panoları eğilimler ve sayaçlar ile güncel tutma ve denetim günlüğü sistemlerini yönetmeyi içerir.This includes social analytics, time series, keeping interactive dashboards up-to-date with trends and counters, and managing audit log systems. Örnek olarak, Bloomberg tüccar terminali ve sunucu sistemlerinin durumuna ilişkin toplanan ölçümleri toplayan ve bunlara erişim imkanı sağlayan Open Time Series Veritabanı (OpenTSDB) verilebilir.Examples include Bloomberg trader terminal and the Open Time Series Database (OpenTSDB), which stores and provides access to metrics collected about the health of server systems.

  • Gerçek zamanlı sorguReal-time query

    Apache Phoenix Apache HBase için bir SQL sorgu alt yapısıdır.Apache Phoenix is a SQL query engine for Apache HBase. Buna JDBC sürücüsü olarak erişilir ve bu SQL kullanarak HBase tablolarını sorgulamayı ve yönetmeyi sağlar.It is accessed as a JDBC driver, and it enables querying and managing HBase tables by using SQL.

  • Bir platform olarak HBaseHBase as a platform

    Uygulamalar, bir veri deposu olarak kullanarak HBase’in üstünde çalışabilir.Applications can run on top of HBase by using it as a datastore. Örnekler, Phoenix, OpenTSDB, Kiji ve Titan.Examples include Phoenix, OpenTSDB, Kiji, and Titan. Uygulamalar HBase ile de tümleştirebilir.Applications can also integrate with HBase. Örnekler Apache Hive, Apache Pig, Solr, Apache Storm, Apache Flume, Apache Impala, Apache Spark , Ganglia, ve Apache ayrıntıya.Examples include Apache Hive, Apache Pig, Solr, Apache Storm, Apache Flume, Apache Impala, Apache Spark , Ganglia, and Apache Drill.

Sonraki adımlarNext steps