Azure HDInsight 'ta Apache HBase nedir?What is Apache HBase in Azure HDInsight

Apache HBase , Apache Hadoop oluşturulan ve Google BigTable'dan sonra Modellenen açık kaynaklı, NoSQL veritabanıdır.Apache HBase is an open-source, NoSQL database that is built on Apache Hadoop and modeled after Google BigTable. HBase, daha seyrek erişimli bir veritabanında büyük miktarlarda veri için rastgele erişim ve güçlü tutarlılık sağlar.HBase provides random access and strong consistency for large amounts of data in a schemaless database. Veritabanı sütun ailelerine göre düzenlenir.The database is organized by column families.

Kullanıcı perspektifinden HBase veritabanına benzer.From user perspective, HBase is similar to a database. Veriler bir tablonun satırları ve sütunlarında depolanır ve bir satırdaki veriler sütun ailesine göre gruplandırılır.Data is stored in the rows and columns of a table, and data within a row is grouped by column family. HBase, şesız bir veritabanıdır.HBase is a schemaless database. Sütunlar ve veri türleri kullanılmadan önce tanımsız olabilir.The columns and data types can be undefined before using them. Açık kaynak kodu, binlerce düğümdeki petabaytlarca verileri işlemek için doğrusal olarak ölçeklendirir.The open-source code scales linearly to handle petabytes of data on thousands of nodes. Bu, Hadoop ortamında dağıtılmış uygulamalar tarafından sunulan veri yedekliliği, toplu işleme ve diğer özelliklere güvenebilirler.It can rely on data redundancy, batch processing, and other features that are provided by distributed applications in the Hadoop environment.

Azure HDInsight 'ta Apache HBase nasıl uygulanır?How is Apache HBase implemented in Azure HDInsight?

HDInsight HBase, Azure ortamına tümleştirilmiş yönetilen bir küme olarak sunulur.HDInsight HBase is offered as a managed cluster that is integrated into the Azure environment. Kümeler, düşük gecikme süresi ve performans ve maliyet seçeneklerinde artan esneklik sağlayan verileri doğrudan Azure Storage'da depolayacak şekilde yapılandırılmıştır.The clusters are configured to store data directly in Azure Storage, which provides low latency and increased elasticity in performance and cost choices. Bu özellik, müşterilerin büyük veri kümeleriyle çalışan etkileşimli Web siteleri oluşturmasına olanak sağlar.This property enables customers to build interactive websites that work with large datasets. Milyonlarca uç noktadan algılayıcı ve telemetri verilerini depolayan hizmetler oluşturmak için.To build services that store sensor and telemetry data from millions of end points. Ve bu verileri Hadoop işleriyle analiz edin.And to analyze this data with Hadoop jobs. HBase ve Hadoop, Azure 'da büyük veri projesi için iyi başlangıç noktalarıdır.HBase and Hadoop are good starting points for big data project in Azure. Hizmetler gerçek zamanlı uygulamaların büyük veri kümeleriyle çalışmasını sağlayabilir.The services can enable real-time applications to work with large datasets.

HDInsight uygulama, tabloların otomatik olarak parçalara ilmesi için HBase 'in genişleme mimarisini kullanır.The HDInsight implementation uses the scale-out architecture of HBase to provide automatic sharding of tables. Ve okuma ve yazma işlemleri için güçlü tutarlılık ve otomatik yük devretme.And strong consistency for reads and writes, and automatic failover. Performans, okumalar için bellek içi önbelleğe alma ve yazmalar için yüksek verimlilikli akış tarafından geliştirilmiştir.Performance is enhanced by in-memory caching for reads and high-throughput streaming for writes. HBase kümesi sanal ağda oluşturulabilir.HBase cluster can be created inside virtual network. Ayrıntılar için bkz. Azure Sanal Ağ'da HDInsight kümeleri oluşturma.For details, see Create HDInsight clusters on Azure Virtual Network.

Veriler HDInsight HBase’de nasıl yönetilir?How is data managed in HDInsight HBase?

Veriler HBase kabuğunda create, get, put ve scan komutları kullanılarak HBase tarafından yönetilebilir.Data can be managed in HBase by using the create, get, put, and scan commands from the HBase shell. Veriler put kullanılarak veritabanına yazılır ve get kullanarak okunur.Data is written to the database by using put and read by using get. scan komutu, bir tablodaki birden çok satırdaki verileri almak için kullanılır.The scan command is used to obtain data from multiple rows in a table. Veriler, HBase REST API’sinin üstünde bir istemci kitaplığı sağlayan HBase C# API’si kullanılarak da yönetilebilir.Data can also be managed using the HBase C# API, which provides a client library on top of the HBase REST API. HBase veritabanı, Apache Hivekullanılarak da sorgulanabilir.An HBase database can also be queried by using Apache Hive. Bu programlama modellerine giriş için bkz. HDInsight 'ta Apache Hadoop Ile Apache HBase kullanmaya başlama.For an introduction to these programming models, see Get started using Apache HBase with Apache Hadoop in HDInsight. Aynı zamanda, veritabanını barındıran düğümlerde veri işlemeye izin veren de mevcuttur.Coprocessors are also available, which allow data processing in the nodes that host the database.

Not

Thrift, HDInsight’ta HBase tarafından desteklenmez.Thrift is not supported by HBase in HDInsight.

Apache HBase için kullanım örnekleriUse cases for Apache HBase

Web aramadan BigTable (ve uzantısı ile HBase) oluşturulan kurallı kullanım durumu.The canonical use case for which BigTable (and by extension, HBase) was created from web search. Arama motorları terimleri bunları içeren web siteleriyle eşleştiren dizinler oluşturur.Search engines build indexes that map terms to the web pages that contain them. Ancak HBase için uygun olan diğer birçok kullanım örneği vardır; bunların birkaçı bu bölümde listelenmektedir.But there are many other use cases that HBase is suitable for—several of which are itemized in this section.

SenaryoScenario AçıklamaDescription
Anahtar değeri deposuKey-value store HBase anahtar-değer deposu olarak kullanılabilir ve ileti sistemlerini yönetmek için uygundur.HBase can be used as a key-value store, and it's suitable for managing message systems. Facebook, kendi mesajlaşma sistemleri için HBase kullanır ve Internet iletişimlerini depolamak ve yönetmek için idealdir.Facebook uses HBase for their messaging system, and it's ideal for storing and managing Internet communications. WebTable web sayfalarından çıkarılan tabloları aramak ve yönetmek için HBase kullanır.WebTable uses HBase to search for and manage tables that are extracted from webpages.
Algılayıcı verileriSensor data HBase çeşitli kaynaklardan artımlı olarak toplanan verileri yakalamak için yararlıdır.HBase is useful for capturing data that is collected incrementally from various sources. Bu veriler sosyal çözümlemeler ve zaman serisini içerir.This data includes social analytics, and time series. Eğilimleri ve sayaçları ve denetim günlüğü sistemlerini yönetmek için etkileşimli panoları güncel tutun.And keeping interactive dashboards up to date with trends and counters, and managing audit log systems. Örnek olarak Bloomberg tüccar terminali ve açık zaman serisi veritabanı (opentsdb) verilebilir.Examples include Bloomberg trader terminal and the Open Time Series Database (OpenTSDB). OpenTSDB depolar ve sunucu sistemlerinin sistem durumu hakkında toplanan ölçümlere erişim sağlar.OpenTSDB stores and provides access to metrics collected about the health of server systems.
Gerçek zamanlı sorguReal-time query Apache Phoenix , Apache HBase IÇIN bir SQL sorgu altyapısıdır.Apache Phoenix is a SQL query engine for Apache HBase. Bir JDBC sürücüsü olarak erişilir ve SQL kullanarak HBase tablolarının sorgulanmasına ve yönetilmesine izin vermez.It's accessed as a JDBC driver, and it enables querying and managing HBase tables by using SQL.
Bir platform olarak HBaseHBase as a platform Uygulamalar, bir veri deposu olarak kullanarak HBase’in üstünde çalışabilir.Applications can run on top of HBase by using it as a datastore. Phoenix, OpenTSDB, Kijive Titan örnekleri sayılabilir.Examples include Phoenix, OpenTSDB, Kiji, and Titan. Uygulamalar HBase ile de tümleştirebilir.Applications can also integrate with HBase. Örnekler şunlardır: Apache Hive, Apache Pig, solr, Apache Storm, Apache flome, Apache Impala, Apache Spark, Gangliave Apache detaya gitme.Examples include: Apache Hive, Apache Pig, Solr, Apache Storm, Apache Flume, Apache Impala, Apache Spark, Ganglia, and Apache Drill.

Sonraki adımlarNext steps