Azure HDInsight 'ta Apache HBase nedir?
Apache HBase , Apache Hadoop oluşturulan ve Google BigTable'dan sonra Modellenen açık kaynaklı, NoSQL veritabanıdır. HBase, daha seyrek erişimli bir veritabanında büyük miktarlarda veri için rastgele erişim ve güçlü tutarlılık sağlar. Veritabanı sütun ailelerine göre düzenlenir.
Kullanıcı perspektifinden HBase veritabanına benzer. Veriler bir tablonun satırları ve sütunlarında depolanır ve bir satırdaki veriler sütun ailesine göre gruplandırılır. HBase, şesız bir veritabanıdır. Sütunlar ve veri türleri kullanılmadan önce tanımsız olabilir. Açık kaynak kodu, binlerce düğümdeki petabaytlarca verileri işlemek için doğrusal olarak ölçeklendirir. Bu, Hadoop ortamında dağıtılmış uygulamalar tarafından sunulan veri yedekliliği, toplu işleme ve diğer özelliklere güvenebilirler.
Azure HDInsight 'ta Apache HBase nasıl uygulanır?
HDInsight HBase, Azure ortamına tümleştirilmiş yönetilen bir küme olarak sunulur. Kümeler, düşük gecikme süresi ve performans ve maliyet seçeneklerinde artan esneklik sağlayan verileri doğrudan Azure Storage'da depolayacak şekilde yapılandırılmıştır. Bu özellik, müşterilerin büyük veri kümeleriyle çalışan etkileşimli Web siteleri oluşturmasına olanak sağlar. Milyonlarca uç noktadan algılayıcı ve telemetri verilerini depolayan hizmetler oluşturmak için. Ve bu verileri Hadoop işleriyle analiz edin. HBase ve Hadoop, Azure 'da büyük veri projesi için iyi başlangıç noktalarıdır. Hizmetler gerçek zamanlı uygulamaların büyük veri kümeleriyle çalışmasını sağlayabilir.
HDInsight uygulama, tabloların otomatik olarak parçalara ilmesi için HBase 'in genişleme mimarisini kullanır. Ve okuma ve yazma işlemleri için güçlü tutarlılık ve otomatik yük devretme. Performans, okumalar için bellek içi önbelleğe alma ve yazmalar için yüksek verimlilikli akış tarafından geliştirilmiştir. HBase kümesi sanal ağda oluşturulabilir. Ayrıntılar için bkz. Azure Sanal Ağ'da HDInsight kümeleri oluşturma.
Veriler HDInsight HBase’de nasıl yönetilir?
Veriler HBase kabuğunda create, get, put ve scan komutları kullanılarak HBase tarafından yönetilebilir. Veriler put kullanılarak veritabanına yazılır ve get kullanarak okunur. scan komutu, bir tablodaki birden çok satırdaki verileri almak için kullanılır. Veriler, HBase REST API’sinin üstünde bir istemci kitaplığı sağlayan HBase C# API’si kullanılarak da yönetilebilir. HBase veritabanı, Apache Hivekullanılarak da sorgulanabilir. Bu programlama modellerine giriş için bkz. HDInsight 'ta Apache Hadoop Ile Apache HBase kullanmaya başlama. Aynı zamanda, veritabanını barındıran düğümlerde veri işlemeye izin veren de mevcuttur.
Not
Thrift, HDInsight’ta HBase tarafından desteklenmez.
Apache HBase için kullanım örnekleri
Web aramadan BigTable (ve uzantısı ile HBase) oluşturulan kurallı kullanım durumu. Arama motorları terimleri bunları içeren web siteleriyle eşleştiren dizinler oluşturur. Ancak HBase için uygun olan diğer birçok kullanım örneği vardır; bunların birkaçı bu bölümde listelenmektedir.
| Senaryo | Açıklama |
|---|---|
| Anahtar değeri deposu | HBase anahtar-değer deposu olarak kullanılabilir ve ileti sistemlerini yönetmek için uygundur. Facebook, kendi mesajlaşma sistemleri için HBase kullanır ve Internet iletişimlerini depolamak ve yönetmek için idealdir. WebTable web sayfalarından çıkarılan tabloları aramak ve yönetmek için HBase kullanır. |
| Algılayıcı verileri | HBase çeşitli kaynaklardan artımlı olarak toplanan verileri yakalamak için yararlıdır. Bu veriler sosyal çözümlemeler ve zaman serisini içerir. Eğilimleri ve sayaçları ve denetim günlüğü sistemlerini yönetmek için etkileşimli panoları güncel tutun. Örnek olarak Bloomberg tüccar terminali ve açık zaman serisi veritabanı (opentsdb) verilebilir. OpenTSDB depolar ve sunucu sistemlerinin sistem durumu hakkında toplanan ölçümlere erişim sağlar. |
| Gerçek zamanlı sorgu | Apache Phoenix , Apache HBase IÇIN bir SQL sorgu altyapısıdır. Bir JDBC sürücüsü olarak erişilir ve SQL kullanarak HBase tablolarının sorgulanmasına ve yönetilmesine izin vermez. |
| Bir platform olarak HBase | Uygulamalar, bir veri deposu olarak kullanarak HBase’in üstünde çalışabilir. Phoenix, OpenTSDB, Kiji ve Titan örnekleri sayılabilir. Uygulamalar HBase ile de tümleştirebilir. Örnekler şunlardır: Apache Hive, Apache Pig, solr, Apache Storm, Apache flome, Apache Impala, Apache Spark, Ganglia ve Apache detaya gitme. |