Azure Blob depolama alanı Depolama arama
Azure Blob depolama alanında depolanan çeşitli içerik türleri arasında Depolama çözülmesi zor bir sorun olabilir. Bu makalede, bloblardan içerik ve meta verileri ayıklamak ve blob'larda bir arama dizinine göndermek için temel iş akışını Azure Bilişsel Arama. Sonuçta elde edilen dizin, tam metin araması kullanılarak sorgulandır olabilir.
Not
İş akışı ve bileşimi hakkında zaten bilgi sahibi misiniz? Bir sonraki adımınız blob indexer'ın nasıl yapılandırıldığından emin olmaktır.
Blob verilerine tam metin araması eklemenin anlamı
Azure Bilişsel Arama, bulutta barındırılan uzaktan aranabilir içeriğinizi içeren kullanıcı tanımlı dizinler üzerinde dizin oluşturma ve sorgu iş yüklerini destekleyen bir arama hizmetidir. Performans için aranabilir içeriğinizi sorgu altyapısıyla birlikte bulmanız gerekir ve sonuçları kullanıcıların arama sorgularından beklediğiniz hızda döndürebilirsiniz.
Bilişsel Arama, dizin oluşturma katmanında Azure Blob Depolama ile tümleştirerek blob içeriğinizi ters dizinlere ve serbest biçimli metin sorgularını ve filtre ifadelerini destekleyen diğer sorgu yapılarına dizinlenmiş arama belgeleri olarak içeri aktarır. Blob içeriğiniz bir arama dizininde dizine alınarak blob içeriğinize ilişkin bilgileri bulmak Azure Bilişsel Arama tüm sorgu özelliklerini kullanabilirsiniz.
Girişler, Azure Blob Depolama'daki tek bir kapsayıcıda yer alan blob Depolama. Bloblar neredeyse her tür metin verisi olabilir. Blob'lar görüntü içeriyorsa, görüntülerden metin oluşturmak ve ayıklamak için blob dizin oluşturmaya AI zenginleştirmesi eklersiniz.
Çıkış her zaman Azure Bilişsel Arama, istemci uygulamalarında hızlı metin araması, alma ve araştırma için kullanılan bir dizindir. arasında dizin oluşturma işlem hattı mimarisinin kendisi yer almaktadır. İşlem hattı, bu makalede daha fazla tartışılan dizin oluşturma özelliğini temel alınmıştır.
Dizin oluşturulduktan ve doldurulduğunda blob kapsayıcınıza göre bağımsız olarak mevcuttur ancak değiştirilen belgelere göre dizininizi yenilemek için dizin oluşturma işlemlerini yeniden çalıştırabilirsiniz. Blobların tek tek zaman damgası bilgileri, değişiklik algılama için kullanılır. Yenileme mekanizması olarak zamanlanmış yürütmeyi veya isteğe bağlı dizinle almayı tercih edersiniz.
Gerekli kaynaklar
Hem azure blob Azure Bilişsel Arama hem de Azure Blob Depolama. Blob depolamanın içinde kaynak içerik sağlayan bir kapsayıcıya ihtiyacınız vardır.
Doğrudan hesap portalı Depolama başlayabilirsiniz. Sol gezinti sayfasında, Blob hizmeti'nin altında Yeni hizmet Azure Bilişsel Arama ekle'yi seçin veya var olan bir hizmeti seçin.
Depolama hesabınıza Azure Bilişsel Arama blob verilerini dizine eklemek için standart işlemi takip edin. Kolay bir başlangıç tanıtımı için Azure Bilişsel Arama veri içeri aktarma sihirbazını öneririz veya Postman gibi bir araç kullanarak REST API'lerini çağırmanız önerilir. Bu öğreticide, Postman: REST API içinde yarı yapılandırılmış verileri (JSON blobları)dizinleme ve arama adımlarında size Azure Bilişsel Arama.
Blob dizin oluşturma kullanma
Dizin oluşturma, bilişsel aramada veri örnekleme, meta veri okuma, veri alma ve yerel biçimlerden verileri sonraki içeri aktarma için JSON belgelerine seri hale getirme için iç mantıkla donatılmış veri kaynağı algılayan bir alt hizmettir.
Azure depolama Depolama Blob depolama dizin Azure Bilişsel Arama kullanılarak dizine alır. Verileri içeri aktarma sihirbazını, bir REST API veya .NET SDK'sı kullanarak bu dizin oluşturma çağırabilirsiniz. Kodda, türünü ayarerek ve blob kapsayıcısı ile birlikte Azure Depolama hesabı içeren bağlantı bilgilerini sağlayarak bu dizin oluşturma türünü kullanırsınız. Bloblarınızı alt kümelere oluşturmak için bir sanal dizin oluşturabilirsiniz. Bunu parametre olarak veya dosya türü uzantısına göre filtreleyebilirsiniz.
Dizin sağlayıcı, içeriği incelemek için bir blobu açarak"belgeyi kırıyor". Veri kaynağına bağlandıktan sonra işlem hattının ilk adımıdır. Blob verileri için PDF, Office ve diğer içerik türleri burada algılanır. Metin ayıklama ile belgeyi ayıklamak ücretsizdir. Blob'lar görüntü içeriği içeriyorsa, AI zenginleştirmesi eklemedikçe görüntüler yoksayılır. Standart dizin oluşturma yalnızca metin içeriği için geçerlidir.
Blob dizin oluşturma, yapılandırma parametreleriyle birlikte gelir ve temel alınan veriler yeterli bilgi sağlarsa değişiklik izlemesini destekler. Blob depolama dizin Azure Bilişsel Arama hakkında daha fazla bilgi bulabilirsiniz.
Desteklenen erişim katmanları
Blob depolama erişim katmanları arasında hot, cool ve archive yer almaktadır. Dizinler yalnızca hot ve cool ile erişilebilir.
Desteklenen içerik türleri
Kapsayıcı üzerinde blob dizin oluşturma çalıştırarak, tek bir sorguyla aşağıdaki içerik türlerinden metin ve meta verileri ayıkabilirsiniz:
- Microsoft Office biçimleri: DOCX/DOC/DOCM, XLSX/XLS/XLSM, PPTX/PPT/PPTM, MSG (Outlook e-postalar), XML(2003 ve 2006 WORD XML)
- Açık Belge biçimleri: ODT, ODS, ODP
- HTML
- XML
- KML (coğrafi gösterimler için XML)
- Zip
- Gz
- EPUB
- Eml
- Rtf
- Düz metin dosyaları (ayrıca bkz. Düz metin dizini oluşturma)
- JSON (bkz. JSON bloblarını dizinleme)
- CSV (bkz. CSV bloblarını dizinleme)
Blob meta verilerini dizinleme
Tüm içerik türlerinde bloblar arasında sıralamayı kolaylaştıran yaygın bir senaryo, her blob için hem özel meta verileri hem de sistem özelliklerini dizine almaktır. Bu şekilde, belge türünden bağımsız olarak tüm bloblar için bilgiler dizine kaydedilir ve arama hizmetinizin bir dizininde depolanır. Yeni dizininizi kullanarak tüm Blob depolama içeriğinde sıralama, filtreleme ve facet işlemine geçebilirsiniz.
Not
Blob Dizini etiketleri, Blob depolama hizmeti tarafından yerel olarak dizine alındı ve sorgulama için ortaya çıktı. Blob'ların anahtar/değer öznitelikleri dizin oluşturma ve filtreleme özellikleri gerektirirse, meta veriler yerine Blob Dizini etiketlerinin kullanılamaları gerekir.
Blob Dizini hakkında daha fazla bilgi edinmek için bkz. Blob Dizini ile Azure Blob Depolama verileri yönetme ve bulma.
JSON bloblarını dizinleme
Dizinciler, JSON içeren bloblarda bulunan yapılandırılmış içeriği ayıklamak için yalıtabilirsiniz. Dizin sağlayıcı, JSON bloblarını okuyabilir ve yapılandırılmış içeriği bir arama belgesinin uygun alanlarına ayrıştırabilirsiniz. Dizinciler ayrıca bir JSON nesneleri dizisi içeren blobları alıp her öğeyi ayrı bir arama belgesine eşler. Dizin oluşturan JSON nesnesinin türünü etkileyecek bir ayrıştırma modu ayarlayın.
Arama dizininde blob içeriği arama
Dizin oluşturmanın çıktısı, bir istemci uygulamasında ücretsiz metin ve filtrelenmiş sorgular kullanarak etkileşimli araştırma için kullanılan bir arama dizinidir. İçeriğin ilk keşfi ve doğrulaması için belge yapısını incelemek üzere portalda Arama Gezgini ile başlamanızı öneririz. Arama gezgininde basit sorgu söz dizimi, tam sorgu söz dizimi ve filtre ifadesi söz dizimi kullanabilirsiniz.
Sorgu girişlerini toplamak ve yanıtı bir istemci uygulamasında arama sonuçları olarak sunmak daha kalıcı bir çözümdür. Aşağıdaki C# öğreticisinde bir arama uygulamasının nasıl oluşturularak ilgili bilgiler ve bilgiler ve Azure Bilişsel Arama.