Öğretici: Bulut depolama alanında yapılandırılmamış verileri aramaTutorial: Search unstructured data in cloud storage

Bu öğreticide, şunların nasıl kullanarak yapılandırılmamış verileri arama Azure Search, Azure Blob Depolama'da depolanan veriler kullanma.In this tutorial, you learn how to search unstructured data by using Azure Search, using data stored in Azure Blob storage. Yapılandırılmamış veriler, önceden tanımlanmış bir şekilde düzenlenmiş olmayan veya bir veri modeline sahip olmayan verilerdir.Unstructured data is data that either is not organized in a pre-defined manner or does not have a data model. Bir .txt dosyasına bir örnektir.An example is a .txt file.

Bu öğreticide bir Azure aboneliğine sahip olmasını gerektirir.This tutorial requires that you have an Azure subscription. Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.If you don't have an Azure subscription, create a free account before you begin.

Bu öğreticide şunların nasıl yapıldığını öğrenirsiniz:In this tutorial you learn how to:

  • Kaynak grubu oluşturmaCreate a resource group
  • Depolama hesabı oluşturmaCreate a storage account
  • Bir kapsayıcı oluşturmaCreate a container
  • Kapsayıcınıza veri yüklemeUpload data to your container
  • Portal aracılığıyla arama hizmeti oluşturmaCreate a search service through the portal
  • Bir arama hizmeti bir depolama hesabına bağlamaConnect a search service to a storage account
  • Veri kaynağı oluşturmaCreate a data source
  • Dizini yapılandırmaConfigure the index
  • Dizin oluşturucu oluşturmaCreate an indexer
  • Arama hizmetini kullanarak kapsayıcınızda arama yapmaUse the search service to search your container

ÖnkoşullarPrerequisites

Her depolama hesabı bir Azure kaynak grubuna ait olmalıdır.Every storage account must belong to an Azure resource group. Kaynak grubu, Azure hizmetlerinizi gruplandırmaya yönelik mantıksal bir kapsayıcıdır.A resource group is a logical container for grouping your Azure services. Bir depolama hesabı oluşturduğunuzda, yeni bir kaynak grubu oluşturabilir veya mevcut bir kaynak grubunu kullanmak için seçeneğiniz vardır.When you create a storage account, you have the option to either create a new resource group or use an existing resource group. Bu öğreticide, yeni bir kaynak grubu oluşturur.This tutorial creates a new resource group.

Azure Portal oturum açın.Sign in to the Azure portal.

Azure portalında genel amaçlı v2 bir depolama hesabı oluşturmak için aşağıdaki adımları izleyin:To create a general-purpose v2 storage account in the Azure portal, follow these steps:

  1. Azure portalda Tüm hizmetler’i seçin.In the Azure portal, select All services. Kaynak listesinde Depolama Hesapları yazın.In the list of resources, type Storage Accounts. Yazmaya başladığınızda liste, girişinize göre filtrelenir.As you begin typing, the list filters based on your input. Depolama Hesapları’nı seçin.Select Storage Accounts.

  2. Açılan Depolama Hesapları penceresinde Ekle'yi seçin.On the Storage Accounts window that appears, choose Add.

  3. Depolama hesabının oluşturulacağı aboneliği seçin.Select the subscription in which to create the storage account.

  4. Kaynak grubu alanı altında Yeni oluştur’u seçin.Under the Resource group field, select Create new. Aşağıdaki görüntüde gösterildiği gibi yeni kaynak grubunuz için bir ad girin.Enter a name for your new resource group, as shown in the following image.

    Portalda kaynak grubu oluşturmayı gösteren ekran görüntüsü

  5. Ardından, depolama hesabınız için bir ad girin.Next, enter a name for your storage account. Seçtiğiniz ad Azure genelinde benzersiz olmalıdır.The name you choose must be unique across Azure. Ad ayrıca 3 - 24 karakter uzunluğunda olmalıdır ve yalnızca rakam ve küçük harf içerebilir.The name also must be between 3 and 24 characters in length, and can include numbers and lowercase letters only.

  6. Depolama hesabınız için bir konum seçin veya varsayılan konumu kullanın.Select a location for your storage account, or use the default location.

  7. Bu alanları varsayılan değerlerine ayarlanmış olarak bırakın:Leave these fields set to their default values:

    AlanField DeğerValue
    Dağıtım modeliDeployment model Resource ManagerResource Manager
    PerformansPerformance StandartStandard
    Hesap türüAccount kind StorageV2 (genel amaçlı v2)StorageV2 (general-purpose v2)
    ÇoğaltmaReplication Okuma erişimli coğrafi olarak yedekli depolama (RA-GRS)Read-access geo-redundant storage (RA-GRS)
    Erişim katmanıAccess tier Sık ErişimliHot
  8. Depolama hesabı ayarlarınızı gözden geçirmek ve hesabı oluşturmak için Gözden Geçir + Oluştur’u seçin.Select Review + Create to review your storage account settings and create the account.

  9. Oluştur’u seçin.Select Create.

Depolama hesaplarının türleri ve diğer depolama hesabı ayarları hakkında daha fazla bilgi için bkz. Azure depolama hesabına genel bakış.For more information about types of storage accounts and other storage account settings, see Azure storage account overview. Kaynak grupları hakkında daha fazla bilgi için bkz. Azure Resource Manager’a genel bakış.For more information on resource groups, see Azure Resource Manager overview.

Böylece yapabileceğiniz bir örnek veri kümesini sizin için hazırlanmış Bu öğretici için bunu kullanın.A sample data set has been prepared for you so that you can make use of it for this tutorial. İndirme trials.zip Klinik ve kendi klasörüne ayıklayın.Download clinical-trials.zip and unzip it to its own folder.

Örnek dosya, clinicaltrials.gov adresinden alınan metin dosyalarından oluşur.The sample consists of text files obtained from clinicaltrials.gov. Bu öğreticide, bunları Azure Search hizmetlerini kullanarak aranır örnek metin dosyası olarak kullanılır.This tutorial uses them as example text files that are searched using Azure Search services.

Bir kapsayıcı oluşturmaCreate a container

Kapsayıcılar klasörlere benzer ve blobları depolamak için kullanılır.Containers are similar to folders and are used to store blobs.

Bu öğreticide clinicaltrials.gov adresinden alınan metin dosyalarını depolamak için tek bir kapsayıcı kullanacaksınız.For this tutorial, you use a single container to store the text files obtained from clinicaltrials.gov.

  1. Azure portalında depolama hesabınıza gidin.Go to your storage account in the Azure portal.

  2. Seçin Gözat blobları altında Blob hizmeti.Select Browse blobs under Blob Service.

  3. Yeni bir kapsayıcı ekleyin.Add a new container.

  4. Kapsayıcı adı veri seçip kapsayıcı genel erişim düzeyi için.Name the container data and select Container for the public access level.

  5. Kapsayıcıyı oluşturmak için Tamam'ı seçin.Select OK to create the container.

    Yapılandırılmamış arama

Örnek verileri karşıya yüklemeUpload the example data

Artık bir kapsayıcıya sahip olduğunuza göre örnek verilerinizi içine yükleyebilirsiniz.Now that you have a container, you can upload your example data to it.

  1. Kapsayıcınızı seçip Yükle'ye tıklayın.Select your container and select Upload.

  2. Mavi klasör simgesini seçin dosyaları alanı ve örnek verileri ayıkladığınız yerel klasöre göz atın.Select the blue folder icon next to the Files field and browse to the local folder where you extracted the sample data.

  3. Ayıklanan dosyaların tümünü'ı seçip açık.Select all of the extracted files and select Open.

  4. Yükle'yi seçerek yükleme işlemini başlatın.Select Upload to begin the upload process.

    Yapılandırılmamış arama

Karşıya yükleme işlemi biraz zaman alabilir.The upload process might take a moment.

Tamamlandığında, metin dosyaları karşıya onaylamak için veri kapsayıcınıza dönün.After it finishes, go back into your data container to confirm the text files were uploaded.

Yapılandırılmamış arama

Arama hizmeti oluşturmaCreate a search service

Azure Search, geliştiricilere API'leri sunan ve verileriniz üzerinde arama deneyimi ekleme araçlarını bir hizmet olarak arama bulut çözümüdür.Azure Search is a search-as-a-service cloud solution that gives developers APIs and tools for adding a search experience over your data.

Bu öğreticide, bir arama hizmeti clinicaltrials.gov alınan metin dosyaları aramak için kullanın.For this tutorial, you use a search service to search the text files obtained from clinicaltrials.gov.

  1. Azure portalında depolama hesabınıza gidin.Go to your storage account in the Azure portal.

  2. Aşağı kaydırın ve select Azure Search Ekle altında BLOB hizmeti.Scroll down and select Add Azure Search under BLOB SERVICE.

  3. Verileri İçeri Aktar bölümünde Hizmetinizi seçin'e tıklayın.Under Import Data, select Pick your service.

  4. Yeni bir arama hizmeti oluşturmak için buraya tıklayın'ı seçin.Select Click here to create a new search service.

  5. Yeni Arama Hizmeti bölümünde URL alanına arama hizmetiniz için benzersiz bir ad girin.Inside New Search Service enter a unique name for your search service in the URL field.

  6. Altında kaynak grubuseçin var olanı kullan ve daha önce oluşturduğunuz kaynak grubunu seçin.Under Resource group, select Use existing and choose the resource group that you created earlier.

  7. İçin fiyatlandırma katmanıseçin ücretsiz katmanı ve tıklayın seçin.For Pricing tier, select the Free tier and click Select.

  8. Arama hizmetini oluşturmak için Oluştur'a tıklayın.Select Create to create the search service.

    Yapılandırılmamış arama

Arama hizmetinizi, kapsayıcınıza bağlamaConnect your search service to your container

Artık bir arama hizmetiniz olduğuna göre bunu blob depolamanıza ekleyebilirsiniz.Now that you have a search service, you can attach it to your blob storage. Bu bölümde veri kaynağı seçme, dizin oluşturma ve dizin oluşturucu oluşturma işlemleri anlatılmaktadır.This section walks you through the process of choosing a data source, creating an index, and creating an indexer.

  1. Depolama hesabınıza gidin.Go to your storage account.

  2. Seçin Azure Search'ü Ekle altında BLOB hizmeti.Select Add Azure Search under BLOB SERVICE.

  3. Seçin arama hizmeti içinde verileri içeri aktarmave ardından önceki bölümde oluşturduğunuz arama hizmete tıklayın.Select Search Service inside Import Data, and then click the search service that you created in the preceding section. Bu açılır yeni veri kaynağı.This opens New data source.

Veri kaynağı oluşturmaCreate a data source

Veri kaynağı, dizin oluşturulacak verileri ve verilere nasıl erişileceğini belirtir.A data source specifies which data to index and how to access the data. Bir arama hizmeti bir veri kaynağını birden fazla kaz kullanabilir.A data source can be used multiple times by the same search service.

  1. Veri kaynağının adını girin.Enter a name for the data source. Ayıklanacak veri bölümünde İçerik ve meta veriler'i seçin.Under Data to extract, select Content and Metadata. Veri kaynağı blobun dizin oluşturulacak bölümlerini belirtir.The data source specifies which parts of the blob are indexed.

  2. Kullanmakta olduğunuz blobları metin dosyaları olan çünkü ayrıştırma modu için metin.Because the blobs you're using are text files, set Parsing Mode to Text.

    Yapılandırılmamış arama

  3. Kullanılabilir depolama hesaplarını listelemek için Depolama Kapsayıcısı'nı seçin.Select Storage Container to list the available storage accounts.

  4. Depolama hesabınızı seçin ve ardından daha önce oluşturduğunuz kapsayıcıyı seçin.Select your storage account, and then select the container that you created previously.

    Yapılandırılmamış arama

  5. Tıklayın seçin dönmek için yeni veri kaynağıseçip Tamam devam etmek için.Click Select to return to New data source, and select OK to continue.

Dizini yapılandırmaConfigure the index

Dizin, veri kaynağınızdaki alanların arama yapılabilen bir koleksiyonudur.An index is a collection of fields from your data source that can be searched. Ayarlayın ve arama hizmetinizin hangi şekilde verilerinizi aranıp aranmayacağını bilebilmesi bu alanlarda parametrelerini yapılandırın.You set and configure parameters on these fields so that your search service knows what ways your data should be searched.

  1. İçinde verileri içeri aktarmaseçin hedef dizini Özelleştir.In Import data, select Customize target index.

  2. Dizin adı alanına dizininize vermek istediğiniz adı girin.Enter a name for your index in the Index name field.

  3. Seçin alınabilir altındaki onay kutusunu özniteliğin metadata_storage_name.Select the Retrievable attribute's check box under metadata_storage_name.

    Yapılandırılmamış arama

  4. Seçin Tamam, hangi getirir dizin oluşturucu oluşturma.Select OK, which brings up Create an Indexer.

Dizininizin parametreleri ve bu parametreler için belirlediğiniz öznitelikler önemlidir.The parameters of your index and the attributes you give those parameters are important. Parametreleri belirtin ne depolamak için veri ve özniteliklerini belirtin nasıl verileri depolamak için.The parameters specify what data to store, and the attributes specify how to store that data.

ALAN ADI sütunu parametreleri içerir.The FIELD NAME column contains the parameters. Aşağıdaki tabloda kullanılabilir özniteliklere ve açıklamalarına yer verilmiştir.The following table provides a listing of the available attributes and their descriptions.

Alan öznitelikleriField attributes

ÖznitelikAttribute AçıklamaDescription
AnahtarKey Her bir belgenin belge araması için kullanılan benzersiz kimliğini sağlayan bir dize.A string that provides the unique ID of each document, used for document lookup. Tüm dizinlerin bir anahtarı olması gerekir.Every index must have one key. Yalnızca bir alan anahtar olabilir ve bunun türü Edm.String olarak ayarlanmalıdır.Only one field can be the key, and its type must be set to Edm.String.
AlınabilirRetrievable Bir arama sonucunda bir alanın döndürülüp döndürülemeyeceğini belirtir.Specifies whether a field can be returned in a search result.
FiltrelenebilirFilterable Alanın filtre sorgularında kullanılmasını sağlar.Allows the field to be used in filter queries.
SıralanabilirSortable Bu alanı kullanarak bir sorgunun arama sonuçlarını sıralamasını sağlar.Allows a query to sort search results using this field.
ModellenebilirFacetable Kullanıcının bağımsız filtrelemesi için modellenmiş bir gezinmede bir alanın kullanılmasını sağlar.Allows a field to be used in a faceted navigation structure for user self-directed filtering. Genellikle, Grup belgelere birlikte kullanabileceğiniz yinelemeli değerler içeren alanlar (bir tek bir marka veya hizmet kategorisine denk gelen örneğin, birden çok belge) model olarak en iyi çalışır.Typically, fields containing repetitive values that you can use to group documents together (for example, multiple documents that fall under a single brand or service category) work best as facets.
AranabilirSearchable Alanı tam metin aranabilir şeklinde işaretler.Marks the field as full-text searchable.

Dizin oluşturucu oluşturmaCreate an indexer

Dizin oluşturucu, veri kaynağı ile bir arama dizini arasında bağlantı kurar ve verilerinizle yeniden dizin oluşturmak için bir zamanlama sunar.An indexer connects a data source with a search index, and provides a schedule to reindex your data.

  1. Ad alanına bir ad girin ve Tamam'ı seçin.Enter a name in the Name field and select OK.

    Yapılandırılmamış arama

  2. Size geri almadan verileri içeri aktarma.You are brought back to Import Data. Seçin Tamam bağlantı işlemini tamamlayın.Select OK to complete the connection process.

Blobunuzla arama hizmetiniz arasında başarıyla bağlantı kurmuş oldunuz.You've now successfully connected your blob to your search service. Portalda dizinin doldurulmuş şekilde görünmesi birkaç dakika sürebilir.It takes a few minutes for the portal to show that the index is populated. Ancak arama hizmeti dizin oluşturmayı hemen başlattığından arama yapmaya doğrudan başlayabilirsiniz.However, the search service begins indexing immediately so you can begin searching right away.

Metin dosyalarınızda arama yapmaSearch your text files

Dosyalarınızda arama yapmak için yeni oluşturduğunuz arama hizmetinin dizininde arama gezginini açın.To search your files, open the search explorer inside the index of your newly created search service.

Aşağıdaki adımlarda arama gezginini nerede bulabileceğiniz ve bazı örnek sorgular gösterilmiştir:The following steps show you where to find the search explorer and provides you some example queries:

  1. Tüm kaynaklara gidin ve yeni oluşturulan arama hizmetinizi bulun.Go to all resources and find your newly created search service.

    Yapılandırılmamış arama

  2. Açmak için dizininizi seçin.Select your index to open it.

    Yapılandırılmamış arama

  3. Seçin arama Gezgini yapabileceğiniz Canlı sorgular verileriniz üzerinde arama Gezgini'ni açın.Select Search Explorer to open the search explorer, where you can make live queries on your data.

    Yapılandırılmamış arama

  4. Sorgu dizesi alanı boş durumdayken Ara'yı seçin.Select Search while the query string field is empty. Boş sorgu, bloblarınızdaki tüm verileri döndürür.An empty query returns all the data from your blobs.

    Yapılandırılmamış arama

Girin Myopia içinde sorgu dizesi alan ve seçim arama.Enter Myopia in the Query string field, and select Search. Bu adım, dosyaların içeriğini bir arama başlatır ve "Myopia." sözcüğünü içeren bir alt kümesini, döndürürThis step starts a search of the files' contents and returns a subset of them, which contains the word "Myopia."

Yapılandırılmamış arama

Tam metin arama ek olarak, sistem özelliklerine göre kullanarak arama sorguları oluşturabilirsiniz $select parametresi.In addition to a full-text search, you can create queries that search by system properties using the $select parameter.

ENTER $select=metadata_storage_name tuşuna basın ve sorgu dizesi içinde Enter.Enter $select=metadata_storage_name into the query string and press Enter. Bu, döndürülecek yalnızca bu belirli alan neden olur.This causes only that particular field to return.

Sorgu dizesi doğrudan URL'yi değiştirdiğinden boşluk kullanılamaz.The query string is directly modifying the URL, so spaces are not permitted. Birden fazla alanda arama yapmak için virgül kullanın; örneğin: $select=metadata_storage_name,metadata_storage_pathTo search multiple fields, use a comma, such as: $select=metadata_storage_name,metadata_storage_path

$select parametresi yalnızca dizininizi tanımlama aşamasında alınabilir olarak işaretlenen alanlar için kullanılabilir.The $select parameter can only be used with fields that are marked retrievable when defining your index.

Yapılandırılmamış arama

Bu öğreticiyi tamamladınız ve elinizde arama yapılabilen bir yapılandırılmamış veri kümesi var.You have now completed this tutorial and have a searchable set of unstructured data.

Kaynakları temizlemeClean up resources

Oluşturduğunuz kaynakları kaldırmak için en kolay yolu kaynak grubunu silmektir.The easiest way to remove the resources you've created is to delete the resource group. Kaynak grubunu kaldırdığınızda o grubun içindeki tüm kaynaklar da silinir.Removing the resource group also deletes all resources included within the group. Aşağıdaki örnekte, kaynak grubu kaldırıldığında depolama hesabı ve kaynak grubunun kendisi de kaldırılır.In the following example, removing the resource group removes the storage account and the resource group itself.

  1. Azure portalda, aboneliğinizdeki kaynak gruplarını listesine gidin.In the Azure portal, go to the list of resource groups in your subscription.
  2. Silmek istediğiniz kaynak grubunu seçin.Select the resource group that you want to delete.
  3. Seçin kaynak grubunu Sil düğmesine tıklayın ve silme alanında kaynak grubunun adını girin.Select the Delete resource group button and enter the name of the resource group in the deletion field.
  4. Sil’i seçin.Select Delete.

Sonraki adımlarNext steps

Azure Search belgeleri dizin oluşturma hakkında daha fazla bilgi için bu bağlantıyı izleyin:Follow this link to learn more about indexing documents with Azure Search: