Tutorial: Suchen von unstrukturierten Daten in CloudspeicherTutorial: Search unstructured data in cloud storage

In diesem Tutorial erfahren Sie, wie Sie mit Azure Search anhand von gespeicherten Daten in Azure Blob Storage nach unstrukturierten Daten suchen.In this tutorial, you learn how to search unstructured data by using Azure Search, using data stored in Azure Blob storage. Unstrukturierte Daten sind Daten, die entweder nicht in vordefinierter Weise angeordnet sind oder nicht über ein Datenmodell verfügen.Unstructured data is data that either is not organized in a pre-defined manner or does not have a data model. Ein Beispiel ist eine TXT-Datei.An example is a .txt file.

Dieses Tutorial setzt voraus, dass Sie über ein Azure-Abonnement verfügen.This tutorial requires that you have an Azure subscription. Wenn Sie kein Azure-Abonnement besitzen, können Sie ein kostenloses Konto erstellen, bevor Sie beginnen.If you don't have an Azure subscription, create a free account before you begin.

In diesem Tutorial lernen Sie Folgendes:In this tutorial you learn how to:

  • Erstellen einer RessourcengruppeCreate a resource group
  • Speicherkonto erstellenCreate a storage account
  • Erstellen eines ContainersCreate a container
  • Hochladen von Daten in Ihren ContainerUpload data to your container
  • Erstellen eines Azure Search-Diensts über das Azure-PortalCreate a search service through the portal
  • Verbinden eines Suchdiensts mit einem SpeicherkontoConnect a search service to a storage account
  • Erstellen einer DatenquelleCreate a data source
  • Konfigurieren des IndexConfigure the index
  • Erstellen eines IndexersCreate an indexer
  • Verwenden des Azure Search-Diensts zum Suchen Ihres ContainersUse the search service to search your container

VoraussetzungenPrerequisites

Jedes Speicherkonto muss zu einer Azure-Ressourcengruppe gehören.Every storage account must belong to an Azure resource group. Eine Ressourcengruppe ist ein logischer Container zur Gruppierung Ihrer Azure-Dienste.A resource group is a logical container for grouping your Azure services. Beim Erstellen eines Speicherkontos haben Sie die Möglichkeit, eine neue Ressourcengruppe zu erstellen oder eine vorhandene Ressourcengruppe zu verwenden.When you create a storage account, you have the option to either create a new resource group or use an existing resource group. In diesem Tutorial wird eine neue Ressourcengruppe erstellt.This tutorial creates a new resource group.

Melden Sie sich beim Azure-Portal an.Sign in to the Azure portal.

Führen Sie diese Schritte aus, wenn Sie ein allgemeines Speicherkonto vom Typ „General Purpose v2“ über das Azure-Portal erstellen möchten:To create a general-purpose v2 storage account in the Azure portal, follow these steps:

  1. Wählen Sie im Azure-Portal Alle Dienste aus.In the Azure portal, select All services. Geben Sie in der Liste mit den Ressourcen Speicherkonten ein.In the list of resources, type Storage Accounts. Sobald Sie mit der Eingabe beginnen, wird die Liste auf der Grundlage Ihrer Eingabe gefiltert.As you begin typing, the list filters based on your input. Wählen Sie Speicherkonten.Select Storage Accounts.

  2. Klicken Sie im angezeigten Fenster Speicherkonten auf Hinzufügen.On the Storage Accounts window that appears, choose Add.

  3. Wählen Sie das Abonnement aus, in dem das Speicherkonto erstellt werden soll.Select the subscription in which to create the storage account.

  4. Wählen Sie unter dem Feld Ressourcengruppe die Option Neu erstellen.Under the Resource group field, select Create new. Geben Sie einen Namen für die neue Ressourcengruppe an, wie in der folgenden Abbildung dargestellt.Enter a name for your new resource group, as shown in the following image.

    Screenshot: Erstellen einer Ressourcengruppe im Portal

  5. Geben Sie als Nächstes einen Namen für Ihr Speicherkonto ein.Next, enter a name for your storage account. Der gewählte Name muss innerhalb von Azure eindeutig sein.The name you choose must be unique across Azure. Der Name muss ebenfalls zwischen 3 und 24 Zeichen lang sein und darf nur Zahlen und Kleinbuchstaben enthalten.The name also must be between 3 and 24 characters in length, and can include numbers and lowercase letters only.

  6. Wählen Sie einen Standort für Ihr Speicherkonto aus, oder verwenden Sie den Standardstandort.Select a location for your storage account, or use the default location.

  7. Behalten Sie die Standardwerte für diese Felder bei:Leave these fields set to their default values:

    FeldField WertValue
    BereitstellungsmodellDeployment model Ressourcen-ManagerResource Manager
    LeistungPerformance StandardStandard
    KontoartAccount kind StorageV2 (universell v2)StorageV2 (general-purpose v2)
    ReplikationReplication Georedundanter Speicher mit Lesezugriff (RA-GRS)Read-access geo-redundant storage (RA-GRS)
    ZugriffsebeneAccess tier HeißHot
  8. Wählen Sie Überprüfen + erstellen, um die Speicherkontoeinstellungen zu überprüfen und das Konto zu erstellen.Select Review + Create to review your storage account settings and create the account.

  9. Klicken Sie auf Erstellen.Select Create.

Weitere Informationen zu den Arten von Speicherkonten und anderen Speicherkontoeinstellungen finden Sie unter Übersicht über Azure Storage-Konten.For more information about types of storage accounts and other storage account settings, see Azure storage account overview. Weitere Informationen zu Ressourcengruppen finden Sie unter Übersicht über den Azure Resource Manager.For more information on resource groups, see Azure Resource Manager overview.

Es wurde ein Beispieldataset vorbereitet, das Sie für dieses Tutorial verwenden können.A sample data set has been prepared for you so that you can make use of it for this tutorial. Laden Sie clinical-trials.zip herunter, und entzippen Sie die Datei in ihrem eigenen Ordner.Download clinical-trials.zip and unzip it to its own folder.

Das Beispiel besteht aus Textdateien, die von clinicaltrials.gov abgerufen wurden.The sample consists of text files obtained from clinicaltrials.gov. In diesem Tutorial werden die Dateien als Beispieltextdateien verwendet und mithilfe von Azure Search-Diensten durchsucht.This tutorial uses them as example text files that are searched using Azure Search services.

Erstellen eines ContainersCreate a container

Container ähneln Ordnern und werden zum Speichern von Blobs verwendet.Containers are similar to folders and are used to store blobs.

Für dieses Tutorial verwenden Sie einen einzelnen Container zum Speichern der Textdateien, die Sie von „clinicaltrials.gov“ abgerufen haben.For this tutorial, you use a single container to store the text files obtained from clinicaltrials.gov.

  1. Wechseln Sie im Azure-Portal zu Ihrem Speicherkonto.Go to your storage account in the Azure portal.

  2. Wählen Sie unter Blob-Dienst die Option Blobs durchsuchen aus.Select Browse blobs under Blob Service.

  3. Fügen Sie einen neuen Container hinzu.Add a new container.

  4. Geben Sie für den Container den Namen data ein, und wählen Sie für „Öffentliche Zugriffsebene“ die Option Container aus.Name the container data and select Container for the public access level.

  5. Wählen Sie OK aus, um den Container zu erstellen.Select OK to create the container.

    Unstrukturierte Suche

Hochladen der BeispieldatenUpload the example data

Nachdem Sie jetzt über einen Container verfügen, können Sie die Beispieldaten in den Container hochladen.Now that you have a container, you can upload your example data to it.

  1. Wählen Sie den Container und dann Hochladen aus.Select your container and select Upload.

  2. Klicken Sie auf das blaue Ordnersymbol neben dem Feld Dateien, und navigieren Sie zu dem lokalen Ordner, in dem Sie die Beispieldaten extrahiert haben.Select the blue folder icon next to the Files field and browse to the local folder where you extracted the sample data.

  3. Wählen Sie alle extrahierten Dateien aus, und klicken Sie dann auf Öffnen.Select all of the extracted files and select Open.

  4. Wählen Sie Hochladen aus, um mit dem Hochladen zu beginnen.Select Upload to begin the upload process.

    Unstrukturierte Suche

Der Uploadprozess kann einen Moment dauern.The upload process might take a moment.

Kehren Sie nach Abschluss des Uploads zu Ihrem Datencontainer zurück, und überprüfen Sie, ob die Textdateien hochgeladen wurden.After it finishes, go back into your data container to confirm the text files were uploaded.

Unstrukturierte Suche

Erstellen eines SuchdienstsCreate a search service

Azure Search ist eine Search-as-a-Service-Cloudlösung, die Entwicklern APIs und Tools zum Hinzufügen von Suchfunktionen für Ihre Daten bietet.Azure Search is a search-as-a-service cloud solution that gives developers APIs and tools for adding a search experience over your data.

In diesem Tutorial verwenden Sie einen Suchdienst, um die aus „clinicaltrials.gov“ abgerufenen Textdateien zu durchsuchen.For this tutorial, you use a search service to search the text files obtained from clinicaltrials.gov.

  1. Wechseln Sie im Azure-Portal zu Ihrem Speicherkonto.Go to your storage account in the Azure portal.

  2. Scrollen Sie nach unten, und wählen Sie unter BLOB-DIENST die Option Azure Search hinzufügen aus.Scroll down and select Add Azure Search under BLOB SERVICE.

  3. Wählen Sie unter Daten importieren die Option Dienst auswählen aus.Under Import Data, select Pick your service.

  4. Wählen Sie Hier klicken, um einen neuen Suchdienst zu erstellen aus.Select Click here to create a new search service.

  5. Geben Sie in Neuer Suchdienst einen eindeutigen Namen für Ihren Suchdienst in das Feld URL ein.Inside New Search Service enter a unique name for your search service in the URL field.

  6. Aktivieren Sie unter Ressourcengruppe das Optionsfeld Vorhandene verwenden, und wählen Sie die zuvor erstellte Ressourcengruppe aus.Under Resource group, select Use existing and choose the resource group that you created earlier.

  7. Wählen Sie für Tarif den Free-Tarif aus, und klicken Sie dann auf Auswählen.For Pricing tier, select the Free tier and click Select.

  8. Wählen Sie Erstellen aus, um den Suchdienst zu erstellen.Select Create to create the search service.

    Unstrukturierte Suche

Verbinden des Azure Search-Diensts mit Ihrem ContainerConnect your search service to your container

Nachdem Sie jetzt über einen Suchdienst verfügen, können Sie ihn an Ihren Blobspeicher anfügen.Now that you have a search service, you can attach it to your blob storage. Dieser Abschnitt führt Sie durch den Prozess zum Auswählen einer Datenquelle, zum Erstellen eines Index und zum Erstellen eines Indexers.This section walks you through the process of choosing a data source, creating an index, and creating an indexer.

  1. Wechseln Sie zum Speicherkonto.Go to your storage account.

  2. Wählen Sie unter BLOB-DIENST die Option Azure Search hinzufügen aus.Select Add Azure Search under BLOB SERVICE.

  3. Wählen Sie unter Daten importieren die Option Suchdienst aus, und klicken Sie dann auf den Suchdienst, den Sie im vorherigen Abschnitt erstellt haben.Select Search Service inside Import Data, and then click the search service that you created in the preceding section. Der Bereich Neue Datenquelle wird geöffnet.This opens New data source.

Erstellen einer DatenquelleCreate a data source

Eine Datenquelle gibt an, welche Daten indiziert werden und wie der Zugriff auf die Daten erfolgt.A data source specifies which data to index and how to access the data. Eine Datenquelle kann von demselben Suchdienst mehrmals verwendet werden.A data source can be used multiple times by the same search service.

  1. Geben Sie einen Namen für die Datenquelle ein.Enter a name for the data source. Wählen Sie unter Zu extrahierende Daten die Option Inhalt und Metadaten aus.Under Data to extract, select Content and Metadata. Die Datenquelle gibt an, welche Teile des Blobs indiziert werden.The data source specifies which parts of the blob are indexed.

  2. Da es sich bei den von Ihnen verwendeten Blobs um Textdateien handelt, legen Sie Analysemodus auf Text fest.Because the blobs you're using are text files, set Parsing Mode to Text.

    Unstrukturierte Suche

  3. Wählen Sie Speichercontainer aus, um die verfügbaren Speicherkonten aufzulisten.Select Storage Container to list the available storage accounts.

  4. Wählen Sie Ihr Speicherkonto und dann den Container aus, den Sie zuvor erstellt haben.Select your storage account, and then select the container that you created previously.

    Unstrukturierte Suche

  5. Klicken Sie auf Auswählen, um zu Neue Datenquelle zurückzukehren, und wählen Sie dann OK aus, um fortzufahren.Click Select to return to New data source, and select OK to continue.

Konfigurieren des IndexConfigure the index

Ein Index besteht aus einer Sammlung von Feldern aus Ihrer Datenquelle, die durchsucht werden können.An index is a collection of fields from your data source that can be searched. Sie konfigurieren Parameter für diese Felder, damit der Suchdienst weiß, mit welchen Methoden Ihre Daten durchsucht werden sollen.You set and configure parameters on these fields so that your search service knows what ways your data should be searched.

  1. Wählen Sie unter Daten importieren die Option Zielindex anpassen aus.In Import data, select Customize target index.

  2. Geben Sie im Feld Indexname einen Namen für Ihren Index ein.Enter a name for your index in the Index name field.

  3. Aktivieren Sie unter metadata_storage_name das Kontrollkästchen des Attributs Abrufbar.Select the Retrievable attribute's check box under metadata_storage_name.

    Unstrukturierte Suche

  4. Klicken Sie auf OK, um die Seite Indexer erstellen zu öffnen.Select OK, which brings up Create an Indexer.

Die Parameter des Index und die Attribute, die Sie diesen Parametern zuweisen, sind wichtig.The parameters of your index and the attributes you give those parameters are important. Die Parameter legen fest, welche Daten gespeichert werden, und die Attribute bestimmen, wie diese Daten gespeichert werden.The parameters specify what data to store, and the attributes specify how to store that data.

Die Spalte FELDNAME enthält die Parameter.The FIELD NAME column contains the parameters. Die folgende Tabelle enthält eine Liste der verfügbaren Attribute und deren Beschreibungen.The following table provides a listing of the available attributes and their descriptions.

FeldattributeField attributes

AttributAttribute BESCHREIBUNGDescription
SchlüsselKey Eine Zeichenfolge, die die eindeutige ID der einzelnen Dokumente darstellt und für die Dokumentsuche verwendet wird.A string that provides the unique ID of each document, used for document lookup. Jeder Index muss über einen Schlüssel verfügen.Every index must have one key. Als Schlüssel kann immer nur ein einzelnes Feld fungieren, und sein Typ muss auf „Edm.String“ festgelegt sein.Only one field can be the key, and its type must be set to Edm.String.
AbrufbarRetrievable Gibt an, ob ein Feld in einem Suchergebnis zurückgegeben werden kann.Specifies whether a field can be returned in a search result.
FilterbarFilterable Ermöglicht die Verwendung des Felds in Filterabfragen.Allows the field to be used in filter queries.
SortierbarSortable Ermöglicht einer Abfrage das Sortieren von Suchergebnissen mithilfe dieses Felds.Allows a query to sort search results using this field.
FacettierbarFacetable Ermöglicht die Verwendung eines Felds in einer Facettennavigationsstruktur für benutzerdefiniertes Filtern.Allows a field to be used in a faceted navigation structure for user self-directed filtering. Felder mit repetitiven Werten, die zum Gruppieren von Dokumenten verwendet werden können (z. B. mehrere Dokumente der gleichen Marken- oder Dienstkategorie), eignen sich in der Regel am besten als Facetten.Typically, fields containing repetitive values that you can use to group documents together (for example, multiple documents that fall under a single brand or service category) work best as facets.
DurchsuchbarSearchable Markiert das Feld als in die Volltextsuche einbeziehbar.Marks the field as full-text searchable.

Erstellen eines IndexersCreate an indexer

Ein Indexer verbindet eine Datenquelle mit einem Suchindex und stellt einen Zeitplan zum erneuten Indizieren Ihrer Daten bereit.An indexer connects a data source with a search index, and provides a schedule to reindex your data.

  1. Geben Sie einen Namen in das Feld Name ein, und wählen Sie OK aus.Enter a name in the Name field and select OK.

    Unstrukturierte Suche

  2. Der Bereich Daten importieren wird wieder angezeigt.You are brought back to Import Data. Wählen Sie OK aus, um den Verbindungsprozess abzuschließen.Select OK to complete the connection process.

Sie haben Ihren Blob jetzt erfolgreich mit dem Suchdienst verbunden.You've now successfully connected your blob to your search service. Es dauert einige Minuten, bis das Portal anzeigt, dass der Index aufgefüllt ist.It takes a few minutes for the portal to show that the index is populated. Der Suchdienst beginnt jedoch sofort mit der Indizierung, daher können Sie unmittelbar mit der Suche beginnen.However, the search service begins indexing immediately so you can begin searching right away.

Suchen Ihrer TextdateienSearch your text files

Öffnen Sie den Suchexplorer innerhalb des Index Ihres neu erstellten Suchdiensts, um Ihre Dateien zu suchen.To search your files, open the search explorer inside the index of your newly created search service.

Die folgenden Schritte zeigen Ihnen, wo Sie den Suchexplorer finden. Zudem werden einige Beispielabfragen bereitgestellt:The following steps show you where to find the search explorer and provides you some example queries:

  1. Navigieren Sie zu „Alle Ressourcen“, und suchen Sie nach dem neu erstellten Suchdienst.Go to all resources and find your newly created search service.

    Unstrukturierte Suche

  2. Wählen Sie Ihren Index aus, um ihn zu öffnen.Select your index to open it.

    Unstrukturierte Suche

  3. Wählen Sie Suchexplorer aus, um den Suchexplorer zu öffnen, in dem Sie Liveabfragen für Ihre Daten ausführen können.Select Search Explorer to open the search explorer, where you can make live queries on your data.

    Unstrukturierte Suche

  4. Wählen Sie Suchen aus, während das Feld für die Abfragezeichenfolge leer ist.Select Search while the query string field is empty. Eine leere Abfrage gibt alle Daten aus Ihren Blobs zurück.An empty query returns all the data from your blobs.

    Unstrukturierte Suche

Geben Sie Kurzsichtigkeit in das Feld Abfragezeichenfolge ein, und wählen Sie dann Suchen aus.Enter Myopia in the Query string field, and select Search. Dadurch wird eine Suche im Inhalt der Dateien gestartet und eine Teilmenge des Inhalts zurückgegeben, der das Wort „Kurzsichtigkeit“ enthält.This step starts a search of the files' contents and returns a subset of them, which contains the word "Myopia."

Unstrukturierte Suche

Neben einer Volltextsuche können Sie auch Abfragen erstellen, die mithilfe des Parameters $select nach Systemeigenschaften suchen.In addition to a full-text search, you can create queries that search by system properties using the $select parameter.

Geben Sie $select=metadata_storage_name als Abfragezeichenfolge ein, und drücken Sie die EINGABETASTE.Enter $select=metadata_storage_name into the query string and press Enter. Dadurch wird nur das betreffende Feld zurückgegeben.This causes only that particular field to return.

Die URL wird direkt von der Abfragezeichenfolge geändert, daher sind Leerzeichen nicht zulässig.The query string is directly modifying the URL, so spaces are not permitted. Verwenden Sie ein Komma, um mehrere Felder zu suchen. Beispiel: $select=metadata_storage_name,metadata_storage_pathTo search multiple fields, use a comma, such as: $select=metadata_storage_name,metadata_storage_path

Der Parameter $select kann nur mit Feldern verwendet werden, die beim Definieren des Index als „abrufbar“ markiert wurden.The $select parameter can only be used with fields that are marked retrievable when defining your index.

Unstrukturierte Suche

Sie haben dieses Tutorial jetzt abgeschlossen und verfügen über einen durchsuchbaren Satz von unstrukturierten Daten.You have now completed this tutorial and have a searchable set of unstructured data.

Bereinigen von RessourcenClean up resources

Am einfachsten lassen sich die erstellten Ressourcen entfernen, indem Sie die Ressourcengruppe löschen.The easiest way to remove the resources you've created is to delete the resource group. Beim Entfernen der Ressourcengruppe werden auch alle in der Gruppe enthaltenen Ressourcen gelöscht.Removing the resource group also deletes all resources included within the group. Im folgenden Beispiel wird durch Entfernen der Ressourcengruppe das Speicherkonto zusammen mit der Ressourcengruppe entfernt.In the following example, removing the resource group removes the storage account and the resource group itself.

  1. Navigieren Sie im Azure-Portal zur Liste der Ressourcengruppen in Ihrem Abonnement.In the Azure portal, go to the list of resource groups in your subscription.
  2. Wählen Sie die Ressourcengruppe aus, die Sie löschen möchten.Select the resource group that you want to delete.
  3. Klicken Sie auf die Schaltfläche Ressourcengruppe löschen, und geben Sie den Namen der Ressourcengruppe in das entsprechende Feld ein.Select the Delete resource group button and enter the name of the resource group in the deletion field.
  4. Klicken Sie auf Löschen.Select Delete.

Nächste SchritteNext steps

Im folgenden Artikel erfahren Sie mehr über das Indizieren von Dokumenten mit Azure Search:Follow this link to learn more about indexing documents with Azure Search: