Was ist Azure KI Search?

Die Azure KI-Suche (ehemals bekannt als „Azure Cognitive Search“) bietet einen sicheren Informationsabruf über benutzereigene Inhalte in herkömmlichen und generativen KI-Suchanwendungen.

Der Informationsabruf ist für jede App, die Text und Vektoren anzeigt, von grundlegender Bedeutung. Häufige Szenarios sind Katalog- oder Dokumentsuche, Datenuntersuchung und zunehmend auch Apps im Chatstil über proprietäre Basisdaten. Zum Erstellen eines Suchdiensts werden folgende Funktionen verwendet:

Aus architektonischer Sicht befindet sich ein Suchdienst zwischen den externen Datenspeichern, die Ihre nicht indizierten Daten enthalten, und Ihrer Client-App, die Abfrageanforderungen an einen Suchindex sendet und die Antwort verarbeitet.

Azure KI-Suche-Architektur

In Ihrer Client-App wird die Suchfunktion mithilfe von APIs aus Azure KI Search definiert und kann Relevanzoptimierung, semantische Rangfolge, automatische Vervollständigung, Synonymabgleich, Fuzzyübereinstimmung, Musterabgleich, Filter und Sortierung umfassen.

Auf der Azure-Plattform kann Azure KI Search mit anderen Azure-Diensten integriert werden. Dies erfolgt über Indexer, die das Erfassen/Abrufen von Daten aus Azure-Datenquellen automatisieren, und Skillsets, mit denen nutzbare KI-Daten aus Azure AI Services (z. B. Verarbeitung von Bildern und natürlicher Sprach) oder benutzerdefinierte KI-Daten, die Sie in Azure Machine Learning erstellen oder in Azure Functions einbinden, einbezogen werden.

In einem Suchdienst

Die beiden primären Workloads des eigentlichen Suchdiensts sind Indizierung und Abfrage.

  • Bei der Indizierung handelt es sich um einen Erfassungsprozess, bei dem Inhalte in Ihren Suchdienst geladen und durchsuchbar gemacht werden. Intern wird eingehender Text in Token verarbeitet und in invertierten Indizes gespeichert, und eingehende Vektoren werden in Vektorindizes gespeichert. Das Dokumentformat, das Azure KI Search indizieren kann, ist JSON. Sie können von Ihnen erstellten JSON-Dokumente hochladen oder einen Indexer verwenden, um Ihre Daten in JSON abzurufen oder zu serialisieren.

    Angewandte KI durch ein Skillset erweitert die Indizierung um Bild- und Sprachmodelle. Wenn Sie Bilder oder großen unstrukturierten Text im Quelldokument haben, können Sie Funktionen anfügen, die OCR ausführen, Bilder beschreiben, strukturieren, Text übersetzen und vieles mehr. Sie können auch Fähigkeiten anfügen, mit denen Datenblöcke und Vektorisierungen ausgeführt werden.

  • Abfragen können ausgeführt werden, sobald ein Index mit durchsuchbarem Inhalt aufgefüllt wurde. Ihre Client-App sendet dann Abfrageanforderungen an einen Suchdienst und verarbeitet die Antworten. Die gesamte Abfrageausführung erfolgt über einen von Ihnen gesteuerten Suchindex.

    Die semantische Rangfolge ist eine Erweiterung der Abfrageausführung. Sie fügt der Verarbeitung von Suchergebnissen Language Understanding hinzu, wodurch die Ergebnisse mit der höchsten semantischen Relevanz ganz oben angezeigt werden.

Azure KI Search eignet sich sehr gut für die folgenden Anwendungsszenarios:

  • Verwenden Sie sie für die herkömmliche Volltextsuche und die moderne Vektor-Ähnlichkeitssuche. Unterstützen Sie Ihre generativen KI-Apps mit einer Informationsabfrage, die die Stärken der Stichwort- und Ähnlichkeitssuche nutzt. Verwenden Sie beide Modalitäten, um die relevantesten Ergebnisse abzurufen.

  • Konsolidieren Sie heterogene Inhalte in einem benutzerdefinierten und aufgefüllten Suchindex, der aus Vektoren und Text besteht. Sie behalten den Besitz und die Kontrolle darüber, was durchsuchbar ist.

  • Integrieren der Datensegmentierung und Vektorisierung für generative KI- und RAG-Apps

  • Anwenden von präziser Zugriffssteuerung auf Dokumentebene.

  • Auslagern von Indizierungs- und Abfrageworkloads in einen dedizierten Suchdienst

  • Einfache Implementierung von suchbezogenen Features: Relevanzoptimierung, Facettennavigation, Filter (z. B. geografisch-räumliche Suche), Synonymzuordnung und AutoVervollständigen.

  • Transformation von großen undifferenzierten Text-/Bild- oder Anwendungsdateien, die in Azure Blob Storage oder Azure Cosmos DB gespeichert sind, in durchsuchbare Blöcke. Dies wird bei der Indizierung mit kognitiven Skills erreicht, mit denen Funktionen für die externe Verarbeitung von Azure KI hinzugefügt werden.

  • Hinzufügung einer linguistischen oder benutzerdefinierten Textanalyse. Bei nicht englischsprachigen Inhalten unterstützt Azure KI Search sowohl Lucene-Analysetools als auch die Microsoft-Prozessoren für die Verarbeitung natürlicher Sprache. Sie können Analysetools auch so konfigurieren, dass Rohdaten einer speziellen Verarbeitung unterzogen werden, um z. B. diakritische Zeichen herauszufiltern oder Muster in Zeichenfolgen zu erkennen und beizubehalten.

Weitere Informationen zu bestimmten Funktionen finden Sie unter Azure KI Search-Features.

Erste Schritte

Die Funktionalität wird über das Azure-Portal, einfache REST-APIs oder Azure-SDKs wie das Azure SDK für .NET bereitgestellt. Das Azure-Portal unterstützt die Dienst- und Inhaltsverwaltung mit Tools für die Prototyperstellung und Abfrage Ihrer Indizes und Skillsets.

Mithilfe der folgenden vier Schritte können Sie sich umfassend mit den wichtigsten Suchfunktionen vertraut machen:

  1. Entscheiden Sie sich für eine Ebene und Region. Ein kostenloser Search-Dienst pro Abonnement ist zulässig. Alle Schnellstarts können im Free-Tarif durchgeführt werden. Um mehr Kapazität und Funktionen zu erhalten, benötigen Sie einen abrechenbaren Tarif.

  2. Erstellen eines Suchdiensts über das Azure-Portal.

  3. Beginnen Sie mit dem Datenimport-Assistenten. Wählen Sie ein integriertes Beispiel oder eine unterstützte Datenquelle aus, um einen Index in wenigen Minuten zu erstellen, zu laden und abzufragen.

  4. Schließen Sie den Such-Explorer mithilfe eines Portalclients ab, um den soeben erstellten Suchindex abfragt.

Alternativ können Sie einen Suchindex in kleinen Schritten erstellen, laden und abfragen:

  1. Erstellen Sie einen Suchindex, indem Sie das Portal, die REST-API, das .NET SDK oder ein anderes SDK verwenden. Das Indexschema definiert die Struktur von durchsuchbarem Inhalt.

  2. Laden Sie Inhalte hoch, indem Sie das Pushmodell verwenden, um JSON-Dokumente aus einer beliebigen Quelle zu pushen. Verwenden Sie alternativ das Pullmodell (Indexer),, falls Ihre Quelldaten einen unterstützten Typ haben.

  3. Fragen Sie einen Index ab. Verwenden Sie dazu den Suchexplorer im Portal, die REST-API, das .NET SDK oder ein anderes SDK.

Tipp

Wenden Sie sich an einen Partner, der sich sehr gut mit der Azure KI Search-Technologie auskennt, um Hilfe zu komplexen oder benutzerdefinierten Lösungen zu erhalten.

Suchoptionen vergleichen

Kunden interessieren sich häufig für einen Vergleich von Azure KI Search mit anderen Suchlösungen. Die wesentlichen Unterschiede sind in der folgenden Tabelle zusammengefasst.

Im Vergleich zu Wesentliche Unterschiede
Microsoft Search Microsoft Search ist für authentifizierte Microsoft 365-Benutzer bestimmt, die Abfragen für den Inhalt in SharePoint ausführen müssen. Die Azure KI-Suche ruft Inhalte über Azure und alle JSON-Datasets hinweg ab.
Bing Bing-APIs fragen die Indizes für Bing.com nach übereinstimmenden Begriffen ab. Die Azure KI-Suche durchsucht Indizes, die mit Ihren Inhalten gefüllt sind. Sie steuern die Datenerfassung und das Schema.
Datenbanksuche Azure SQL verfügt über Volltextsuche und Vektorsuche. Azure Cosmos DB verfügt auch über Textsuche und Vektorsuche. Azure KI-Suche wird zu einer attraktiven Alternative, wenn Sie Funktionen wie Relevanzabstimmung oder Inhalte aus heterogenen Quellen benötigen. Die Ressourcenverwendung ist ein weiterer Wendepunkt. Die Indizierung und Abfragen sind rechenintensiv. Durch die Auslagerung der Suche aus dem DBMS werden Systemressourcen für die Transaktionsverarbeitung frei.
Dedizierte Suchlösung Wenn Sie sich für eine dedizierte Suche mit voller Funktionalität entschieden haben, erfolgt der endgültige Vergleich letztendlich zwischen Suchtechnologien. Unter den Cloudanbietern eignet sich die Azure KI-Suche am besten für Vektor-, Schlüsselwort- und Hybridarbeitslasten über Inhalte auf Azure, für Apps, die sich in erster Linie auf die Suche sowohl für den Informationsabruf als auch für die Inhaltsnavigation verlassen.

Wichtige Vorteile umfassen:

  • Unterstützung für Vektor- und Nichtvektorindizierung (Text) und Abfragen. Mit der Vektorähnlichkeitssuche finden Sie Informationen, die den Suchanfragen semantisch ähnlich sind, auch wenn die Suchbegriffe nicht exakt übereinstimmen. Verwenden Sie die Hybridsuche, um das Beste aus Stichwort- und Vektorsuche zu erhalten.
  • Rangzuweisung und Relevanzoptimierung durch semantische Priorisierungs- und Bewertungsprofile. Die Abfragesyntax unterstützt Begriffsverstärkung und Feldpriorisierung.
  • Azure-Datenintegration (Crawler) auf Indexebene.
  • Azure KI-Integration für Transformationen, die Inhaltstext und Vektoren durchsuchbar machen.
  • Microsoft Entra-Sicherheit für vertrauenswürdige Verbindungen und Azure Private Link für private Verbindungen in Szenarien ohne Internet.
  • Vollständige Sucherfahrung: Linguistische und benutzerdefinierte Textanalyse in 56 Sprachen. Faceting, AutoVervollständigen-Abfragen und vorgeschlagene Ergebnisse und Synonyme.
  • Azure-Skalierung, Zuverlässigkeit und globale Reichweite.