Auswählen einer Microsoft Cognitive Services-Technologie
Microsoft Cognitive Services sind cloudbasierte APIs, die Sie in KI-Anwendungen und -Datenflüssen verwenden können. Sie umfassen vortrainierte Modelle, die für die Nutzung in Ihrer Anwendung bereit sind und für die Sie keine Daten und kein Modelltraining bereitstellen müssen. Cognitive Services werden vom KI- und Forschungsteam von Microsoft entwickelt und umfassen die neuesten Deep Learning-Algorithmen. Sie werden über HTTP-REST-Schnittstellen genutzt. Außerdem sind SDKs für viele gängige Frameworks für die Anwendungsentwicklung verfügbar.
Cognitive Services umfassen Folgendes:
- Textanalyse
- Maschinelles Sehen
- Videoanalyse
- Spracherkennung und -generierung
- Verstehen natürlicher Sprache
- Intelligente Suche
Hauptvorteile:
- Minimaler Entwicklungsaufwand für modernste KI-Dienste
- Einfache Integration in Apps über HTTP-REST-Schnittstellen
- Integrierte Unterstützung der Nutzung von Cognitive Services in Azure Data Lake Analytics
Überlegungen:
Nur über das Web verfügbar. Im Allgemeinen ist eine Internetverbindung erforderlich. Eine Ausnahme ist der Custom Vision Service, dessen trainiertes Modell Sie exportieren können, um Vorhersagen auf Geräten und im IoT-Edgebereich zu treffen.
Eine umfassende Anpassung wird zwar unterstützt, aber die verfügbaren Dienste sind unter Umständen nicht für alle Predictive Analytics-Anforderungen geeignet.
Welche Optionen haben Sie bei der Auswahl der Cognitive Services?
In Azure sind Dutzende von Cognitive Services verfügbar. Die aktuelle Liste ist jeweils in einem Verzeichnis enthalten, das nach dem unterstützten Funktionsbereich kategorisiert ist:
Wichtige Auswahlkriterien
Beantworten Sie die folgenden Fragen, um die Auswahl einzuschränken:
Welche Art von Daten verarbeiten Sie? Grenzen Sie Ihre Optionen basierend auf dem Typ der Eingabedaten ein, die Sie verarbeiten. Wenn es bei Ihrer Eingabe beispielsweise um Text geht, sollten Sie einen Dienst mit dem Eingabetyp „Text“ wählen.
Verfügen Sie über die Daten zum Trainieren eines Modells? Wenn ja, können Sie die Verwendung der benutzerdefinierten Dienste erwägen, die Ihnen das Trainieren der zugrunde liegenden Modelle mit von Ihnen bereitgestellten Daten ermöglichen, um die Genauigkeit und Leistung zu verbessern.
Funktionsmatrix
In den folgenden Tabellen sind die Hauptunterschiede der Funktionen zusammengefasst:
Verwendung von vordefinierten Modellen
Funktion | Eingabetyp | Hauptvorteil |
---|---|---|
Textanalyse-API | Text | Werten Sie Stimmungen und Themen aus, um zu verstehen, was sich Ihre Benutzer wünschen. |
API für Entitätenverknüpfung | Text | Erweitern Sie die Datenlinks Ihrer App um die Erkennung und Unterscheidung benannter Entitäten. |
Language Understanding Intelligent Service (LUIS) | Text | Bringen Sie Ihren Apps bei, Befehle Ihrer Benutzer zu verstehen. |
QnA Maker Service | Text | Verwandeln Sie Informationen im FAQ-Format in einfach zu findende Antworten. |
API für linguistische Analyse | Text | Vereinfachen Sie komplexe Sprachkonzepte, und analysieren Sie Texte. |
Knowledge Exploration Service | Text | Ermöglichen Sie die interaktive Suche in strukturierten Daten per Eingabe in natürlicher Sprache. |
Websprachmodell-API | Text | Nutzen Sie Vorhersagesprachmodelle, die mit Daten aus dem gesamten Web trainiert wurden. |
Academic Knowledge-API | Text | Greifen Sie auf die umfangreichen akademischen Inhalte von Microsoft Academic Graph mit Auffüllung per Bing zu. |
Bing-Vorschlagssuche-API | Text | Erweitern Sie Ihre App um intelligente Optionen für Vorschläge bei Suchvorgängen. |
Bing-Rechtschreibprüfungs-API | Text | Ermitteln und korrigieren Sie Rechtschreibfehler in Ihrer App. |
Textübersetzungs-API | Text | Maschinelle Übersetzung |
Empfehlungs-API | Text | Sagen Sie vorher, für welche Artikel sich Ihre Kunden interessieren, und empfehlen Sie diese. |
Bing-Entitätssuche-API | Text (Websuchabfrage) | Identifizieren und erweitern Sie Entitätsinformationen aus dem Web. |
Bing-Bildersuche-API | Text (Websuchabfrage) | Suchen Sie nach Bildern. |
Bing-News-Suche-API | Text (Websuchabfrage) | Suchen Sie nach News. |
Bing-Videosuche-API | Text (Websuchabfrage) | Suchen Sie nach Videos. |
Bing-Websuche-API | Text (Websuchabfrage) | Erhalten Sie umfassende Suchergebnisse aus Milliarden von Webdokumenten. |
Bing-Spracheingabe-API | Text oder Sprache | Konvertieren Sie Sprache in Text und wieder zurück. |
Sprechererkennungs-API | Spracheingabe | Identifizieren und authentifizieren Sie Sprecher anhand ihrer Stimme. |
Sprachübersetzungs-API | Spracheingabe | Führen Sie Sprachübersetzungen in Echtzeit durch. |
Maschinelles Sehen-API | Bilder (oder Frames aus Videos) | Filtern Sie verwertbare Informationen aus Bildern heraus, nutzen Sie die automatische Erstellung von Fotobeschreibungen, die Ableitung von Tags und die Erkennung von berühmten Personen und die Textextraktion, und erstellen Sie präzise Miniaturansichten. |
Content Moderator | Text, Bilder oder Video | Automatisierte Bild-, Text- und Videomoderation |
Emotionen-API | Bilder (Fotos mit Menschen) | Identifizieren Sie den Emotionsbereich von Menschen. |
Gesichtserkennungs-API | Bilder (Fotos mit Menschen) | Nutzen Sie die Erkennung, Analyse, Organisation und Markierung von Gesichtern auf Fotos. |
Video Indexer | Video | Führen Sie Videoauswertungen in Bezug auf Stimmung, Sprachtranskription, Sprachübersetzung, Gesichter- und Emotionserkennung und Extraktion von Schlüsselwörtern durch. |
Trainiert mit von Ihnen bereitgestellten benutzerdefinierten Daten
Funktion | Eingabetyp | Hauptvorteil |
---|---|---|
Custom Vision Service | Bilder (oder Frames aus Videos) | Passen Sie Ihre eigenen Modelle für maschinelles Sehen an. |
Custom Speech Service | Spracheingabe | Überwinden Sie die Grenzen der Spracherkennung, z.B. Sprachstil, Hintergrundgeräusche und Vokabular. |
Custom Decision Service | Webinhalt (z.B. RSS-Feed) | Verwenden Sie Machine Learning, um automatisch die richtigen Inhalte für Ihre Homepage auswählen zu lassen. |
API für die benutzerdefinierte Bing-Suche | Text (Websuchabfrage) | Kommerziell einsetzbares Suchtool |
Beitragende
Dieser Artikel wird von Microsoft gepflegt. Er wurde ursprünglich von folgenden Mitwirkenden geschrieben:
Hauptautor:
- Zoiner Tejada | CEO und Architekt