Was ist Azure KI Vision?

Artikel
04/30/2024

Hinweis

Ab Juli 2023 umfasst Azure KI Services alle bisher als Cognitive Services und Azure Applied AI Services bezeichneten Dienste. Es gibt keine Änderungen an den Preisen. Die Namen Cognitive Services und Azure Applied AI werden in Abrechnungs-, Kostenanalyse-, Preislisten- und Preis-APIs von Azure weiterhin verwendet. Es gibt keine Breaking Changes an APIs oder SDKs.

Der Azure KI Vision-Dienst bietet Ihnen Zugriff auf erweiterte Algorithmen, die Bilder verarbeiten und Informationen anhand der für sie interessanten visuellen Features zurückgeben.

Dienst	BESCHREIBUNG
Optische Zeichenerkennung (OCR)	Der Optische Zeichenerkennungs-Dienst (OCR) extrahiert Text aus Bildern. Sie können die neue Lese-API verwenden, um gedruckten und handschriftlichen Text aus Bildern und Dokumenten zu extrahieren. Hierbei werden auf Deep Learning basierende Modelle verwendet, und es wird Text auf vielen verschiedenen Oberflächen und Hintergründen verarbeitet. Beispiele hierfür sind Geschäftsdokumente, Rechnungen, Belege, Poster, Visitenkarten, Briefe und Whiteboards. Die OCR-APIs unterstützen das Extrahieren von gedrucktem Text in mehreren Sprachen. Befolgen Sie unseren OCR Schnellstart, um zu beginnen.
Bildanalyse	Der Abbild Analysedienst extrahiert viele visuelle Features aus Bildern, wie z. b. Objekte, Gesichter, nicht jugendfreie Inhalte und automatisch generierte Textbeschreibungen. Befolgen Sie den Schnellstart für die Bildanalyse, um zu beginnen.
Gesichtserkennung	Der Gesichtserkennungsdienst verfügt über KI-Algorithmen zum Ermitteln, Erkennen und Analysieren menschlicher Gesichter in Bildern. Gesichtserkennungssoftware ist in vielen verschiedenen Szenarien wichtig, z. B. Identifikation, berührungslose Zugangskontrolle und Gesichtsunschärfe aus Datenschutzgründen. Im Schnellstart zur Gesichtserkennung erfahren Sie mehr zu den ersten Schritten.
Videoanalyse	Die Videoanalyse umfasst videobezogene Features wie räumliche Analyse und Videoabruf. Dier räumliche Analyse analysiert das vorhanden sein und Verschieben von Personen in einem Videofeed und erzeugt Ereignisse, auf die andere Systeme reagieren können. Installieren Sie den Container für räumliche Analysen, um zu beginnen. Mit dem Videoabruf können Sie einen Index von Videos erstellen, die Sie mit natürlicher Sprache durchsuchen können.

Azure KI Vision für Digital Asset Management (DAM)

Azure KI Vision kann viele DAM-Szenarien (Digital Asset Management) unterstützen. DAM ist der Geschäftsprozess der Organisation, Speicherung und Abfrage von Rich-Media-Medienobjekten und der Verwaltung digitaler Rechte und Berechtigungen. Beispielsweise kann ein Unternehmen Bilder basierend auf sichtbaren Logos, Gesichtern, Objekten, Farben usw. gruppieren und identifizieren. Oder Sie können automatisch Beschriftungen für Bilder generieren und Schlüsselwörter anhängen, damit sie durchsuchbar sind. Eine All-in-One-DAM-Lösung mit Azure KI Services, Azure KI Search und intelligenter Berichterstellung finden Sie im Leitfaden Beschleuniger für Wissensmanagement-Lösungen auf GitHub. Weitere DAM-Beispiele finden Sie im Repository zu Lösungsvorlagen für Azure KI Vision.

Erste Schritte

Verwenden Sie Vision Studio, um Azure KI Vision-Features schnell in Ihrem Webbrowser auszuprobieren.

Um mit der Integration von Azure KI Vision-Features in Ihrer App zu beginnen, befolgen Sie die entsprechende Schnellstartanleitung.

Bildanforderungen

Azure KI Vision kann Bilder analysieren, die folgende Anforderungen erfüllen:

Das Bild muss im JPEG-, PNG-, GIF- oder BMP-Format vorliegen.
Die Dateigröße muss weniger als 4 MB betragen.
Das Bild muss größer als 50 x 50 Pixel sein.
- Für die Lese-API muss die Größe des Bilds zwischen 50 x 50 und 10.000 x 10.000 Pixel liegen.

Datenschutz und Sicherheit

Wie bei allen Azure KI Services müssen Entwickler, die den Azure KI Vision-Dienst nutzen, die Microsoft-Richtlinien zu Kundendaten beachten. Weitere Informationen finden Sie im Microsoft Trust Center auf der Seite zu Azure KI Services.

Nächste Schritte

Befolgen Sie einen Schnellstart, um einen Dienst in Ihrer bevorzugten Entwicklungssprache zu implementieren und auszuführen.