Worum handelt es sich bei maschinellem Sehen?

Über den Azure-Dienst für maschinelles Sehen haben Sie Zugriff auf erweiterte Algorithmen, die Bilder verarbeiten und Informationen anhand der für sie interessanten visuellen Features zurückgeben.

Dienst BESCHREIBUNG
Optische Zeichenerkennung (OCR) Der Optische Zeichenerkennungs-Dienst (OCR) extrahiert Text aus Bildern. Sie können die neue Lese-API verwenden, um gedruckten und handschriftlichen Text aus Bildern und Dokumenten zu extrahieren. Hierbei werden auf Deep Learning basierende Modelle verwendet, und es wird Text auf vielen verschiedenen Oberflächen und Hintergründen verarbeitet. Beispiele hierfür sind Geschäftsdokumente, Rechnungen, Belege, Poster, Visitenkarten, Briefe und Whiteboards. Die OCR-APIs unterstützen das Extrahieren von gedrucktem Text in mehreren Sprachen. Befolgen Sie unseren OCR Schnellstart, um zu beginnen.
Bildanalyse Der Abbild Analysedienst extrahiert viele visuelle Features aus Bildern, wie z. b. Objekte, Gesichter, nicht jugendfreie Inhalte und automatisch generierte Textbeschreibungen. Befolgen Sie den Schnellstart für die Bildanalyse, um zu beginnen.
Räumliche Analyse Der Dienst für räumliche Analysen analysiert das vorhanden sein und Verschieben von Personen in einem Videofeed und erzeugt Ereignisse, auf die andere Systeme reagieren können. Installieren Sie den Container für räumliche Analysen, um zu beginnen.

Maschinelles Sehen für Digital Asset Management (DAM)

Das maschinelle Sehen kann viele DAM-Szenarien (Digital Asset Management) unterstützen. DAM ist der Geschäftsprozess der Organisation, Speicherung und Abfrage von Rich-Media-Medienobjekten und der Verwaltung digitaler Rechte und Berechtigungen. Beispielsweise kann ein Unternehmen Bilder basierend auf sichtbaren Logos, Gesichtern, Objekten, Farben usw. gruppieren und identifizieren. Oder Sie können automatisch Beschriftungen für Bilder generieren und Schlüsselwörter anhängen, damit sie durchsuchbar sind. Eine All-in-One-DAM-Lösung mit Cognitive Services, Azure Cognitive Search und intelligenter Berichterstellung finden Sie im Leitfaden Knowledge Mining Solution Accelerator auf GitHub. Weitere DAM-Beispiele finden Sie im Repository zu Lösungsvorlagen für maschinelles Sehen.

Bildanforderungen

Maschinelles Sehen kann Bilder analysieren, die folgende Anforderungen erfüllen:

  • Das Bild muss im JPEG-, PNG-, GIF- oder BMP-Format vorliegen.
  • Die Dateigröße muss weniger als 4 MB betragen.
  • Das Bild muss größer als 50 x 50 Pixel sein.
    • Für die Lese-API muss die Größe des Bilds zwischen 50 x 50 und 10.000 x 10.000 Pixel liegen.

Datenschutz und Sicherheit

Wie bei allen Cognitive Services-Diensten müssen Entwickler, die den Maschinelles Sehen-Dienst nutzen, die Microsoft-Richtlinien zu Kundendaten beachten. Weitere Informationen finden Sie im Microsoft Trust Center auf der Seite zu Cognitive Services.

Nächste Schritte

Befolgen Sie einen Schnellstart, um einen Dienst in Ihrer bevorzugten Entwicklungssprache zu implementieren und auszuführen.