Vorgefertigtes Modell zur Bildbeschreibung (Vorschauversion)

Artikel
01/10/2024

[Dieses Thema ist Teil der Dokumentation zur Vorabversion und kann geändert werden.]

Wichtig

Dies ist eine Vorschauversion.
Funktionen in der Vorschauversion sind nicht für den Produktionseinsatz gedacht und können eine eingeschränkte Funktionalität aufweisen. Diese Funktionen stehen vor der offiziellen Veröffentlichung zur Verfügung, damit Kunden frühzeitig Zugriff erhalten und Feedback geben können.

Das vordefiniertes Bildbeschreibungsmodell analysiert ein Bild und erstellt basierend auf seiner Analyse eine benutzerfreundliche Beschreibung. Es ist in einer Vielzahl von Szenarien nützlich:

Automatische Untertitelung: Verwenden Sie maschinelles Lernen, um beschreibenden Text für Bilder zu generieren.
Sicherheit und Überwachung: Leichtes Überwachen oder Identifizieren von Bedrohungen Beschreibungen von Anwesenheit, Personen oder Aktivitäten in einem Videoframe.
Suchmaschinenoptimierung: Beschreiben Sie die Bilder auf einer Webseite, um die Seite in Suchen besser auffindbar zu machen.
Chatbots: Beschreiben Sie ein Bild und den Grund dafür, wodurch die Illusion einer multimodalen Fähigkeit entsteht.
Einzelhandelsumgebung: Beschreibt ein Produkt und hilft so bei der Bestandsverwaltung und Wiederauffüllung.

In Power Apps verwenden

Das vordefinierte Modell zur Bildbeschreibung in Power Apps verwenden (Vorschauversion).

In Power Automate verwenden

Das vordefinierte Modell zur Bildbeschreibung in Power Automate verwenden (Vorschauversion).

Lizenzierungs- und Rollenanforderungen

Dieses Feature befindet sich in der Vorschau. Durch die Nutzung wird kein AI Builder-Guthaben abgezogen.

Sie benötigen die Benutzerrolle Basic, um das vordefinierte Bildbeschreibungsmodell in Ihren Apps und Flows nutzen zu können.

Unterstützte Dateien

Akzeptierte Dokumentformate: JPG, JPEG, PNG und BMP
Maximale Dokumentgröße: 4 MB
Die Abmessungen des Bildes müssen größer als 50 x 50 Pixel sein

Modellausgabe

Wenn ein gültiges Bild erkannt wird, versucht das Modell, die folgenden Eigenschaften zu finden und zu extrahieren:

Beschreibung: Eine Beschreibung des Bildes auf Englisch (en-us)
Tags: Eine Liste der Tags im Bild auf Englisch (en-us)
Konfidenzbewertung: Ein Prozentsatz, der die geschätzte Genauigkeit der Beschreibung angibt