Inhaltsbezogene Codierung

Artikel
06/30/2023

Warnung

Azure Media Services wird am 30. Juni 2024 eingestellt. Weitere Informationen finden Sie im Leitfaden zur Einstellung von AMS.

Tipp

Möchten Sie Miniaturansichten generieren, zwei Videos zusammenfügen, Subclips für ein Video erstellen, das Video drehen oder andere Aktionen ausführen? Sie finden Media Services-Beispielcode auf der Seite Beispiele.

Übersicht zur Voreinstellung für die inhaltsbezogene Codierung

Um Inhalte für die Übermittlung mithilfe von Adaptive Bitrate Streaming vorzubereiten, muss Video mit mehreren Bitraten (hoch bis niedrig) und in mehreren Auflösungen codiert werden. Diese Technik ermöglicht es den heutigen modernen Videoplayern unter Apple iOS, Android, Windows und Mac, Streamingprotokolle zu verwenden, die Inhalte ohne Pufferung reibungslos streamen. Diese in Anzeigegröße (Auflösung) und Qualität (Bitrate) verschiedenen Darstellungen ermöglichen es dem Player, die beste Version des Videos auszuwählen, die bei den aktuellen Netzwerkbedingungen unterstützt werden kann. Das Netzwerk kann zwischen LTE, 4G, 5G, öffentlichem WLAN oder Heimnetzwerk große Unterschiede aufweisen.

Der Prozess der Codierung von Inhalten in mehrere Darstellungen erfordert die Generierung einer „Codierungsleiter“. Dies ist eine Tabelle mit Auflösungen und Bitraten, die den Encoder anweist, was generiert werden soll. Ein Beispiel für eine solche Leiter finden Sie in den integrierten Codierungsvoreinstellungen von Media Services.

Unter idealen Bedingungen sollten Sie die Art des Inhalts kennen, den Sie codieren. Mithilfe dieser Informationen können Sie die Codierungsleiter so optimieren, dass sie zur Komplexität und dem Maß an Bewegung in Ihrem Quellvideo passt. Dies bedeutet, dass für jede Anzeigegröße (Auflösung) in der Leiter eine Bitrate enthalten sein sollte, ab der ein Qualitätsanstieg nicht mehr wahrnehmbar ist – der Encoder arbeitet mit diesem optimalen Wert für die Bitrate.

Die nächste Stufe der erreichbaren Optimierung besteht in der Auswahl der Auflösungen auf der Grundlage des Inhalts. Beispielsweise würde ein Video einer PowerPoint-Präsentation mit kleinem Text unscharf aussehen, wenn es unterhalb von 720 Pixellinien in der Höhe codiert wird. Außerdem können sich Bewegung und Komplexität Ihres Videos im zeitlichen Verlauf ändern, je nachdem, wie es aufgenommen und bearbeitet wurde. Dies gibt Ihnen die Möglichkeit, die Codierungseinstellungen für jede Szene oder an jeder Einstellungsgrenze zu optimieren und anzupassen. Ein intelligenter Encoder kann damit beauftragt werden, die Codierungseinstellungen für jede Einstellung innerhalb eines Videos zu optimieren.

Azure Media Services enthält eine Voreinstellung Adaptive Streaming, die eine teilweise Lösung für das Problem der wechselnden Bitrate und Auflösung der Quellvideos darstellt. Diese Voreinstellung analysiert jedoch nicht die Quellinhalte, um zu sehen, wie komplex sie sind oder wie viel Bewegung sie enthalten.

Die Voreinstellung für inhaltsbezogene Codierung stellt gegenüber der eher statischen Codierungsvoreinstellung „Adaptive Bitrate Streaming“ einen Fortschritt dar. Hierzu wird Logik integriert, die es dem Encoder ermöglicht, den optimalen Bitratenwert für eine bestimmte Auflösung zu bestimmen, ohne aufwendige Berechnungsanalyse zu erfordern. Diese Voreinstellung gibt ausgehend von der Quelldatei eine einmalige „Leiter“ von MP4-Dateien mit Orientierung an den GOPs aus. Bei einem Quellvideo führt die Voreinstellung eine erste schnelle Analyse der Eingabeinhalte durch und verwendet die Ergebnisse, um die optimale Anzahl von Stufen, Bitraten und Auflösungen zu bestimmen, die erforderlich sind, um das Streaming mit adaptiver Bitrate mit der höchsten Qualität zu ermöglichen. Diese Voreinstellung eignet sich insbesondere für Videos mit geringer bis mittlerer Komplexität, bei denen die Ausgabedateien zwar eine niedrigere Bitrate als bei der weniger flexiblen Adaptive Streaming-Voreinstellung aufweisen, Zuschauern aber immer noch den Eindruck guter Qualität vermitteln. Der Ausgabeordner enthält mehrere MP4-Dateien mit Video und Audio, die für das Streaming bereit sind.

Konfigurieren von Ausgabeeinstellungen

Darüber hinaus können Entwickler auch die Bandbreite der Ausgaben steuern, die von der inhaltsbezogenen Codierungsvoreinstellung verwendet werden, wenn sie in der Streamingleiter mit adaptiver Bitrate die optimalen Einstellungen für die Codierung festlegen.

Mithilfe der PresetConfigurations-Klasse können Entwickler eine Reihe von Einschränkungen und Optionen an die inhaltsbezogene Codierungsvoreinstellung übergeben, um die vom Encoder generierten resultierenden Dateien zu steuern. Die Eigenschaften sind besonders nützlich in Situationen, in denen Sie die gesamte Codierung auf eine bestimmte maximale Auflösung beschränken möchten, um den vermittelten Eindruck oder die Kosten Ihrer Codierungsaufträge zu steuern. Es ist außerdem nützlich, die maximale und minimale Bitrate steuern zu können, die Ihre Zielgruppe in einem Mobilfunknetz oder in einer globalen Region mit eingeschränkter Bandbreite unterstützen kann.

Unterstützte Codecs

Die inhaltsbezogene Codierungsvoreinstellung steht für die Verwendung mit den folgenden Codecs zur Verfügung:

H.264
HEVC (H.265)

Technische Details zur inhaltsbezogenen Voreinstellung

Sehen wir uns nun etwas mehr im Detail an, wie die inhaltsbezogene Codierungsvoreinstellung funktioniert. Die folgenden Beispieldiagramme enthalten eine Gegenüberstellung mit Qualitätsmetriken wie PSNR und VMAF. Die Quelle wurde durch das Verketten kurzer Clips mit hochkomplexen Einstellungen aus Filmen und Fernsehsendungen erstellt, die den Encoder auf eine harte Probe stellen sollten. Per Definition liefert diese Voreinstellung Ergebnisse, die je nach Inhalt variieren. Das bedeutet auch, dass es bei einigen Inhalten möglicherweise keine signifikante Reduzierung der Bitrate oder Verbesserung der Qualität gibt.

Rate-Distortion-Kurve (RD) unter Verwendung von PSNR

Abbildung 1: Rate-Distortion-Kurve (RD) unter Verwendung der Metrik PSNR für Quelle mit hoher Komplexität

Rate-Distortion-Kurve (RD) unter Verwendung von VMAF

Abbildung 2: Rate-Distortion-Kurve (RD) unter Verwendung der Metrik VMAF für Quelle mit hoher Komplexität

Im Anschluss finden Sie die Ergebnisse für eine weitere Kategorie von Quellinhalten, bei denen der Encoder feststellen konnte, dass die Eingabe von schlechter Qualität war (viele Kompressionsartefakte aufgrund der niedrigen Bitrate). Mit der inhaltsbezogenen Voreinstellung hat sich der Encoder dazu entschieden, nur eine einzelne Ausgabestufe zu erzeugen – mit einer ausreichend niedrigen Bitrate, sodass die meisten Clients den Stream ohne Verzögerung wiedergeben können.

RD-Kurve mit PSNR

Abbildung 3: RD-Kurve mit PSNR für Eingabe mit niedriger Qualität (bei 1080p)

RD-Kurve mit VMAF

Abbildung 4: RD-Kurve mit VMAF für Eingabe mit niedriger Qualität (bei 1080p)

Codierungsbeispiele

Sehen Sie sich die umfangreiche Liste der Codierungsbeispiele an.

Anfordern von Hilfe und Support

Sie können Media Services mit Fragen kontaktieren oder unsere Updates mit einer der folgenden Methoden verfolgen:

Q & A
Stack Overflow. Markieren Sie Fragen mit azure-media-services.
@MSFTAzureMedia oder verwenden Sie @AzureSupport , um Support anzufordern.
Öffnen Sie ein Supportticket über die Azure-Portal.