Share via


AudioTranscriptionSegment Klasse

Definition

Erweiterte Informationen zu einem einzelnen Segment transkribierter Audiodaten. Segmente stellen in der Regel etwa 5-10 Sekunden Spracheingabe dar. Segmentgrenzen treten in der Regel zwischen Wörtern auf, aber nicht unbedingt zwischen Sätzen.

public class AudioTranscriptionSegment
type AudioTranscriptionSegment = class
Public Class AudioTranscriptionSegment
Vererbung
AudioTranscriptionSegment

Eigenschaften

AverageLogProbability

Die durchschnittliche Protokollwahrscheinlichkeit, die diesem Audiosegment zugeordnet ist.

CompressionRatio

Das Komprimierungsverhältnis dieses Audiosegments.

End

Der Zeitpunkt, zu dem dieses Segment beendet wurde, relativ zum Anfang des transkribierten Audios.

Id

Der 0-basierte Index dieses Segments innerhalb einer Transkription.

NoSpeechProbability

Die Wahrscheinlichkeit, dass innerhalb dieses Audiosegments keine Spracherkennung vorhanden ist.

Seek

Die Suchposition, die der Verarbeitung dieses Audiosegments zugeordnet ist. Suchpositionen werden als Hundertstel sekunden ausgedrückt. Das Modell kann mehrere Segmente aus einer einzelnen Suchposition verarbeiten, sodass die Suchposition niemals einen späteren Zeitpunkt als den Anfang des Segments darstellt, der Anfang des Segments einen erheblich späteren Zeitpunkt als die zugeordnete Suchposition des Segments darstellt.

Start

Der Zeitpunkt, zu dem dieses Segment gestartet wurde, relativ zum Anfang des transkribierten Audios.

Temperature

Die Diesem Audiosegment zugeordnete Temperaturbewertung.

Text

Der transkribierte Text, der Teil dieses Audiosegments war.

Tokens

Die Token-IDs, die dem transkribierten Text in diesem Audiosegment entsprechen.

Gilt für: