Share via


AudioTranscriptionOptions Klasse

Definition

Die Konfigurationsinformationen für eine Audiotranskriptionsanforderung.

public class AudioTranscriptionOptions
type AudioTranscriptionOptions = class
Public Class AudioTranscriptionOptions
Vererbung
AudioTranscriptionOptions

Konstruktoren

AudioTranscriptionOptions()

Initialisiert eine neue instance von AudioTranscriptionOptions.

AudioTranscriptionOptions(BinaryData)

Initialisiert eine neue instance von AudioTranscriptionOptions.

Eigenschaften

AudioData

Die zu transkribierenden Audiodaten. Dies muss der binäre Inhalt einer Datei in einem der unterstützten Medienformate sein: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.

Um dieser Eigenschaft ein Byte[] zuzuweisen, verwenden Sie FromBytes(Byte[]). Das Byte[] wird in eine Base64-codierte Zeichenfolge serialisiert.

Beispiele:

  • BinaryData.FromBytes(new byte[] { 1, 2, 3 })Erstellt eine Nutzlast von "AQID".
Language

Die primäre gesprochene Sprache der zu transkribierenden Audiodaten, die als Zwei-Buchstaben-ISO-639-1-Sprachcode wie "en" oder "fr" bereitgestellt wird. Die Bereitstellung dieser bekannten Eingabesprache ist optional, kann jedoch die Genauigkeit und/oder Latenz der Transkription verbessern.

Prompt

Ein optionaler Hinweis, um den Stil des Modells zu leiten oder aus einem vorherigen Audiosegment fortzufahren. Die geschriebene Sprache der Eingabeaufforderung sollte mit der primären gesprochenen Sprache der Audiodaten übereinstimmen.

ResponseFormat

Das angeforderte Format der Transkriptionsantwortdaten, die den Inhalt und die Details des Ergebnisses beeinflussen.

Temperature

Die Temperatur für die Stichprobenentnahme, zwischen 0 und 1. Durch höhere Werte wie 0,8 wird die Ausgabe zufälliger, während sie durch niedrigere Werte wie 0,2 fokussierter und deterministischer wird. Wenn auf 0 festgelegt ist, verwendet das Modell die Protokollwahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht werden.

Gilt für: