Worum handelt es sich bei der Speech-Befehlszeilenschnittstelle?

Artikel
01/22/2024

Die Speech-Befehlszeilenschnittstelle ist ein Befehlszeilentool, mit dem der Speech-Dienst verwendet werden kann, ohne Code zu schreiben. Die Speech CLI erfordert eine minimale Einrichtung. Sie können sie einfach verwenden, um mit wichtigen Features des Speech-Diensts zu experimentieren und zu sehen, wie er für Ihre Anwendungsfälle funktioniert. Innerhalb weniger Minuten können Sie einfache Testworkflows durchführen, wie etwa eine Batch-Spracherkennung aus einem Verzeichnis von Dateien oder eine Sprachsynthese für eine Sammlung von Zeichenfolgen aus einer Datei. Die Speech-Befehlszeilenschnittstelle kann jedoch nicht nur für einfache Workflows genutzt werden. Sie ist produktionsbereit und hochskalierbar, um umfangreichere Prozesse mit automatisierten Batches (.bat) oder Shellskripts auszuführen.

Über die Speech-Befehlszeilenschnittstelle stehen die meisten Features des Speech SDK zur Verfügung, und einige erweiterte Features und Anpassungen sind in der Speech-Befehlszeilenschnittstelle vereinfacht. Bei Ihrer Entscheidung für die Verwendung der Speech CLI oder des Speech SDK können Sie sich an der folgenden Anleitung orientieren.

Verwenden Sie in folgenden Fällen die Speech-Befehlszeilenschnittstelle:

Sie möchten mit minimalem Einrichtungs- und ohne Programmieraufwand mit Features des Speech-Diensts experimentieren.
Sie haben relativ einfache Anforderungen an eine Produktionsanwendung, für die der Speech-Dienst genutzt wird.

Verwenden Sie in folgenden Fällen das Speech SDK:

Sie möchten Funktionen des Speech-Diensts im Rahmen einer bestimmten Sprache oder Plattform (z. B. C#, Python oder C++) integrieren.
Sie haben komplexe Anforderungen, die möglicherweise erweiterte Dienstanforderungen erfordern.
Sie entwickeln benutzerdefiniertes Verhalten, einschließlich Antwortstreaming.

Wichtige Funktionen

Spracherkennung: Konvertieren Sie Sprache aus Audiodateien oder direkt über ein Mikrofon in Text, oder erstellen Sie ein Transkript einer aufgezeichneten Unterhaltung.
Sprachsynthese: Konvertieren Sie Text in Sprache, und verwenden Sie als Eingabe entweder Textdateien oder direkte Befehlszeileneingaben. Passen Sie die Merkmale der Sprachausgabe mit SSML-Konfigurationen (Speech Synthesis Markup Language, Markupsprache für Sprachsynthese) an.
Sprachübersetzung: Übersetzen Sie Audio aus einer Ausgangssprache in Text oder Audio in einer Zielsprache.
Ausführung in Azure-Computeressourcen: Senden Sie Speech CLI-Befehle für die Ausführung in einer Azure-Remotecomputeressource unter Verwendung von spx webjob.

Erste Schritte

Informationen zu den ersten Schritten mit der Speech-Befehlszeilenschnittstelle finden Sie in der Schnellstartanleitung. In diesem Artikel erfahren Sie, wie Sie einige grundlegende Befehle ausführen. Außerdem sind etwas komplexere Befehle zum Ausführen von Batchvorgängen für Spracherkennung und Sprachsynthese enthalten. Nachdem Sie den Artikel zu den Grundlagen gelesen haben, sollten Sie genug von der Syntax verstehen, um mit dem Schreiben einiger benutzerdefinierter Befehle zu beginnen oder einfache Vorgänge des Speech-Diensts zu automatisieren.

Worum handelt es sich bei der Speech-Befehlszeilenschnittstelle?

Wichtige Funktionen

Erste Schritte

Nächste Schritte

Zusätzliche Ressourcen