Was ist Sprachübersetzung?

In diesem Artikel erfahren Sie mehr über die Vorteile und Funktionen der Übersetzung mit Azure KI Speech. Der Speech-Dienst unterstützt die Sprache-in-Sprache-Übersetzung in Echtzeit und die Sprach-in-Text-Übersetzung von Audiostreams in mehreren Sprachen.

Mit dem Speech SDK oder der Speech-Befehlszeilenschnittstelle haben Ihre Anwendungen, Tools und Geräte Zugriff auf Quelltranskriptionen und Übersetzungsausgaben für die bereitgestellten Audiodaten. Zwischenergebnisse von Transkription und Übersetzung werden beim Erkennen von Sprache zurückgegeben, und die Endergebnisse können in synthetisierte Sprache konvertiert werden.

Eine Liste der Sprachen, die für die Sprachübersetzung unterstützt werden, finden Sie unter Sprach- und Stimmunterstützung.

Tipp

Gehen Sie zu Speech Studio, um die Übersetzung von Sprache schnell und mit geringer Latenz in andere Sprachen Ihrer Wahl zu testen und durchzuführen.

Wichtige Funktionen

Zu den Kernfunktionen der Sprachübersetzung gehören:

Sprache-in-Text-Übersetzung

Das vom Speech-Dienst angebotene Standardfeature ist die Möglichkeit, einen Eingabeaudiodatenstrom in Ihrer angegebenen Quellsprache aufzunehmen und als Text in der angegebenen Zielsprache zu übersetzen und auszugeben.

Sprache-zu-Sprache-Übersetzung

Als Ergänzung zum obigen Feature bietet der Speech-Dienst auch die Möglichkeit, den übersetzten Text mit unserer großen Datenbank mit vortrainierten Stimmen laut vorlesen zu können, was eine natürliche Ausgabe der Eingabesprache ermöglicht.

Mehrsprachige Sprachübersetzung (Preview)

Die mehrsprachige Sprachübersetzung implementiert eine neue Ebene der Sprachübersetzungstechnologie, die verschiedene Möglichkeiten bietet, wie z. B. keine festgelegte Eingabesprache, die Verarbeitung von Sprachwechseln innerhalb der gleichen Sitzung und die Unterstützung von Live-Streaming-Übersetzungen ins Englische. Diese Features ermöglichen eine neue Ebene von Sprachübersetzungsfunktionen, die in Ihre Produkte implementiert werden können.

  • Keine Angabe der Eingabesprache. Die mehrsprachige Sprachübersetzung kann Audiodaten in einer Vielzahl von Sprachen verarbeiten, und es ist nicht erforderlich, die erwartete Eingabesprache anzugeben.
  • Sprachwechsel. Die mehrsprachige Sprachübersetzung ermöglicht es, dass mehrere Sprachen während derselben Sitzung gesprochen werden können, die alle in dieselbe Zielsprache übersetzt werden. Es ist nicht nötig, eine Sitzung neu zu starten, wenn sich die Eingabesprache ändert oder Sie eine andere Aktion durchführen.
  • Transkription. Der Dienst gibt eine Transkription in der angegebenen Zielsprache aus. Die Transkription der Quellsprache ist noch nicht verfügbar.

Einige Anwendungsfälle für mehrsprachige Sprachübersetzung sind:

  • Reisedolmetscher. Wenn Sie im Ausland unterwegs sind, bietet die mehrsprachige Sprachübersetzung die Möglichkeit, eine Lösung zu schaffen, die es Kundinnen und Kunden erlaubt, jede Audioeingabe in die und aus der Landessprache zu übersetzen. So können sie mit den Einheimischen kommunizieren und ihre Umgebung besser verstehen.
  • Geschäftsbesprechung. In einer Besprechung mit Personen, die unterschiedliche Sprachen sprechen, ermöglicht die mehrsprachige Sprachübersetzung den Teilnehmenden, so natürlich miteinander zu kommunizieren, als ob es keine Sprachbarriere gäbe.

Für die mehrsprachige Sprachübersetzung sind dies die Sprachen, die der Sprachdienst automatisch erkennen und zwischen denen er anhand der Eingabe umschalten kann: Arabisch (ar), Baskisch (eu), Bosnisch (bs), Bulgarisch (bg), Vereinfachtes Chinesisch (zh), Traditionelles Chinesisch (zhh), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Estnisch (et), Finnisch (fi), Französisch (fr), Galizisch (gl), Deutsch (de), Griechisch (el), Hindi (hi), Ungarisch (hu), Indonesisch (id), Italienisch (it), Japanisch (ja), Koreanisch (ko), Lettisch (lv), Litauisch (lt), Mazedonisch (mk), Norwegisch (nb), Polnisch (pl), Portugiesisch (pt), Rumänisch (ro), Russisch (ru), Serbisch (sr), Slowakisch (sk), Slowenisch (sl), Spanisch (es), Schwedisch (sv), Thai (th), Türkisch (tr), Ukrainisch (uk), Vietnamesisch (vi) und Walisisch (cy).

Eine Liste der unterstützten Ausgabesprachen (Zielsprachen) finden Sie in der Tabelle In Textsprache übersetzen in der Dokumentation zur Sprach- und Stimmunterstützung.

Weitere Informationen zur mehrsprachigen Sprachübersetzung finden Sie in der Anleitung zur Sprachübersetzung und in den Sprachübersetzungsbeispielen auf GitHub.

Übersetzen von Sprache in mehrere Zielsprachen

In Szenarien, in denen Sie die Ausgabe in mehreren Sprachen wünschen, bietet Ihnen der Speech-Dienst direkt die Möglichkeit, die Eingabesprache in zwei Zielsprachen zu übersetzen. So können sie zwei Ausgaben erhalten und diese Übersetzungen mit einem einzigen API-Aufruf an ein größeres Publikum weitergeben. Wenn mehr Ausgabesprachen benötigt werden, können Sie eine Ressource mit mehreren Diensten erstellen oder separate Übersetzungsdienste verwenden.

Wenn Sie eine Übersetzung in mehr als zwei Zielsprachen benötigen, müssen Sie entweder eine Ressource mit mehreren Diensten einrichten oder für weitere Sprachen separate Übersetzungsdienste in Anspruch nehmen. Wenn Sie sich dafür entscheiden, den Sprachübersetzungsdienst mit einer Ressource mit mehreren Diensten aufzurufen, beachten Sie bitte, dass für jede weitere Sprache Übersetzungsgebühren anfallen, die sich nach der Zeichenanzahl der Übersetzung richten.

Um die anfallende Übersetzungsgebühr zu berechnen, sehen Sie sich bitte die Preise von Azure KI Übersetzer an.

Preise für die Übersetzung von Sprache in mehrere Zielsprachen

Es ist wichtig zu wissen, dass der Sprachübersetzungsdienst in Echtzeit arbeitet und die Zwischenergebnisse der Sprache übersetzt werden, um Zwischenübersetzungsergebnisse zu erzeugen. Daher ist der tatsächliche Übersetzungsumfang größer als die Token der Eingangsaudiodatei. Sie zahlen für die Transkription von Spracherkennung in Text und die Textübersetzung für jede Zielsprache.

Nehmen wir zum Beispiel an, Sie möchten Textübersetzungen von einer einstündigen Audiodatei in drei Zielsprachen. Wenn die anfängliche Transkription der Spracherkennung 10.000 Zeichen umfasst, werden Ihnen möglicherweise 2,80 USD berechnet.

Warnung

Die Preise in diesem Beispiel dienen nur zur Veranschaulichung. Informationen zu aktuellen Preisen finden Sie unter Azure KI Speech-Preise und Azure KI Übersetzer-Preise.

Der vorherige Beispielpreis von 2,80 USD wurde durch die Kombination der Kosten für die Transkription der Spracherkennung und die Übersetzung des Textes berechnet. So wurde die Berechnung durchgeführt:

  • Der Listenpreis für die Sprachübersetzung beträgt 2,50 USD pro Stunde und deckt bis zu 2 Zielsprachen ab. Der Preis wird als Beispiel für die Berechnung von Kosten verwendet. Informationen zu aktuellen Preisen finden Sie unter Nutzungsbasierte Bezahlung>Sprachübersetzung>Standard in der Azure KI Speech-Preistabelle.
  • Die Kosten für die dritte Sprachübersetzung betragen in diesem Beispiel 30 USCent. Der Listenpreis für die Übersetzung beträgt 10 USD pro Million Zeichen. Da die Audiodatei 10.000 Zeichen enthält, beträgt die Übersetzungskosten 10 USD * 10.000 / 1.000.000 * 3 = 0,3 USD. Die Zahl „3“ in dieser Gleichung steht für einen Gewichtungskoeffizienten für den Zwischendatenverkehr, der je nach den beteiligten Sprachen variieren kann. Der Preis wird als Beispiel für die Berechnung von Kosten verwendet. Informationen zu aktuellen Preisen finden Sie unter Nutzungsbasierte Bezahlung>Standardübersetzung>Textübersetzung in der Azure KI Übersetzer-Preistabelle.

Erste Schritte

Versuchen Sie als ersten Schritt den Schnellstart der Sprachübersetzung. Der Sprachübersetzungsdienst ist über das Speech SDK und die Speech CLI verfügbar.

Beispiele für Spracherkennung (STT) und Sprachübersetzung für das Speech SDK finden Sie auf GitHub. In den Beispielen werden gängige Szenarien wie etwa das Lesen von Audiodaten aus einer Datei oder einem Stream, die fortlaufende und Einzelerkennung und -übersetzung sowie die Arbeit mit benutzerdefinierten Modellen behandelt.

Nächste Schritte