Co to jest interfejs wiersza polecenia usługi Mowa?

Interfejs wiersza polecenia usługi Mowa to narzędzie wiersza polecenia do korzystania z usługi Mowa bez konieczności pisania kodu. Interfejs wiersza polecenia usługi Mowa wymaga minimalnej konfiguracji. Można go łatwo użyć do eksperymentowania z kluczowymi funkcjami usługi Mowa i zobaczyć, jak działa z twoimi przypadkami użycia. W ciągu kilku minut można uruchamiać proste przepływy pracy testowe, takie jak rozpoznawanie mowy wsadowej z katalogu plików lub zamiany tekstu na mowę w kolekcji ciągów z pliku. Poza prostymi przepływami pracy interfejs wiersza polecenia usługi Mowa jest gotowy do produkcji i można go skalować w górę w celu uruchamiania większych procesów przy użyciu skryptów zautomatyzowanych .bat lub powłoki.

Większość funkcji zestawu SDK usługi Mowa jest dostępnych w interfejsie wiersza polecenia usługi Mowa, a niektóre zaawansowane funkcje i dostosowania zostały uproszczone w interfejsie wiersza polecenia usługi Mowa. Podczas podejmowania decyzji, kiedy używać interfejsu wiersza polecenia usługi Mowa lub zestawu SDK usługi Mowa, weź pod uwagę następujące wskazówki.

Interfejsu wiersza polecenia usługi Mowa używaj, gdy:

  • Chcesz eksperymentować z funkcjami usługi Mowa z minimalną konfiguracją i bez konieczności pisania kodu.
  • Masz stosunkowo proste wymagania dotyczące aplikacji produkcyjnej korzystającej z usługi Mowa.

Zestawu SDK usługi Mowa używaj, gdy:

  • Chcesz zintegrować funkcje usługi Mowa w określonym języku lub platformie (na przykład C#, Python lub C++).
  • Masz złożone wymagania, które mogą wymagać zaawansowanych żądań obsługi.
  • Tworzysz niestandardowe zachowanie, w tym przesyłanie strumieniowe odpowiedzi.

Podstawowe funkcje

  • Rozpoznawanie mowy: konwertuj mowę na tekst z plików audio lub bezpośrednio z mikrofonu albo transkrybuj nagraną konwersację.

  • Synteza mowy: konwertuj tekst na mowę przy użyciu danych wejściowych z plików tekstowych lub przez wprowadzanie bezpośrednio z wiersza polecenia. Dostosowywanie cech wyjściowych mowy przy użyciu konfiguracji języka SSML (Speech Synthesis Markup Language).

  • Tłumaczenie mowy: tłumaczenie dźwięku w języku źródłowym na tekst lub dźwięk w języku docelowym.

  • Uruchamianie w zasobach obliczeniowych platformy Azure: wysyłanie poleceń interfejsu wiersza polecenia usługi Mowa do uruchamiania w zdalnym zasobie obliczeniowym platformy Azure przy użyciu polecenia spx webjob.

Rozpocznij

Aby rozpocząć pracę z interfejsem wiersza polecenia usługi Mowa, zobacz przewodnik Szybki start. W tym artykule pokazano, jak uruchomić kilka podstawowych poleceń. Zapewnia również nieco bardziej zaawansowane polecenia do uruchamiania operacji wsadowych mowy na tekst i zamianę tekstu na mowę. Po przeczytaniu artykułu podstawowego należy zrozumieć składnię wystarczającą do rozpoczęcia pisania niektórych poleceń niestandardowych lub zautomatyzowania prostych operacji usługi Mowa.

Następne kroki