Limity przydziału i limity usługi mowa

Ten artykuł zawiera krótkie informacje i szczegółowy opis przydziałów i limitów dla usługi Mowa w usługach azure AI. Informacje dotyczą wszystkich warstw cenowych usługi. Zawiera również pewne najlepsze rozwiązania, aby uniknąć ograniczania żądań.

Aby uzyskać bezpłatną (F0) warstwę cenową, zobacz również miesięczne dodatki na stronie cennika.

Dokumentacja limitów przydziałów i limitów

Poniższe sekcje zawierają szybki przewodnik po limitach przydziałów i limitach, które mają zastosowanie do usługi Mowa.

Aby uzyskać informacje na temat regulowanych limitów przydziału dla zasobów usługi Mowa w warstwie Standardowa (S0), zobacz więcej wyjaśnień, najlepszych rozwiązań i instrukcji dostosowywania. Limity przydziału i limity dla zasobów bezpłatnej mowy (F0) nie są regulowane.

Ważne

Zmiana zasobu usługi Mowa z warstwy cenowej Bezpłatna (F0) na warstwę cenową Standardowa (S0) może potrwać do kilku godzin.

Przydziały i limity zamiany mowy na tekst na zasób

W tej sekcji opisano przydziały i limity mowy na tekst na zasób usługi Mowa. O ile nie określono inaczej, limity nie są regulowane.

Zamiana mowy w czasie rzeczywistym na tekst i tłumaczenie mowy

Zamiana mowy w czasie rzeczywistym na tekst przy użyciu zestawu Speech SDK lub interfejsu API REST zamiany mowy na tekst w celu uzyskania krótkiego dźwięku.

Ważne

Te limity mają zastosowanie do współbieżnej mowy w czasie rzeczywistym do żądań tekstowych i żądań tłumaczenia mowy połączonych. Jeśli na przykład masz 60 współbieżnych żądań zamiany mowy na tekst i 40 współbieżnych żądań tłumaczenia mowy, osiągniesz limit 100 współbieżnych żądań.

Norma sprzedaży Bezpłatna (F0) Standardowa (S0)
Limit żądań współbieżnych — podstawowy punkt końcowy modelu 1

Ten limit nie jest regulowany.
100 (wartość domyślna)

Szybkość jest regulowana dla zasobów standardowych (S0). Zobacz więcej wyjaśnień, najlepszych rozwiązań i instrukcji dostosowywania.
Limit żądań współbieżnych — niestandardowy punkt końcowy 1

Ten limit nie jest regulowany.
100 (wartość domyślna)

Szybkość jest regulowana dla zasobów standardowych (S0). Zobacz więcej wyjaśnień, najlepszych rozwiązań i instrukcji dostosowywania.
Maksymalna długość dźwięku w przypadku diaryzacji w czasie rzeczywistym. Nie dotyczy 240 minut na plik

Transkrypcja wsadowa

Norma sprzedaży Bezpłatna (F0) Standardowa (S0)
Limit interfejsu API REST zamiany mowy na tekst Niedostępne dla F0 100 żądań na 10 sekund (600 żądań na minutę)
Maksymalny rozmiar pliku wejściowego audio Nie dotyczy 1 GB
Maksymalna liczba obiektów blob na kontener Nie dotyczy 10 000
Maksymalna liczba plików na żądanie transkrypcji (jeśli używasz wielu adresów URL zawartości jako danych wejściowych). Nie dotyczy 1000
Maksymalna długość dźwięku dla transkrypcji z włączoną diaryzacji. Nie dotyczy 240 minut na plik

Dostosowywanie modelu

Limity w tej tabeli dotyczą zasobu usługi Mowa podczas tworzenia niestandardowego modelu mowy.

Norma sprzedaży Bezpłatna (F0) Standardowa (S0)
Limit interfejsu API REST 100 żądań na 10 sekund (600 żądań na minutę) 100 żądań na 10 sekund (600 żądań na minutę)
Maksymalna liczba zestawów danych mowy 2 500
Maksymalny rozmiar pliku zestawu danych akustycznych na potrzeby importowania danych 2 GB 2 GB
Maksymalny rozmiar pliku zestawu danych języka na potrzeby importowania danych 200 MB 1.5 GB
Maksymalny rozmiar pliku zestawu danych wymowy na potrzeby importowania danych 1 KB 1 MB
Maksymalny rozmiar tekstu podczas używania parametru w żądaniu interfejsu textAPI Models_Create 200 KB 500 KB

Przydziały i limity zamiany tekstu na mowę na zasób

W tej sekcji opisano limity przydziału mowy i limity mowy na zasób usługi Mowa.

Zamiana tekstu w czasie rzeczywistym na mowę

Zamiana tekstu w czasie rzeczywistym na mowę za pomocą zestawu Speech SDK lub interfejsu API REST zamiany tekstu na mowę. O ile nie określono inaczej, limity nie są regulowane.

Norma sprzedaży Bezpłatna (F0) Standardowa (S0)
Maksymalna liczba transakcji w danym okresie dla wstępnie utworzonych głosów neuronowych i niestandardowych głosów neuronowych. 20 transakcji na 60 sekund

Ten limit nie jest regulowany.
200 transakcji na sekundę (TPS) (wartość domyślna)

Szybkość jest regulowana do 1000 TPS dla zasobów standardowych (S0). Zobacz więcej wyjaśnień, najlepszych rozwiązań i instrukcji dostosowywania.
Maksymalna długość dźwięku wygenerowana na żądanie 10 minut 10 minut
Maksymalna łączna liczba unikatowych <voice> tagów i <audio> w języku SSML 50 50
Maksymalny rozmiar komunikatu SSML na kolei dla protokołu websocket 64 KB 64 KB

Synteza wsadowa

Te limity nie są regulowane. Aby uzyskać więcej informacji na temat opóźnienia syntezy wsadowej, zobacz opóźnienie syntezy wsadowej i najlepsze rozwiązania.

Norma sprzedaży Bezpłatna (F0) Standardowa (S0)
Limit interfejsu API REST Niedostępne dla F0 100 żądań na 10 sekund
Maksymalny rozmiar ładunku JSON w celu utworzenia zadania syntezy Nie dotyczy 2 megabajty
Współbieżne aktywne zadania syntezy Nie dotyczy Brak ograniczeń
Maksymalna liczba danych wejściowych tekstu na zadanie syntezy Nie dotyczy 10 000
Maksymalny czas wygaśnięcia zadania syntezy, ponieważ jest w stanie końcowym Nie dotyczy Do 31 dni (określone przy użyciu właściwości)

Niestandardowy neuronowy głos — profesjonalny

Limity w tej tabeli dotyczą zasobu usługi Mowa podczas tworzenia profesjonalnego niestandardowego modelu neuronowego głosu.

Norma sprzedaży Bezpłatna (F0) Standardowa (S0)
Maksymalna liczba transakcji na sekundę (TPS) Niedostępne dla F0 200 transakcji na sekundę (TPS) (wartość domyślna)
Maksymalna liczba zestawów danych Nie dotyczy 500
Maksymalna liczba równoczesnych przekazywania zestawów danych Nie dotyczy 5
Maksymalny rozmiar pliku danych na potrzeby importowania danych na zestaw danych Nie dotyczy 2 GB
Przekazywanie długiego dźwięku lub dźwięku bez skryptu Nie dotyczy Tak
Maksymalna liczba równoczesnych trenowań modeli Nie dotyczy 100
Maksymalna liczba niestandardowych punktów końcowych Nie dotyczy 50

Niestandardowy neuronowy głos — osobisty głos

Limity w tej tabeli dotyczą zasobu usługi Mowa podczas tworzenia osobistego głosu.

Norma sprzedaży Bezpłatna (F0) Standardowa (S0)
Limit interfejsu API REST (bez syntezy mowy) Niedostępne dla F0 50 żądań na 10 sekund
Maksymalna liczba transakcji na sekundę (TPS) na potrzeby syntezy mowy Niedostępne dla F0 200 transakcji na sekundę (TPS) (wartość domyślna)

Tekst w czasie rzeczywistym na awatar mowy

Norma sprzedaży Bezpłatna (F0) Standardowa (S0)
Nowe połączenia na minutę Niedostępne dla F0 Dwa nowe połączenia na minutę

Narzędzie do tworzenia zawartości audio

Norma sprzedaży Bezpłatna (F0) Standardowa (S0)
Rozmiar pliku (zwykły tekst w języku SSML)1 3000 znaków na plik 20 000 znaków na plik
Rozmiar pliku (plik leksykonu)2 30 KB na plik 100 KB na plik
Rozliczane znaki w języku SSML 15 000 znaków na plik 100 000 znaków na plik
Eksportowanie do biblioteki audio 1 współbieżne zadanie Nie dotyczy

1 Limit dotyczy tylko zwykłego tekstu w języku SSML i nie obejmuje tagów.

2 Znaki pliku leksykonu nie są naliczane. Tylko elementy leksykonu w języku SSML są liczone jako znaki rozliczane. Aby dowiedzieć się więcej, zapoznaj się z rozliczanymi znakami .

Limity przydziału i limity rozpoznawania osoby mówiącej na zasób

Rozpoznawanie osoby mówiącej jest ograniczone do 20 transakcji na sekundę (TPS).

Szczegółowy opis, korekta limitu przydziału i najlepsze rozwiązania

Niektóre limity przydziału usługi mowa są regulowane. Ta sekcja zawiera więcej wyjaśnień, najlepszych rozwiązań i instrukcji dostosowywania.

Następujące limity przydziału są regulowane dla zasobów standardowych (S0). Limity żądań bezpłatnych (F0) nie są regulowane.

  • Limit żądań współbieżnych zamiany mowy na tekst dla podstawowego punktu końcowego modelu i niestandardowego punktu końcowego
  • Maksymalna liczba transakcji na mowę w okresie wstępnie utworzonych neuronowych głosów i niestandardowych głosów neuronowych
  • Limit żądań współbieżnych tłumaczenia mowy

Przed zażądaniem zwiększenia limitu przydziału (jeśli ma to zastosowanie), upewnij się, że jest to konieczne. Usługa mowa używa technologii skalowania automatycznego, aby zapewnić wymagane zasoby obliczeniowe w trybie na żądanie. Jednocześnie usługa mowa próbuje utrzymać niskie koszty, nie utrzymując nadmiernej pojemności sprzętowej.

Spójrzmy na przykład. Załóżmy, że aplikacja otrzymuje kod odpowiedzi 429, co oznacza, że istnieje zbyt wiele żądań. Aplikacja otrzymuje tę odpowiedź, mimo że obciążenie mieści się w granicach zdefiniowanych przez odwołanie Limity przydziału i limity. Najbardziej prawdopodobnym wyjaśnieniem jest to, że usługa rozpoznawania mowy skaluje się w górę do zapotrzebowania i nie osiągnęła jeszcze wymaganej skali. W związku z tym usługa nie ma natychmiast wystarczającej ilości zasobów, aby obsłużyć żądanie. W większości przypadków ten stan ograniczania jest przejściowy.

Ogólne najlepsze rozwiązania dotyczące ograniczania przepustowości podczas skalowania automatycznego

Aby zminimalizować problemy związane z ograniczaniem przepustowości, warto użyć następujących technik:

  • Zaimplementuj logikę ponawiania prób w aplikacji.
  • Unikaj gwałtownych zmian w obciążeniu. Stopniowo zwiększaj obciążenie. Załóżmy na przykład, że aplikacja używa tekstu do mowy, a bieżące obciążenie to 5 TPS. Następna sekunda zwiększa obciążenie do 20 TPS (czyli cztery razy więcej). Usługa rozpoznawania mowy natychmiast rozpoczyna skalowanie w górę w celu spełnienia nowego obciążenia, ale nie może skalować w razie potrzeby w ciągu jednej sekundy. Niektóre żądania otrzymują kod odpowiedzi 429 (zbyt wiele żądań).
  • Testuj różne wzorce zwiększania obciążenia. Aby uzyskać więcej informacji, zobacz przykładowy wzorzec obciążenia.
  • Utwórz więcej zasobów usługi Mowa w różnych regionach i rozłóż obciążenie między nimi. (Utworzenie wielu zasobów usługi Mowa w tym samym regionie nie wpłynie na wydajność, ponieważ wszystkie zasoby są obsługiwane przez ten sam klaster zaplecza).

W następnych sekcjach opisano konkretne przypadki dostosowywania limitów przydziału.

Zamiana mowy na tekst: zwiększanie limitu żądań współbieżnych mowy w czasie rzeczywistym na tekst

Domyślnie łączna liczba współbieżnych żądań zamiany mowy w czasie rzeczywistym na tekst i tłumaczenia mowy jest ograniczona do 100 na zasób w modelu podstawowym i 100 na niestandardowy punkt końcowy w modelu niestandardowym. W przypadku warstwy cenowej Standardowa można zwiększyć tę kwotę. Przed przesłaniem żądania upewnij się, że znasz materiał omówiony wcześniej w tym artykule, na przykład najlepsze rozwiązania w celu ograniczenia ograniczania przepustowości.

Uwaga

Współbieżne limity żądań dla modeli podstawowych i niestandardowych muszą być dostosowywane oddzielnie. Zasób usługi Mowa może być skojarzony z wieloma niestandardowymi punktami końcowymi obsługującymi wiele wdrożeń modelu niestandardowego. W razie potrzeby należy zażądać oddzielnie korekt limitu dla niestandardowego punktu końcowego.

Zwiększenie limitu żądań współbieżnych nie ma bezpośredniego wpływu na koszty. Usługa mowa używa modelu płatności, który wymaga płacenia tylko za to, czego używasz. Limit określa, jak wysoka usługa może być skalowana przed rozpoczęciem ograniczania żądań.

Nie można wyświetlić istniejącej wartości parametru limitu żądań współbieżnych w witrynie Azure Portal, narzędziach wiersza polecenia lub żądaniach interfejsu API. Aby sprawdzić istniejącą wartość, utwórz żądanie pomoc techniczna platformy Azure.

Uwaga

Kontenery mowy nie wymagają zwiększenia limitu żądań współbieżnych, ponieważ kontenery są ograniczone tylko przez procesory sprzętu, na których są hostowane. Kontenery mowy mają jednak własne ograniczenia pojemności, które należy wziąć pod uwagę. Aby uzyskać więcej informacji, zobacz Często zadawane pytania dotyczące kontenerów usługi Mowa.

Przygotuj wymagane informacje

  • Dla modelu podstawowego:
    • Identyfikator zasobu usługi Mowa
    • Region (Region)
  • Dla modelu niestandardowego:
    • Region (Region)
    • Identyfikator niestandardowego punktu końcowego

Jak uzyskać informacje dotyczące modelu podstawowego:

  1. Przejdź do portalu Azure Portal.
  2. Wybierz zasób usługi Mowa, dla którego chcesz zwiększyć limit żądań współbieżności.
  3. W grupie Zarządzanie zasobami wybierz pozycję Właściwości.
  4. Skopiuj i zapisz wartości następujących pól:
    • Identyfikator zasobu
    • Lokalizacja (region punktu końcowego)

Jak uzyskać informacje dotyczące modelu niestandardowego:

  1. Przejdź do portalu usługi Speech Studio .
  2. W razie potrzeby zaloguj się i przejdź do usługi Custom Speech.
  3. Wybierz projekt i przejdź do pozycji Wdrożenie.
  4. Wybierz wymagany punkt końcowy.
  5. Skopiuj i zapisz wartości następujących pól:
    • Region usługi (region punktu końcowego)
    • Identyfikator punktu końcowego

Tworzenie i przesyłanie wniosku o pomoc techniczną

Zainicjuj zwiększenie limitu żądań współbieżnych dla zasobu lub w razie potrzeby sprawdź bieżący limit, przesyłając wniosek o pomoc techniczną. Oto, jak to zrobić:

  1. Upewnij się, że masz wymagane informacje wymienione w poprzedniej sekcji.
  2. Przejdź do portalu Azure Portal.
  3. Wybierz zasób usługi Mowa, dla którego chcesz zwiększyć (lub sprawdzić) limit żądań współbieżności.
  4. W grupie Pomoc techniczna i rozwiązywanie problemów wybierz pozycję Nowe żądanie pomocy technicznej. Zostanie wyświetlone nowe okno z automatycznie wypełnionymi informacjami o subskrypcji platformy Azure i zasobie platformy Azure.
  5. W obszarze Podsumowanie opisz, co chcesz (na przykład "Zwiększ limit żądań współbieżności mowy na tekst").
  6. W polu Typ problemu wybierz pozycję Problemy z limitem przydziału lub subskrypcją.
  7. W podtypie problemu wybierz jedną z następujących pozycji:
    • Zwiększenie limitu przydziału lub współbieżnych żądań dla żądania zwiększenia.
    • Sprawdzanie limitu przydziału lub użycia w celu sprawdzenia istniejącego limitu.
  8. Wybierz pozycję Dalej: Rozwiązania. Kontynuuj tworzenie wniosku.
  9. Na karcie Szczegóły w polu Opis wprowadź następujące informacje:
    • Zwróć uwagę, że żądanie dotyczy limitu przydziału zamiany mowy na tekst.
    • Wybierz model podstawowy lub niestandardowy.
    • Zebrane wcześniej informacje o zasobach platformy Azure.
    • Wszelkie inne wymagane informacje.
  10. Na karcie Przeglądanie i tworzenie wybierz pozycję Utwórz.
  11. Zanotuj numer wniosku o pomoc techniczną w powiadomieniach z witryny Azure Portal. Wkrótce skontaktowano się z Tobą o swoim żądaniu.

Przykład najlepszych rozwiązań dotyczących wzorca obciążenia

Oto ogólny przykład dobrego podejścia do podjęcia. Jest to przeznaczone tylko jako szablon, który można dostosować zgodnie z potrzebami do własnego użytku.

Załóżmy, że zasób usługi Mowa ma limit żądań współbieżnych ustawiony na 300. Uruchom obciążenie z 20 połączeń współbieżnych i zwiększ obciążenie o 20 współbieżnych połączeń co 90–120 sekund. Kontroluj odpowiedzi usługi i zaimplementuj logikę, która spada (zmniejsza obciążenie), jeśli otrzymasz zbyt wiele żądań (kod odpowiedzi 429). Następnie ponów próbę zwiększenia obciążenia w ciągu jednej minuty i jeśli nadal nie zadziała, spróbuj ponownie za dwie minuty. Użyj wzorca 1-2-4-4 minut dla interwałów.

Ogólnie rzecz biorąc, warto przetestować obciążenie i wzorce obciążenia przed przejściem do środowiska produkcyjnego.

Zamiana tekstu na mowę: zwiększanie limitu żądań współbieżnych

W przypadku warstwy cenowej Standardowa można zwiększyć tę kwotę. Przed przesłaniem żądania upewnij się, że znasz materiał omówiony wcześniej w tym artykule, na przykład najlepsze rozwiązania w celu ograniczenia ograniczania przepustowości.

Zwiększenie limitu żądań współbieżnych nie ma bezpośredniego wpływu na koszty. Usługa rozpoznawania mowy korzysta z modelu płatności, który wymaga płacenia tylko za to, czego używasz. Limit określa, jak wysoka usługa może być skalowana przed rozpoczęciem ograniczania żądań.

Nie można wyświetlić istniejącej wartości parametru limitu żądań współbieżnych w witrynie Azure Portal, narzędziach wiersza polecenia lub żądaniach interfejsu API. Aby sprawdzić istniejącą wartość, utwórz żądanie pomoc techniczna platformy Azure.

Uwaga

Kontenery mowy nie wymagają zwiększenia limitu żądań współbieżnych, ponieważ kontenery są ograniczone tylko przez procesory sprzętu, na których są hostowane.

Przygotowywanie wymaganych informacji

Aby utworzyć żądanie zwiększenia, musisz podać informacje.

  • Dla wstępnie utworzonego głosu:
    • Identyfikator zasobu usługi Mowa
    • Region (Region)
  • Dla głosu niestandardowego:
    • Region rozmieszczenia
    • Identyfikator niestandardowego punktu końcowego

Jak uzyskać informacje dotyczące wstępnie utworzonego głosu:

  1. Przejdź do portalu Azure Portal.
  2. Wybierz zasób usługi Mowa, dla którego chcesz zwiększyć limit żądań współbieżności.
  3. W grupie Zarządzanie zasobami wybierz pozycję Właściwości.
  4. Skopiuj i zapisz wartości następujących pól:
    • Identyfikator zasobu
    • Lokalizacja (region punktu końcowego)

Jak uzyskać informacje dotyczące niestandardowego głosu:

  1. Przejdź do portalu usługi Speech Studio .
  2. W razie potrzeby zaloguj się i przejdź do pozycji Niestandardowy głos.
  3. Wybierz projekt i przejdź do pozycji Wdróż model.
  4. Wybierz wymagany punkt końcowy.
  5. Skopiuj i zapisz wartości następujących pól:
    • Region usługi (region punktu końcowego)
    • Identyfikator punktu końcowego

Tworzenie i przesyłanie wniosku o pomoc techniczną

Zainicjuj zwiększenie limitu żądań współbieżnych dla zasobu lub w razie potrzeby sprawdź bieżący limit, przesyłając wniosek o pomoc techniczną. Oto, jak to zrobić:

  1. Upewnij się, że masz wymagane informacje wymienione w poprzedniej sekcji.
  2. Przejdź do portalu Azure Portal.
  3. Wybierz zasób usługi Mowa, dla którego chcesz zwiększyć (lub sprawdzić) limit żądań współbieżności.
  4. W grupie Pomoc techniczna i rozwiązywanie problemów wybierz pozycję Nowe żądanie pomocy technicznej. Zostanie wyświetlone nowe okno z automatycznie wypełnionymi informacjami o subskrypcji platformy Azure i zasobie platformy Azure.
  5. W obszarze Podsumowanie opisz, co chcesz (na przykład "Zwiększ limit żądań współbieżności zamiany tekstu na mowę").
  6. W polu Typ problemu wybierz pozycję Problemy z limitem przydziału lub subskrypcją.
  7. W podtypie problemu wybierz jedną z następujących pozycji:
    • Zwiększenie limitu przydziału lub współbieżnych żądań dla żądania zwiększenia.
    • Sprawdzanie limitu przydziału lub użycia w celu sprawdzenia istniejącego limitu.
  8. Na karcie Zalecane rozwiązanie wybierz pozycję Dalej.
  9. Na karcie Dodatkowe szczegóły wypełnij wszystkie wymagane elementy. W polu Szczegóły wprowadź następujące informacje:
    • Zwróć uwagę, że żądanie dotyczy limitu przydziału zamiany tekstu na mowę.
    • Wybierz wstępnie utworzony głos lub niestandardowy głos.
    • Zebrane wcześniej informacje o zasobach platformy Azure.
    • Wszelkie inne wymagane informacje.
  10. Na karcie Przeglądanie i tworzenie wybierz pozycję Utwórz.
  11. Zanotuj numer wniosku o pomoc techniczną w powiadomieniach z witryny Azure Portal. Wkrótce skontaktowano się z Tobą o swoim żądaniu.