Limity przydziału i limity usługi mowa

Artykuł
01/23/2024

Ten artykuł zawiera krótkie informacje i szczegółowy opis przydziałów i limitów dla usługi Mowa w usługach azure AI. Informacje dotyczą wszystkich warstw cenowych usługi. Zawiera również pewne najlepsze rozwiązania, aby uniknąć ograniczania żądań.

Aby uzyskać bezpłatną (F0) warstwę cenową, zobacz również miesięczne dodatki na stronie cennika.

Dokumentacja limitów przydziałów i limitów

Poniższe sekcje zawierają szybki przewodnik po limitach przydziałów i limitach, które mają zastosowanie do usługi Mowa.

Aby uzyskać informacje na temat regulowanych limitów przydziału dla zasobów usługi Mowa w warstwie Standardowa (S0), zobacz więcej wyjaśnień, najlepszych rozwiązań i instrukcji dostosowywania. Limity przydziału i limity dla zasobów bezpłatnej mowy (F0) nie są regulowane.

Ważne

Zmiana zasobu usługi Mowa z warstwy cenowej Bezpłatna (F0) na warstwę cenową Standardowa (S0) może potrwać do kilku godzin.

Przydziały i limity zamiany mowy na tekst na zasób

W tej sekcji opisano przydziały i limity mowy na tekst na zasób usługi Mowa. O ile nie określono inaczej, limity nie są regulowane.

Zamiana mowy w czasie rzeczywistym na tekst i tłumaczenie mowy

Zamiana mowy w czasie rzeczywistym na tekst przy użyciu zestawu Speech SDK lub interfejsu API REST zamiany mowy na tekst w celu uzyskania krótkiego dźwięku.

Ważne

Te limity mają zastosowanie do współbieżnej mowy w czasie rzeczywistym do żądań tekstowych i żądań tłumaczenia mowy połączonych. Jeśli na przykład masz 60 współbieżnych żądań zamiany mowy na tekst i 40 współbieżnych żądań tłumaczenia mowy, osiągniesz limit 100 współbieżnych żądań.

Norma sprzedaży	Bezpłatna (F0)	Standardowa (S0)
Limit żądań współbieżnych — podstawowy punkt końcowy modelu	1 Ten limit nie jest regulowany.	100 (wartość domyślna) Szybkość jest regulowana dla zasobów standardowych (S0). Zobacz więcej wyjaśnień, najlepszych rozwiązań i instrukcji dostosowywania.
Limit żądań współbieżnych — niestandardowy punkt końcowy	1 Ten limit nie jest regulowany.	100 (wartość domyślna) Szybkość jest regulowana dla zasobów standardowych (S0). Zobacz więcej wyjaśnień, najlepszych rozwiązań i instrukcji dostosowywania.
Maksymalna długość dźwięku w przypadku diaryzacji w czasie rzeczywistym.	Nie dotyczy	240 minut na plik

Transkrypcja wsadowa

Norma sprzedaży	Bezpłatna (F0)	Standardowa (S0)
Limit interfejsu API REST zamiany mowy na tekst	Niedostępne dla F0	100 żądań na 10 sekund (600 żądań na minutę)
Maksymalny rozmiar pliku wejściowego audio	Nie dotyczy	1 GB
Maksymalna liczba obiektów blob na kontener	Nie dotyczy	10 000
Maksymalna liczba plików na żądanie transkrypcji (jeśli używasz wielu adresów URL zawartości jako danych wejściowych).	Nie dotyczy	1000
Maksymalna długość dźwięku dla transkrypcji z włączoną diaryzacji.	Nie dotyczy	240 minut na plik

Dostosowywanie modelu

Limity w tej tabeli dotyczą zasobu usługi Mowa podczas tworzenia niestandardowego modelu mowy.

Norma sprzedaży	Bezpłatna (F0)	Standardowa (S0)
Limit interfejsu API REST	100 żądań na 10 sekund (600 żądań na minutę)	100 żądań na 10 sekund (600 żądań na minutę)
Maksymalna liczba zestawów danych mowy	2	500
Maksymalny rozmiar pliku zestawu danych akustycznych na potrzeby importowania danych	2 GB	2 GB
Maksymalny rozmiar pliku zestawu danych języka na potrzeby importowania danych	200 MB	1.5 GB
Maksymalny rozmiar pliku zestawu danych wymowy na potrzeby importowania danych	1 KB	1 MB
Maksymalny rozmiar tekstu podczas używania parametru w żądaniu interfejsu `text`API Models_Create	200 KB	500 KB

Przydziały i limity zamiany tekstu na mowę na zasób

W tej sekcji opisano limity przydziału mowy i limity mowy na zasób usługi Mowa.

Zamiana tekstu w czasie rzeczywistym na mowę

Zamiana tekstu w czasie rzeczywistym na mowę za pomocą zestawu Speech SDK lub interfejsu API REST zamiany tekstu na mowę. O ile nie określono inaczej, limity nie są regulowane.

Norma sprzedaży	Bezpłatna (F0)	Standardowa (S0)
Maksymalna liczba transakcji w danym okresie dla wstępnie utworzonych głosów neuronowych i niestandardowych głosów neuronowych.	20 transakcji na 60 sekund Ten limit nie jest regulowany.	200 transakcji na sekundę (TPS) (wartość domyślna) Szybkość jest regulowana do 1000 TPS dla zasobów standardowych (S0). Zobacz więcej wyjaśnień, najlepszych rozwiązań i instrukcji dostosowywania.
Maksymalna długość dźwięku wygenerowana na żądanie	10 minut	10 minut
Maksymalna łączna liczba unikatowych `<voice>` tagów i `<audio>` w języku SSML	50	50
Maksymalny rozmiar komunikatu SSML na kolei dla protokołu websocket	64 KB	64 KB

Synteza wsadowa

Te limity nie są regulowane. Aby uzyskać więcej informacji na temat opóźnienia syntezy wsadowej, zobacz opóźnienie syntezy wsadowej i najlepsze rozwiązania.

Norma sprzedaży	Bezpłatna (F0)	Standardowa (S0)
Limit interfejsu API REST	Niedostępne dla F0	100 żądań na 10 sekund
Maksymalny rozmiar ładunku JSON w celu utworzenia zadania syntezy	Nie dotyczy	2 megabajty
Współbieżne aktywne zadania syntezy	Nie dotyczy	Brak ograniczeń
Maksymalna liczba danych wejściowych tekstu na zadanie syntezy	Nie dotyczy	10 000
Maksymalny czas wygaśnięcia zadania syntezy, ponieważ jest w stanie końcowym	Nie dotyczy	Do 31 dni (określone przy użyciu właściwości)

Niestandardowy neuronowy głos — profesjonalny

Limity w tej tabeli dotyczą zasobu usługi Mowa podczas tworzenia profesjonalnego niestandardowego modelu neuronowego głosu.

Norma sprzedaży	Bezpłatna (F0)	Standardowa (S0)
Maksymalna liczba transakcji na sekundę (TPS)	Niedostępne dla F0	200 transakcji na sekundę (TPS) (wartość domyślna)
Maksymalna liczba zestawów danych	Nie dotyczy	500
Maksymalna liczba równoczesnych przekazywania zestawów danych	Nie dotyczy	5
Maksymalny rozmiar pliku danych na potrzeby importowania danych na zestaw danych	Nie dotyczy	2 GB
Przekazywanie długiego dźwięku lub dźwięku bez skryptu	Nie dotyczy	Tak
Maksymalna liczba równoczesnych trenowań modeli	Nie dotyczy	100
Maksymalna liczba niestandardowych punktów końcowych	Nie dotyczy	50

Niestandardowy neuronowy głos — osobisty głos

Limity w tej tabeli dotyczą zasobu usługi Mowa podczas tworzenia osobistego głosu.

Norma sprzedaży	Bezpłatna (F0)	Standardowa (S0)
Limit interfejsu API REST (bez syntezy mowy)	Niedostępne dla F0	50 żądań na 10 sekund
Maksymalna liczba transakcji na sekundę (TPS) na potrzeby syntezy mowy	Niedostępne dla F0	200 transakcji na sekundę (TPS) (wartość domyślna)

Tekst w czasie rzeczywistym na awatar mowy

Norma sprzedaży	Bezpłatna (F0)	Standardowa (S0)
Nowe połączenia na minutę	Niedostępne dla F0	Dwa nowe połączenia na minutę

Narzędzie do tworzenia zawartości audio

Norma sprzedaży	Bezpłatna (F0)	Standardowa (S0)
Rozmiar pliku (zwykły tekst w języku SSML)¹	3000 znaków na plik	20 000 znaków na plik
Rozmiar pliku (plik leksykonu)²	30 KB na plik	100 KB na plik
Rozliczane znaki w języku SSML	15 000 znaków na plik	100 000 znaków na plik
Eksportowanie do biblioteki audio	1 współbieżne zadanie	Nie dotyczy

¹ Limit dotyczy tylko zwykłego tekstu w języku SSML i nie obejmuje tagów.

² Znaki pliku leksykonu nie są naliczane. Tylko elementy leksykonu w języku SSML są liczone jako znaki rozliczane. Aby dowiedzieć się więcej, zapoznaj się z rozliczanymi znakami .

Limity przydziału i limity rozpoznawania osoby mówiącej na zasób

Rozpoznawanie osoby mówiącej jest ograniczone do 20 transakcji na sekundę (TPS).

Szczegółowy opis, korekta limitu przydziału i najlepsze rozwiązania

Niektóre limity przydziału usługi mowa są regulowane. Ta sekcja zawiera więcej wyjaśnień, najlepszych rozwiązań i instrukcji dostosowywania.

Następujące limity przydziału są regulowane dla zasobów standardowych (S0). Limity żądań bezpłatnych (F0) nie są regulowane.

Limit żądań współbieżnych zamiany mowy na tekst dla podstawowego punktu końcowego modelu i niestandardowego punktu końcowego
Maksymalna liczba transakcji na mowę w okresie wstępnie utworzonych neuronowych głosów i niestandardowych głosów neuronowych
Limit żądań współbieżnych tłumaczenia mowy

Przed zażądaniem zwiększenia limitu przydziału (jeśli ma to zastosowanie), upewnij się, że jest to konieczne. Usługa mowa używa technologii skalowania automatycznego, aby zapewnić wymagane zasoby obliczeniowe w trybie na żądanie. Jednocześnie usługa mowa próbuje utrzymać niskie koszty, nie utrzymując nadmiernej pojemności sprzętowej.

Spójrzmy na przykład. Załóżmy, że aplikacja otrzymuje kod odpowiedzi 429, co oznacza, że istnieje zbyt wiele żądań. Aplikacja otrzymuje tę odpowiedź, mimo że obciążenie mieści się w granicach zdefiniowanych przez odwołanie Limity przydziału i limity. Najbardziej prawdopodobnym wyjaśnieniem jest to, że usługa rozpoznawania mowy skaluje się w górę do zapotrzebowania i nie osiągnęła jeszcze wymaganej skali. W związku z tym usługa nie ma natychmiast wystarczającej ilości zasobów, aby obsłużyć żądanie. W większości przypadków ten stan ograniczania jest przejściowy.

Ogólne najlepsze rozwiązania dotyczące ograniczania przepustowości podczas skalowania automatycznego

Aby zminimalizować problemy związane z ograniczaniem przepustowości, warto użyć następujących technik:

Zaimplementuj logikę ponawiania prób w aplikacji.
Unikaj gwałtownych zmian w obciążeniu. Stopniowo zwiększaj obciążenie. Załóżmy na przykład, że aplikacja używa tekstu do mowy, a bieżące obciążenie to 5 TPS. Następna sekunda zwiększa obciążenie do 20 TPS (czyli cztery razy więcej). Usługa rozpoznawania mowy natychmiast rozpoczyna skalowanie w górę w celu spełnienia nowego obciążenia, ale nie może skalować w razie potrzeby w ciągu jednej sekundy. Niektóre żądania otrzymują kod odpowiedzi 429 (zbyt wiele żądań).
Testuj różne wzorce zwiększania obciążenia. Aby uzyskać więcej informacji, zobacz przykładowy wzorzec obciążenia.
Utwórz więcej zasobów usługi Mowa w różnych regionach i rozłóż obciążenie między nimi. (Utworzenie wielu zasobów usługi Mowa w tym samym regionie nie wpłynie na wydajność, ponieważ wszystkie zasoby są obsługiwane przez ten sam klaster zaplecza).

W następnych sekcjach opisano konkretne przypadki dostosowywania limitów przydziału.

Zamiana mowy na tekst: zwiększanie limitu żądań współbieżnych mowy w czasie rzeczywistym na tekst

Domyślnie łączna liczba współbieżnych żądań zamiany mowy w czasie rzeczywistym na tekst i tłumaczenia mowy jest ograniczona do 100 na zasób w modelu podstawowym i 100 na niestandardowy punkt końcowy w modelu niestandardowym. W przypadku warstwy cenowej Standardowa można zwiększyć tę kwotę. Przed przesłaniem żądania upewnij się, że znasz materiał omówiony wcześniej w tym artykule, na przykład najlepsze rozwiązania w celu ograniczenia ograniczania przepustowości.

Uwaga

Współbieżne limity żądań dla modeli podstawowych i niestandardowych muszą być dostosowywane oddzielnie. Zasób usługi Mowa może być skojarzony z wieloma niestandardowymi punktami końcowymi obsługującymi wiele wdrożeń modelu niestandardowego. W razie potrzeby należy zażądać oddzielnie korekt limitu dla niestandardowego punktu końcowego.

Zwiększenie limitu żądań współbieżnych nie ma bezpośredniego wpływu na koszty. Usługa mowa używa modelu płatności, który wymaga płacenia tylko za to, czego używasz. Limit określa, jak wysoka usługa może być skalowana przed rozpoczęciem ograniczania żądań.

Nie można wyświetlić istniejącej wartości parametru limitu żądań współbieżnych w witrynie Azure Portal, narzędziach wiersza polecenia lub żądaniach interfejsu API. Aby sprawdzić istniejącą wartość, utwórz żądanie pomoc techniczna platformy Azure.

Uwaga

Kontenery mowy nie wymagają zwiększenia limitu żądań współbieżnych, ponieważ kontenery są ograniczone tylko przez procesory sprzętu, na których są hostowane. Kontenery mowy mają jednak własne ograniczenia pojemności, które należy wziąć pod uwagę. Aby uzyskać więcej informacji, zobacz Często zadawane pytania dotyczące kontenerów usługi Mowa.

Przygotuj wymagane informacje

Dla modelu podstawowego:
- Identyfikator zasobu usługi Mowa
- Region (Region)
Dla modelu niestandardowego:
- Region (Region)
- Identyfikator niestandardowego punktu końcowego

Jak uzyskać informacje dotyczące modelu podstawowego:

Przejdź do portalu Azure Portal.
Wybierz zasób usługi Mowa, dla którego chcesz zwiększyć limit żądań współbieżności.
W grupie Zarządzanie zasobami wybierz pozycję Właściwości.
Skopiuj i zapisz wartości następujących pól:
- Identyfikator zasobu
- Lokalizacja (region punktu końcowego)

Jak uzyskać informacje dotyczące modelu niestandardowego:

Przejdź do portalu usługi Speech Studio .
W razie potrzeby zaloguj się i przejdź do usługi Custom Speech.
Wybierz projekt i przejdź do pozycji Wdrożenie.
Wybierz wymagany punkt końcowy.
Skopiuj i zapisz wartości następujących pól:
- Region usługi (region punktu końcowego)
- Identyfikator punktu końcowego

Tworzenie i przesyłanie wniosku o pomoc techniczną

Zainicjuj zwiększenie limitu żądań współbieżnych dla zasobu lub w razie potrzeby sprawdź bieżący limit, przesyłając wniosek o pomoc techniczną. Oto, jak to zrobić:

Upewnij się, że masz wymagane informacje wymienione w poprzedniej sekcji.
Przejdź do portalu Azure Portal.
Wybierz zasób usługi Mowa, dla którego chcesz zwiększyć (lub sprawdzić) limit żądań współbieżności.
W grupie Pomoc techniczna i rozwiązywanie problemów wybierz pozycję Nowe żądanie pomocy technicznej. Zostanie wyświetlone nowe okno z automatycznie wypełnionymi informacjami o subskrypcji platformy Azure i zasobie platformy Azure.
W obszarze Podsumowanie opisz, co chcesz (na przykład "Zwiększ limit żądań współbieżności mowy na tekst").
W polu Typ problemu wybierz pozycję Problemy z limitem przydziału lub subskrypcją.
W podtypie problemu wybierz jedną z następujących pozycji:
- Zwiększenie limitu przydziału lub współbieżnych żądań dla żądania zwiększenia.
- Sprawdzanie limitu przydziału lub użycia w celu sprawdzenia istniejącego limitu.
Wybierz pozycję Dalej: Rozwiązania. Kontynuuj tworzenie wniosku.
Na karcie Szczegóły w polu Opis wprowadź następujące informacje:
- Zwróć uwagę, że żądanie dotyczy limitu przydziału zamiany mowy na tekst.
- Wybierz model podstawowy lub niestandardowy.
- Zebrane wcześniej informacje o zasobach platformy Azure.
- Wszelkie inne wymagane informacje.
Na karcie Przeglądanie i tworzenie wybierz pozycję Utwórz.
Zanotuj numer wniosku o pomoc techniczną w powiadomieniach z witryny Azure Portal. Wkrótce skontaktowano się z Tobą o swoim żądaniu.

Przykład najlepszych rozwiązań dotyczących wzorca obciążenia

Oto ogólny przykład dobrego podejścia do podjęcia. Jest to przeznaczone tylko jako szablon, który można dostosować zgodnie z potrzebami do własnego użytku.

Załóżmy, że zasób usługi Mowa ma limit żądań współbieżnych ustawiony na 300. Uruchom obciążenie z 20 połączeń współbieżnych i zwiększ obciążenie o 20 współbieżnych połączeń co 90–120 sekund. Kontroluj odpowiedzi usługi i zaimplementuj logikę, która spada (zmniejsza obciążenie), jeśli otrzymasz zbyt wiele żądań (kod odpowiedzi 429). Następnie ponów próbę zwiększenia obciążenia w ciągu jednej minuty i jeśli nadal nie zadziała, spróbuj ponownie za dwie minuty. Użyj wzorca 1-2-4-4 minut dla interwałów.

Ogólnie rzecz biorąc, warto przetestować obciążenie i wzorce obciążenia przed przejściem do środowiska produkcyjnego.

Zamiana tekstu na mowę: zwiększanie limitu żądań współbieżnych

W przypadku warstwy cenowej Standardowa można zwiększyć tę kwotę. Przed przesłaniem żądania upewnij się, że znasz materiał omówiony wcześniej w tym artykule, na przykład najlepsze rozwiązania w celu ograniczenia ograniczania przepustowości.

Zwiększenie limitu żądań współbieżnych nie ma bezpośredniego wpływu na koszty. Usługa rozpoznawania mowy korzysta z modelu płatności, który wymaga płacenia tylko za to, czego używasz. Limit określa, jak wysoka usługa może być skalowana przed rozpoczęciem ograniczania żądań.

Uwaga

Kontenery mowy nie wymagają zwiększenia limitu żądań współbieżnych, ponieważ kontenery są ograniczone tylko przez procesory sprzętu, na których są hostowane.

Przygotowywanie wymaganych informacji

Aby utworzyć żądanie zwiększenia, musisz podać informacje.

Dla wstępnie utworzonego głosu:
- Identyfikator zasobu usługi Mowa
- Region (Region)
Dla głosu niestandardowego:
- Region rozmieszczenia
- Identyfikator niestandardowego punktu końcowego

Jak uzyskać informacje dotyczące wstępnie utworzonego głosu:

Przejdź do portalu Azure Portal.
Wybierz zasób usługi Mowa, dla którego chcesz zwiększyć limit żądań współbieżności.
W grupie Zarządzanie zasobami wybierz pozycję Właściwości.
Skopiuj i zapisz wartości następujących pól:
- Identyfikator zasobu
- Lokalizacja (region punktu końcowego)

Jak uzyskać informacje dotyczące niestandardowego głosu:

Przejdź do portalu usługi Speech Studio .
W razie potrzeby zaloguj się i przejdź do pozycji Niestandardowy głos.
Wybierz projekt i przejdź do pozycji Wdróż model.
Wybierz wymagany punkt końcowy.
Skopiuj i zapisz wartości następujących pól:
- Region usługi (region punktu końcowego)
- Identyfikator punktu końcowego

Tworzenie i przesyłanie wniosku o pomoc techniczną

Zainicjuj zwiększenie limitu żądań współbieżnych dla zasobu lub w razie potrzeby sprawdź bieżący limit, przesyłając wniosek o pomoc techniczną. Oto, jak to zrobić:

Upewnij się, że masz wymagane informacje wymienione w poprzedniej sekcji.
Przejdź do portalu Azure Portal.
Wybierz zasób usługi Mowa, dla którego chcesz zwiększyć (lub sprawdzić) limit żądań współbieżności.
W grupie Pomoc techniczna i rozwiązywanie problemów wybierz pozycję Nowe żądanie pomocy technicznej. Zostanie wyświetlone nowe okno z automatycznie wypełnionymi informacjami o subskrypcji platformy Azure i zasobie platformy Azure.
W obszarze Podsumowanie opisz, co chcesz (na przykład "Zwiększ limit żądań współbieżności zamiany tekstu na mowę").
W polu Typ problemu wybierz pozycję Problemy z limitem przydziału lub subskrypcją.
W podtypie problemu wybierz jedną z następujących pozycji:
- Zwiększenie limitu przydziału lub współbieżnych żądań dla żądania zwiększenia.
- Sprawdzanie limitu przydziału lub użycia w celu sprawdzenia istniejącego limitu.
Na karcie Zalecane rozwiązanie wybierz pozycję Dalej.
Na karcie Dodatkowe szczegóły wypełnij wszystkie wymagane elementy. W polu Szczegóły wprowadź następujące informacje:
- Zwróć uwagę, że żądanie dotyczy limitu przydziału zamiany tekstu na mowę.
- Wybierz wstępnie utworzony głos lub niestandardowy głos.
- Zebrane wcześniej informacje o zasobach platformy Azure.
- Wszelkie inne wymagane informacje.
Na karcie Przeglądanie i tworzenie wybierz pozycję Utwórz.
Zanotuj numer wniosku o pomoc techniczną w powiadomieniach z witryny Azure Portal. Wkrótce skontaktowano się z Tobą o swoim żądaniu.

Limity przydziału i limity usługi mowa

Dokumentacja limitów przydziałów i limitów

Przydziały i limity zamiany mowy na tekst na zasób

Zamiana mowy w czasie rzeczywistym na tekst i tłumaczenie mowy

Transkrypcja wsadowa

Dostosowywanie modelu

Przydziały i limity zamiany tekstu na mowę na zasób

Zamiana tekstu w czasie rzeczywistym na mowę

Synteza wsadowa

Niestandardowy neuronowy głos — profesjonalny

Niestandardowy neuronowy głos — osobisty głos

Tekst w czasie rzeczywistym na awatar mowy

Narzędzie do tworzenia zawartości audio

Limity przydziału i limity rozpoznawania osoby mówiącej na zasób

Szczegółowy opis, korekta limitu przydziału i najlepsze rozwiązania

Ogólne najlepsze rozwiązania dotyczące ograniczania przepustowości podczas skalowania automatycznego

Zamiana mowy na tekst: zwiększanie limitu żądań współbieżnych mowy w czasie rzeczywistym na tekst

Przygotuj wymagane informacje

Tworzenie i przesyłanie wniosku o pomoc techniczną

Przykład najlepszych rozwiązań dotyczących wzorca obciążenia

Zamiana tekstu na mowę: zwiększanie limitu żądań współbieżnych

Przygotowywanie wymaganych informacji

Tworzenie i przesyłanie wniosku o pomoc techniczną

Dodatkowe zasoby