Beszédfelismerő szolgáltatás tárolóinak telepítése és futtatása (előzetes verzió)Install and run Speech service containers (Preview)

A tárolók lehetővé teszik a beszédfelismerési szolgáltatás egyes API-jai futtatását a saját környezetében.Containers enable you to run some of the Speech service APIs in your own environment. A tárolók az adott biztonsági és adatirányítási követelményekhez is kiválóak.Containers are great for specific security and data governance requirements. Ebből a cikkből megtudhatja, hogyan töltheti le, telepítheti és futtathatja a beszédfelismerési tárolókat.In this article you'll learn how to download, install, and run a Speech container.

A beszédfelismerési tárolók lehetővé teszik, hogy az ügyfelek olyan beszédfelismerési alkalmazás-architektúrát hozzanak létre, amely robusztus Felhőbeli képességekre és Edge-helyekre optimalizáltSpeech containers enable customers to build a speech application architecture that is optimized for both robust cloud capabilities and edge locality. Négy különböző tároló érhető el.There are four different containers available. A két szabványos tároló a beszédfelismerés és a szöveg közöttikommunikáció.The two standard containers are Speech-to-text and Text-to-speech. A két egyéni tároló Custom Speech szöveg és egyéni szöveg-beszéd.The two custom containers are Custom Speech-to-text and Custom Text-to-speech. A beszédfelismerési tárolók megegyeznek a felhőalapú Azure Speech Services díjszabásával .Speech containers have the same pricing as the cloud-based Azure Speech Services.

Fontos

Az összes beszédfelismerési tároló jelenleg egy nyilvános "GateD" előzetesverzió részeként érhető el.All speech containers are currently offered as part of a Public "Gated" Preview. Bejelentést kell készíteni, amikor a beszédfelismerési tárolók az általánosan elérhetővé vált (GA).An announcement will be made when speech containers progress to General Availability (GA).

FüggvényFunction FunkciókFeatures LegújabbLatest
DiktálásSpeech-to-text Elemzi az érzelmeket, és átírja a folyamatos valós idejű beszédet vagy a Batch hangfelvételeket közbenső eredményekkel.Analyzes sentiment and transcribes continuous real-time speech or batch audio recordings with intermediate results. 2.2.02.2.0
Custom Speech – szövegCustom Speech-to-text A Custom Speech portálegyéni modelljét használva folyamatos valós idejű beszédet vagy batch-hangfelvételeket vált ki közbenső eredményekkel rendelkező szövegbe.Using a custom model from the Custom Speech portal, transcribes continuous real-time speech or batch audio recordings into text with intermediate results. 2.2.02.2.0
SzövegfelolvasásText-to-speech A szöveget természetes hangú beszédre konvertálja egyszerű szöveges bevitelsel vagy beszéd szintézis Markup Language (SSML) nyelvvel.Converts text to natural-sounding speech with plain text input or Speech Synthesis Markup Language (SSML). 1.4.01.4.0
Egyéni szöveg – beszédCustom Text-to-speech Ha egyéni modellt használ az Egyéni hangportálról, a szövegeket természetes hangú beszédre alakítja egyszerű szöveges bevitel vagy beszédfelismerési leíró nyelv (SSML) használatával.Using a custom model from the Custom Voice portal, converts text to natural-sounding speech with plain text input or Speech Synthesis Markup Language (SSML). 1.4.01.4.0

Ha még nincs Azure-előfizetése, kezdés előtt hozzon létre egy ingyenes fiókot.If you don't have an Azure subscription, create a free account before you begin.

ElőfeltételekPrerequisites

A Speech containers használata előtt a következő előfeltételek szükségesek:The following prerequisites before using Speech containers:

KötelezőRequired CélPurpose
Docker-motorDocker Engine A Docker-motornak telepítve kell lennie a gazdagépen.You need the Docker Engine installed on a host computer. A Docker csomagokat biztosít a Docker-környezet konfigurálásához macOS, Windows és Linux rendszereken.Docker provides packages that configure the Docker environment on macOS, Windows, and Linux. A Docker és a tárolók alapszintű ismertetéséért lásd a Docker felhasználói útmutatóját.For a primer on Docker and container basics, see the Docker overview.

A Docker-t úgy kell konfigurálni, hogy lehetővé tegye a tárolók számára az Azure-ba való kapcsolódást és a számlázási információk küldését.Docker must be configured to allow the containers to connect with and send billing data to Azure.

Windows rendszeren aDocker-t is konfigurálni kell a Linux-tárolók támogatásához.On Windows, Docker must also be configured to support Linux containers.

A Docker ismereteFamiliarity with Docker Alapvető ismeretekkel kell rendelkeznie a Docker-fogalmakról, például a kibocsátásiegység-forgalmi jegyzékekről, a adattárakról, a tárolók és a tárolók lemezképéről, valamint az alapszintű docker parancsokról.You should have a basic understanding of Docker concepts, like registries, repositories, containers, and container images, as well as knowledge of basic docker commands.
Beszédfelismerési erőforrásSpeech resource A tárolók használatához a következőket kell tennie:In order to use these containers, you must have:

Egy Azure Speech -erőforrás a társított API-kulcs és végpont URI-azonosító lekéréséhez.An Azure Speech resource to get the associated API key and endpoint URI. Mindkét érték elérhető a Azure Portal beszédének áttekintése és a kulcsok oldalain.Both values are available on the Azure portal's Speech Overview and Keys pages. Mindkettő szükséges a tároló elindításához.They are both required to start the container.

{API_KEY}: a kulcsok oldalon található két elérhető erőforrás-kulcs egyike{API_KEY}: One of the two available resource keys on the Keys page

{ENDPOINT_URI}: az Áttekintés lapon megadott végpont{ENDPOINT_URI}: The endpoint as provided on the Overview page

Hozzáférés kérése a tároló beállításjegyzékéhezRequest access to the container registry

Töltse ki és küldje el a kérelem űrlapját , hogy hozzáférést Kérjen a tárolóhoz.Fill out and submit the request form to request access to the container.

Az űrlap adatokat kér Önnek, a vállalatnak és a felhasználói forgatókönyvnek, amelyhez a tárolót fogja használni.The form requests information about you, your company, and the user scenario for which you'll use the container. Miután elküldte az űrlapot, az Azure Cognitive Services csapata ellenőrzi, hogy megfelelnek-e a Private Container registryhez való hozzáférés feltételeinek.After you've submitted the form, the Azure Cognitive Services team reviews it to ensure that you meet the criteria for access to the private container registry.

Fontos

Az űrlapon egy Microsoft-fiókkal (MSA) vagy Azure Active Directory (Azure AD-fiókkal) társított e-mail-címet kell használnia.You must use an email address that's associated with either a Microsoft Account (MSA) or Azure Active Directory (Azure AD) account in the form.

Ha jóváhagyja a kérelmét, egy e-mailt fog kapni, amely leírja, hogyan kérheti le a hitelesítő adatokat, és hogyan érheti el a privát tároló beállításjegyzékét.If your request is approved, you'll receive an email with instructions that describe how to obtain your credentials and access the private container registry.

A Docker parancssori felületének használata a privát tároló beállításjegyzékének hitelesítéséhezUse the Docker CLI to authenticate the private container registry

A Cognitive Services tárolók számára több módon is végezheti a hitelesítést a tárolók beállításjegyzékében, de a parancssorban ajánlott módszer a Docker CLIhasználata.You can authenticate with the private container registry for Cognitive Services Containers in any of several ways, but the recommended method from the command line is to use the Docker CLI.

Használja az docker login parancsotaz alábbi példában containerpreview.azurecr.iolátható módon a Cognitive Services tárolók magánhálózati tárolójának beállításjegyzékében.Use the docker login command, as shown in the following example, to log in to containerpreview.azurecr.io, the private container registry for Cognitive Services Containers. Cserélje * <le> a username* nevet és * <a jelszót> * az Azure Cognitive Services csapata által kapott hitelesítő adatokban megadott jelszóra.Replace <username> with the user name and <password> with the password that's provided in the credentials you received from the Azure Cognitive Services team.

docker login containerpreview.azurecr.io -u <username> -p <password>

Ha a hitelesítő adatait szövegfájlban védi, a következő példában látható módon összefűzheti a szövegfájl tartalmát a parancs használatával cat a docker login parancshoz.If you've secured your credentials in a text file, you can concatenate the contents of that text file, by using the cat command, to the docker login command, as shown in the following example. Cserélje * <le> a passwordFile* a jelszót és * <a felhasználónevet> * tartalmazó szövegfájl elérési útjára és nevére a hitelesítő adataiban megadott felhasználónévvel.Replace <passwordFile> with the path and name of the text file that contains the password and <username> with the user name that's provided in your credentials.

cat <passwordFile> | docker login containerpreview.azurecr.io -u <username> --password-stdin

A szükséges paraméterek összegyűjtéseGathering required parameters

Három elsődleges paraméter van a szükséges összes Cognitive Services tárolóhoz.There are three primary parameters for all Cognitive Services' containers that are required. A végfelhasználói licencszerződés (EULA) értékének a következőnek kell lennie: accept.The end-user license agreement (EULA) must be present with a value of accept. Emellett a végponti URL-cím és az API-kulcs is szükséges.Additionally, both an Endpoint URL and API Key are needed.

Végpont URI-ja{ENDPOINT_URI}Endpoint URI {ENDPOINT_URI}

A végpont URI-értéke a megfelelő kognitív szolgáltatás erőforrásának Azure Portal Áttekintés lapján érhető el.The Endpoint URI value is available on the Azure portal Overview page of the corresponding Cognitive Service resource. Navigáljon az Áttekintés lapra, vigye a kurzort a végpont fölé Copy to clipboard , és egy ikon jelenik meg.Navigate to the Overview page, hover over the Endpoint, and a Copy to clipboard icon will appear. Szükség esetén másolja és használja.Copy and use where needed.

A végpont URI-ja összegyűjtése későbbi használatra

Kulcsok{API_KEY}Keys {API_KEY}

Ez a kulcs a tároló elindítására szolgál, és a megfelelő kognitív szolgáltatási erőforrás Azure Portal kulcsok lapján érhető el.This key is used to start the container, and is available on the Azure portal's Keys page of the corresponding Cognitive Service resource. Navigáljon a kulcsok oldalra, és kattintson az Copy to clipboard ikonra.Navigate to the Keys page, and click on the Copy to clipboard icon.

A két kulcs egyikének beolvasása későbbi használatra

Fontos

Ezek az előfizetési kulcsok hozzáférnek a kognitív szolgáltatás API-hoz.These subscription keys are used to access your Cognitive Service API. Ne ossza meg a kulcsokat.Do not share your keys. Biztonságos tárolás, például Azure Key Vault használata.Store them securely, for example, using Azure Key Vault. Javasoljuk továbbá, hogy rendszeresen újragenerálja ezeket a kulcsokat.We also recommend regenerating these keys regularly. API-hívások létrehozásához csak egy kulcs szükséges.Only one key is necessary to make an API call. Az első kulcs újragenerálásakor a második kulcsot használhatja a szolgáltatás folyamatos eléréséhez.When regenerating the first key, you can use the second key for continued access to the service.

A gazdaszámítógépThe host computer

A gazdagép egy x64-alapú számítógép, amely a Docker-tárolót futtatja.The host is a x64-based computer that runs the Docker container. Ez lehet egy számítógép a helyszínen vagy az Azure-beli Docker-üzemeltetési szolgáltatás, például:It can be a computer on your premises or a Docker hosting service in Azure, such as:

Speciális vektoros bővítmény támogatásaAdvanced Vector Extension support

A gazdagép a Docker-tárolót futtató számítógép.The host is the computer that runs the docker container. A gazdagépnek támogatnia kell a speciális vektoros bővítményeket (AVX2).The host must support Advanced Vector Extensions (AVX2). A Linux-gazdagépek AVX2-támogatását a következő paranccsal tekintheti meg:You can check for AVX2 support on Linux hosts with the following command:

grep -q avx2 /proc/cpuinfo && echo AVX2 supported || echo No AVX2 support detected

Figyelmeztetés

A AVX2 támogatásához a gazdaszámítógép szükséges .The host computer is required to support AVX2. A tároló nem fog megfelelően működni AVX2-támogatás nélkül.The container will not function correctly without AVX2 support.

A tárolóra vonatkozó követelmények és javaslatokContainer requirements and recommendations

Az alábbi táblázat az egyes beszédfelismerési tárolók minimális és ajánlott erőforrás-elosztását ismerteti.The following table describes the minimum and recommended allocation of resources for each Speech container.

TárolóContainer MinimálisMinimum AjánlottRecommended
DiktálásSpeech-to-text 2 mag, 2 GB memória2 core, 2-GB memory 4 mag, 4 GB memória4 core, 4-GB memory
  • Minden mag legalább 2,6 gigahertz (GHz) vagy gyorsabb lehet.Each core must be at least 2.6 gigahertz (GHz) or faster.

Az alap és a memória a --cpus --memory parancs részeként használt és beállításoknak felel meg docker run .Core and memory correspond to the --cpus and --memory settings, which are used as part of the docker run command.

Megjegyzés

A minimális és ajánlott a Docker korlátain kívüli, nem pedig a gazdagép erőforrásai.The minimum and recommended are based off of Docker limits, not the host machine resources. Például a beszéd-szöveg típusú tárolók a nagyméretű nyelvi modell részei, és azt javasoljuk , hogy a teljes fájl elfér a memóriában, ami egy további 4-6 GB.For example, speech-to-text containers memory map portions of a large language model, and it is recommended that the entire file fits in memory, which is an additional 4-6 GB. A tárolók első futtatása hosszabb időt is igénybe vehet, mivel a modellek a memóriába kerülnek.Also, the first run of either container may take longer, since models are being paged into memory.

A tároló rendszerképének beolvasása adocker pullGet the container image with docker pull

A Speech tároló lemezképei a következő Container Registry érhetők el.Container images for Speech are available in the following Container Registry.

TárolóContainer AdattárRepository
DiktálásSpeech-to-text containerpreview.azurecr.io/microsoft/cognitive-services-speech-to-text:latest

Tipp

A Docker images paranccsal listázhatja a letöltött tároló lemezképeit.You can use the docker images command to list your downloaded container images. Például a következő parancs felsorolja az egyes letöltött tárolók rendszerképének AZONOSÍTÓját, tárházát és címkéjét, amely táblázatként van formázva:For example, the following command lists the ID, repository, and tag of each downloaded container image, formatted as a table:

docker images --format "table {{.ID}}\t{{.Repository}}\t{{.Tag}}"

IMAGE ID         REPOSITORY                TAG
<image-id>       <repository-path/name>    <tag-name>

Docker-lekérés a beszédfelismerési tárolók számáraDocker pull for the Speech containers

Docker-lekérés a beszéd-szöveg tárolóhozDocker pull for the Speech-to-text container

A Docker pull parancs használatával letöltheti a tároló rendszerképét a Container Preview beállításjegyzékből.Use the docker pull command to download a container image from Container Preview registry.

docker pull containerpreview.azurecr.io/microsoft/cognitive-services-speech-to-text:latest

Fontos

A latest címke lekéri a en-US területi beállításokat.The latest tag pulls the en-US locale. További területi beállítások: beszéd – szöveg területi beállítások.For additional locales see Speech-to-text locales.

Beszéd – szöveg területi beállításokSpeech-to-text locales

A (z) kivételével az összes címke latest a következő formátumban van, és megkülönbözteti a kis-és nagybetűket:All tags, except for latest are in the following format and are case-sensitive:

<major>.<minor>.<patch>-<platform>-<locale>-<prerelease>

A következő címke egy példa a formátumra:The following tag is an example of the format:

2.2.0-amd64-en-us-preview

A beszéd-szöveg típusú tároló összes támogatott területi beállítását lásd: beszéd – szöveg képcímkék.For all of the supported locales of the speech-to-text container, please see Speech-to-text image tags.

A tároló használataHow to use the container

Miután a tároló a gazdagépentalálható, a következő eljárással dolgozhat a tárolóval.Once the container is on the host computer, use the following process to work with the container.

  1. Futtassa a tárolóta kötelező számlázási beállításokkal.Run the container, with the required billing settings. További példák a docker run parancsra.More examples of the docker run command are available.
  2. A tároló előrejelzési végpontjának lekérdezése.Query the container's prediction endpoint.

A tároló futtatása adocker runRun the container with docker run

A tároló futtatásához használja a Docker Run parancsot.Use the docker run command to run the container. A és értékek beszerzésével kapcsolatos részletekért tekintse meg a szükséges paraméterek összegyűjtését ismertető témakört {Endpoint_URI} {API_Key} .Refer to gathering required parameters for details on how to get the {Endpoint_URI} and {API_Key} values. A examples docker run parancshoz további példák is elérhetők.Additional examples of the docker run command are also available.

A beszéd-szöveg tároló futtatásához hajtsa végre a következő docker run parancsot.To run the Speech-to-text container, execute the following docker run command.

docker run --rm -it -p 5000:5000 --memory 4g --cpus 4 \
containerpreview.azurecr.io/microsoft/cognitive-services-speech-to-text \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

A parancs a következőket hajtja végre:This command:

  • Egy beszéd-szöveg tárolót futtat a tároló képéből.Runs a Speech-to-text container from the container image.
  • 4 CPU-magot és 4 GB memóriát foglal le.Allocates 4 CPU cores and 4 gigabytes (GB) of memory.
  • Elérhetővé teszi a 5000-es TCP-portot, és egy pszeudo-TTY-t foglal le a tárolóhoz.Exposes TCP port 5000 and allocates a pseudo-TTY for the container.
  • A automatikusan eltávolítja a tárolót a kilépés után.Automatically removes the container after it exits. A tároló rendszerképe továbbra is elérhető a gazdaszámítógépen.The container image is still available on the host computer.

Az érzelmek elemzése a beszédfelismerési kimenetreAnalyze sentiment on the speech-to-text output

A beszéd-szöveg típusú tárolóhoz tartozó v 2.2.0-tól kezdve a kimeneten meghívhatja a hangulat elemzése V3 API -t.Starting in v2.2.0 of the speech-to-text container, you can call the sentiment analysis v3 API on the output. A hangulat elemzésének meghívásához szüksége lesz egy Text Analytics API erőforrás-végpontra.To call sentiment analysis, you will need a Text Analytics API resource endpoint. Például:For example:

  • https://westus2.api.cognitive.microsoft.com/text/analytics/v3.0-preview.1/sentiment
  • https://localhost:5000/text/analytics/v3.0-preview.1/sentiment

Ha a felhőben szöveges elemzési végpontot használ, szüksége lesz egy kulcsra.If you're accessing a Text analytics endpoint in the cloud, you will need a key. Ha Text Analytics helyileg futtatja, előfordulhat, hogy nem kell megadnia ezt.If you're running Text Analytics locally, you may not need to provide this.

A kulcs és a végpont argumentumként kerül átadásra a Speech tárolónak, ahogy az alábbi példában is látható.The key and endpoint are passed to the Speech container as arguments, as in the following example.

docker run -it --rm -p 5000:5000 \
containerpreview.azurecr.io/microsoft/cognitive-services-speech-to-text:latest \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY} \
CloudAI:SentimentAnalysisSettings:TextAnalyticsHost={TEXT_ANALYTICS_HOST} \
CloudAI:SentimentAnalysisSettings:SentimentAnalysisApiKey={SENTIMENT_APIKEY}

A parancs a következőket hajtja végre:This command:

  • A fenti paranccsal megegyező lépéseket hajt végre.Performs the same steps as the command above.
  • Egy Text Analytics API végpontot és kulcsot tárol a hangulati elemzési kérelmek küldéséhez.Stores a Text Analytics API endpoint and key, for sending sentiment analysis requests.

Fontos

A Eula , a Billing és a ApiKey beállításokat meg kell adni a tároló futtatásához; egyéb esetben a tároló nem indul el.The Eula, Billing, and ApiKey options must be specified to run the container; otherwise, the container won't start. További információ: számlázás.For more information, see Billing.

A tároló előrejelzési végpontjának lekérdezéseQuery the container's prediction endpoint

Megjegyzés

Ha több tárolót futtat, használjon egyedi portszámot.Use a unique port number if you're running multiple containers.

TárolókContainers SDK-gazda URL-címeSDK Host URL ProtokollProtocol
Beszéd – szöveg és Custom Speech – szövegSpeech-to-text and Custom Speech-to-text ws://localhost:5000 WSWS
Szöveg – beszéd és egyéni szöveg – beszédText-to-speech and Custom Text-to-speech http://localhost:5000 HTTPHTTP

A WSS és a HTTPS protokollok használatával kapcsolatos további információkért lásd: tárolók biztonsága.For more information on using WSS and HTTPS protocols, see container security.

Beszéd – szöveg vagy Custom Speech – szövegSpeech-to-text or Custom Speech-to-text

A tároló olyan WebSocket-alapú lekérdezési végpont API-kat biztosít, amelyek a SPEECH SDK-n keresztül érhetők el.The container provides websocket-based query endpoint APIs, that are accessed through the Speech SDK. Alapértelmezés szerint a Speech SDK az online Speech Services szolgáltatást használja.By default, the Speech SDK uses online speech services. A tároló használatához módosítania kell az inicializálási módszert.To use the container, you need to change the initialization method.

Tipp

Ha a Speech SDK-t tárolókkal használja, nem kell megadnia az Azure Speech Resource -előfizetés kulcsát vagy egy hitelesítési tulajdonosi jogkivonatot.When using the Speech SDK with containers, you do not need to provide the Azure Speech resource subscription key or an authentication bearer token.

Ez az alábbi példákon látható.See the examples below.

Váltás az Azure-felhő inicializálási hívásának használatával:Change from using this Azure-cloud initialization call:

var config = SpeechConfig.FromSubscription("YourSubscriptionKey", "YourServiceRegion");

Ehhez a híváshoz a Container Hosthasználatával:to this call using the container host:

var config = SpeechConfig.FromHost(
    new Uri("ws://localhost:5000"));

Vélemények elemzéseAnalyze sentiment

Ha megadták a Text Analytics API hitelesítő adatait a tárolóhoz, a Speech SDK használatával elküldheti a beszédfelismerési kérelmeket az érzelmek elemzésével.If you provided your Text Analytics API credentials to the container, you can use the Speech SDK to send speech recognition requests with sentiment analysis. Az API-válaszokat beállíthatja egyszerű vagy részletes formátum használatára.You can configure the API responses to use either a simple or detailed format.

Ha úgy szeretné beállítani a beszédfelismerési ügyfelet, hogy egyszerű formátumot használjon, adja hozzá a "Sentiment" értéket a értékhez Simple.Extensions .To configure the Speech client to use a simple format, add "Sentiment" as a value for Simple.Extensions. Ha ki szeretne választani egy adott Text Analytics modell verzióját, 'latest' a tulajdonság konfigurációjában cserélje le a elemet speechcontext-phraseDetection.sentimentAnalysis.modelversion .If you want to choose a specific Text Analytics model version, replace 'latest' in the speechcontext-phraseDetection.sentimentAnalysis.modelversion property configuration.

speech_config.set_service_property(
    name='speechcontext-PhraseOutput.Simple.Extensions',
    value='["Sentiment"]',
    channel=speechsdk.ServicePropertyChannel.UriQueryParameter
)
speech_config.set_service_property(
    name='speechcontext-phraseDetection.sentimentAnalysis.modelversion',
    value='latest',
    channel=speechsdk.ServicePropertyChannel.UriQueryParameter
)

Simple.Extensionsa válasz gyökérelem eredményét fogja visszaadni.Simple.Extensions will return the sentiment result in root layer of the response.

{
   "DisplayText":"What's the weather like?",
   "Duration":13000000,
   "Id":"6098574b79434bd4849fee7e0a50f22e",
   "Offset":4700000,
   "RecognitionStatus":"Success",
   "Sentiment":{
      "Negative":0.03,
      "Neutral":0.79,
      "Positive":0.18
   }
}

Ha szeretné teljesen letiltani a hangulat elemzését, adjon hozzá egy értéket a következőhöz: false sentimentanalysis.enabled .If you want to completely disable sentiment analysis, add a false value to sentimentanalysis.enabled.

speech_config.set_service_property(
    name='speechcontext-phraseDetection.sentimentanalysis.enabled',
    value='false',
    channel=speechsdk.ServicePropertyChannel.UriQueryParameter
)

Szöveg – beszéd vagy egyéni szöveg – beszédText-to-speech or Custom Text-to-speech

A tároló REST-alapú Endpoint API-katbiztosít.The container provides REST-based endpoint APIs. A platformhoz, a keretrendszerhez és a nyelvi változatokhoz számos minta forráskód-projekt áll rendelkezésre.There are many sample source code projects for platform, framework, and language variations available.

A normál szöveg-beszéd tárolóval a letöltött Képcímke területi beállítását és hangját kell használnia.With the Standard Text-to-speech container, you should rely on the locale and voice of the image tag you downloaded. Ha például letöltötte a latest címkét, az alapértelmezett területi beállítás a en-US és a JessaRUS hang.For example, if you downloaded the latest tag the default locale is en-US and the JessaRUS voice. Az {VOICE_NAME} argumentum ekkor a következő en-US-JessaRUS:.The {VOICE_NAME} argument would then be en-US-JessaRUS. Tekintse meg az alábbi példában SSML:See the example SSML below:

<speak version="1.0" xml:lang="en-US">
    <voice name="en-US-JessaRUS">
        This text will get converted into synthesized speech.
    </voice>
</speak>

Az egyéni szöveg-beszéd kapcsolathoz azonban az Egyéni hangportálonkell megszereznie a hangfelvételt/modellt .However, for Custom Text-to-speech you'll need to obtain the Voice / model from the custom voice portal. Az egyéni modell neve szinonimája a hang nevét.The custom model name is synonymous with the voice name. Navigáljon a képzés lapra, és másolja a használni kívánt hang/modell {VOICE_NAME} argumentumként.Navigate to the Training page, and copy the Voice / model to use as the {VOICE_NAME} argument.

Egyéni hangmodell – hang neve

Tekintse meg az alábbi példában SSML:See the example SSML below:

<speak version="1.0" xml:lang="en-US">
    <voice name="custom-voice-model">
        This text will get converted into synthesized speech.
    </voice>
</speak>

Hozzon létre egy HTTP POST-kérelmet, amely néhány fejlécet és adattartalomot biztosít.Let's construct an HTTP POST request, providing a few headers and a data payload. Cserélje le {VOICE_NAME} a helyőrzőt a saját értékére.Replace the {VOICE_NAME} placeholder with your own value.

curl -s -v -X POST http://localhost:5000/speech/synthesize/cognitiveservices/v1 \
 -H 'Accept: audio/*' \
 -H 'Content-Type: application/ssml+xml' \
 -H 'X-Microsoft-OutputFormat: riff-16khz-16bit-mono-pcm' \
 -d '<speak version="1.0" xml:lang="en-US"><voice name="{VOICE_NAME}">This is a test, only a test.</voice></speak>'

A parancs a következőket hajtja végre:This command:

  • Egy HTTP POST-kérelmet hoz létre a speech/synthesize/cognitiveservices/v1 végponthoz.Constructs an HTTP POST request for the speech/synthesize/cognitiveservices/v1 endpoint.
  • Egy Accept fejlécet ad megaudio/*Specifies an Accept header of audio/*
  • A Content-Type fejlécének megadása application/ssml+xml, további információ: kérelem törzse.Specifies a Content-Type header of application/ssml+xml, for more information, see request body.
  • A X-Microsoft-OutputFormat fejlécét adja riff-16khz-16bit-mono-pcmmeg, további beállításokért lásd: hangkimenet.Specifies a X-Microsoft-OutputFormat header of riff-16khz-16bit-mono-pcm, for more options see audio output.
  • A Speech szintézis Markup Language (SSML) kérelem {VOICE_NAME} küldése a végpontnak.Sends the Speech Synthesis Markup Language (SSML) request given the {VOICE_NAME} to the endpoint.

Több tároló futtatása ugyanazon a gazdagépenRun multiple containers on the same host

Ha több tárolót kíván futtatni a kihelyezett portokkal, ügyeljen arra, hogy az egyes tárolókat egy másik elérhető porton futtassa.If you intend to run multiple containers with exposed ports, make sure to run each container with a different exposed port. Futtassa például az első tárolót az 5000-as porton és a második tárolót a 5001-es porton.For example, run the first container on port 5000 and the second container on port 5001.

Ezt a tárolót és egy másik, a GAZDAGÉPen futó Azure Cognitive Services tárolót is használhat.You can have this container and a different Azure Cognitive Services container running on the HOST together. Több tároló is lehet ugyanazon a Cognitive Services tárolón.You also can have multiple containers of the same Cognitive Services container running.

Annak ellenőrzése, hogy a tároló fut-eValidate that a container is running

Több módon is ellenőrizheti, hogy a tároló fut-e.There are several ways to validate that the container is running. Keresse meg a kérdéses tároló külső IP- címét és a hozzá tartozó portot, és nyissa meg a kedvenc webböngészőjét.Locate the External IP address and exposed port of the container in question, and open your favorite web browser. Az alábbi kérelmek URL-címeivel ellenőrizheti, hogy a tároló fut-e.Use the various request URLs below to validate the container is running. Az alábbi példa a kérelem URL- http://localhost:5000címeit tartalmazza, de az adott tároló eltérő lehet.The example request URLs listed below are http://localhost:5000, but your specific container may vary. Ne feledje, hogy a tároló külső IP- címére és az elérhető portra támaszkodik.Keep in mind that you're to rely on your container's External IP address and exposed port.

Kérés URL-címeRequest URL CélPurpose
http://localhost:5000/ A tároló egy kezdőlapot biztosít.The container provides a home page.
http://localhost:5000/status HTTP GET-kéréssel, annak ellenőrzéséhez, hogy a tároló fut-e, és nem okoz-e végponti lekérdezést.Requested with an HTTP GET, to validate that the container is running without causing an endpoint query. Ez a kérelem az Kubernetes és készültségitesztekhez használható.This request can be used for Kubernetes liveness and readiness probes.
http://localhost:5000/swagger A tároló teljes körű dokumentációt biztosít a végpontokhoz és a kipróbálható funkciókhoz.The container provides a full set of documentation for the endpoints and a Try it out feature. Ezzel a funkcióval megadhatja a beállításokat egy webalapú HTML-űrlapon, és anélkül teheti meg a lekérdezést, hogy kódot kellene írnia.With this feature, you can enter your settings into a web-based HTML form and make the query without having to write any code. A lekérdezés visszaadása után egy példa CURL-parancs van megadva a szükséges HTTP-fejlécek és-szövegtörzs bemutatásához.After the query returns, an example CURL command is provided to demonstrate the HTTP headers and body format that's required.

Tároló kezdőlapja

A tároló leállításaStop the container

A tároló leállításához a tárolót futtató parancssori környezetben válassza a CTRL + C billentyűkombinációt.To shut down the container, in the command-line environment where the container is running, select Ctrl+C.

HibaelhárításTroubleshooting

A tároló indításakor vagy futtatásakor problémák merülhetnek fel.When starting or running the container, you may experience issues. Használjon kimeneti csatlakoztatást , és engedélyezze a naplózást.Use an output mount and enable logging. Ezzel lehetővé teszi, hogy a tároló olyan naplófájlokat állítson elő, amelyek hasznosak a hibák elhárítása során.Doing so will allow the container to generate log files that are helpful when troubleshooting issues.

Tipp

További hibaelhárítási információk és útmutatás: Cognitive Services tárolók gyakori kérdései (GYIK).For more troubleshooting information and guidance, see Cognitive Services containers frequently asked questions (FAQ).

SzámlázásBilling

A beszédfelismerési tárolók számlázási adatokat küldenek az Azure-nak az Azure-fiókjában lévő beszédfelismerési erőforrás használatával.The Speech containers send billing information to Azure, using a Speech resource on your Azure account.

A tárolóra irányuló lekérdezések számlázása az Azure-erőforrás díjszabási szintjénél történik ApiKey.Queries to the container are billed at the pricing tier of the Azure resource that's used for the ApiKey.

Az Azure Cognitive Services-tárolók nem rendelkeznek licenccel a mérési/számlázási végponthoz való csatlakozás nélkül.Azure Cognitive Services containers aren't licensed to run without being connected to the metering / billing endpoint. Engedélyeznie kell a tárolókat, hogy mindig a számlázási végponttal kommunikáljanak a számlázási adatokkal.You must enable the containers to communicate billing information with the billing endpoint at all times. Cognitive Services tárolók nem küldenek ügyféladatokat, például az elemzett képet vagy szöveget a Microsoftnak.Cognitive Services containers don't send customer data, such as the image or text that's being analyzed, to Microsoft.

Csatlakozás az Azure szolgáltatáshozConnect to Azure

A tárolónak a számlázási argumentum értékeit kell futtatnia.The container needs the billing argument values to run. Ezek az értékek lehetővé teszik a tárolónak a számlázási végponthoz való kapcsolódást.These values allow the container to connect to the billing endpoint. A tároló 10 – 15 percen belül jelentést készít a használatról.The container reports usage about every 10 to 15 minutes. Ha a tároló nem csatlakozik az Azure-hoz az engedélyezett időtartományon belül, a tároló továbbra is futni fog, de addig nem szolgál lekérdezéseket, amíg a számlázási végpont vissza nem áll.If the container doesn't connect to Azure within the allowed time window, the container continues to run but doesn't serve queries until the billing endpoint is restored. A rendszer 10 – 15 percen belül 10 alkalommal kísérli meg a kapcsolódást.The connection is attempted 10 times at the same time interval of 10 to 15 minutes. Ha a 10 próbálkozáson belül nem tud csatlakozni a számlázási végponthoz, a tároló leállítja a kérelmek kiszolgálását.If it can't connect to the billing endpoint within the 10 tries, the container stops serving requests.

Számlázási argumentumokBilling arguments

docker run A parancs elindítja a tárolót, ha mind a három következő beállítás érvényes értékkel rendelkezik:The docker run command will start the container when all three of the following options are provided with valid values:

BeállításOption LeírásDescription
ApiKey A számlázási információk nyomon követéséhez használt Cognitive Services erőforrás API-kulcsa.The API key of the Cognitive Services resource that's used to track billing information.
Ennek a beállításnak az értékét a ben Billingmegadott kiépített erőforráshoz tartozó API-kulcsra kell beállítani.The value of this option must be set to an API key for the provisioned resource that's specified in Billing.
Billing A számlázási információk nyomon követéséhez használt Cognitive Services erőforrás végpontja.The endpoint of the Cognitive Services resource that's used to track billing information.
Ennek a beállításnak az értékét egy kiépített Azure-erőforrás végpont-URI-azonosítójának kell beállítania.The value of this option must be set to the endpoint URI of a provisioned Azure resource.
Eula Azt jelzi, hogy elfogadta a tároló licencét.Indicates that you accepted the license for the container.
Ennek a beállításnak az értékét az elfogadásértékre kell beállítani.The value of this option must be set to accept.

További információ ezekről a beállításokról: tárolók konfigurálása.For more information about these options, see Configure containers.

BlogbejegyzésekBlog posts

Fejlesztői mintákDeveloper samples

A fejlesztői minták a GitHub- tárházbanérhetők el.Developer samples are available at our GitHub repository.

Webes előadás megtekintéseView webinar

Csatlakozzon a webes előadáshoz, és ismerkedjen meg a következőket:Join the webinar to learn about:

  • Cognitive Services üzembe helyezése bármely gépen a Docker használatávalHow to deploy Cognitive Services to any machine using Docker
  • Cognitive Services üzembe helyezése az AK-banHow to deploy Cognitive Services to AKS

ÖsszefoglalásSummary

Ebben a cikkben megtanulta a beszédfelismerési tárolók letöltésére, telepítésére és futtatására vonatkozó fogalmakat és munkafolyamatokat.In this article, you learned concepts and workflow for downloading, installing, and running Speech containers. Összegezve:In summary:

  • A Speech négy Linux-tárolót biztosít a Docker számára, és különböző képességeket ágyaz be:Speech provides four Linux containers for Docker, encapsulating various capabilities:
    • DiktálásSpeech-to-text
    • Custom Speech – szövegCustom Speech-to-text
    • SzövegfelolvasásText-to-speech
    • Egyéni szöveg – beszédCustom Text-to-speech
  • A tároló lemezképeit a rendszer az Azure-beli tároló-beállításjegyzékből tölti le.Container images are downloaded from the container registry in Azure.
  • A tároló lemezképei a Docker-ben futnak.Container images run in Docker.
  • Annak megadása, hogy a REST API (csak szöveg – beszéd) vagy az SDK (beszéd – szöveg vagy szöveg – beszéd) használatával kell-e megadnia a tároló gazda URI-JÁT.Whether using the REST API (Text-to-speech only) or the SDK (Speech-to-text or Text-to-speech) you specify the host URI of the container.
  • A tárolók példányának létrehozásakor számlázási adatokat kell megadnia.You're required to provide billing information when instantiating a container.

Fontos

Cognitive Services tárolók nem futtathatók az Azure-hoz való csatlakozás nélkül.Cognitive Services containers are not licensed to run without being connected to Azure for metering. Az ügyfeleknek engedélyeznie kell, hogy a tárolók a számlázási adatokat mindig a mérési szolgáltatással kommunikáljanak.Customers need to enable the containers to communicate billing information with the metering service at all times. Cognitive Services tárolók nem küldenek ügyféladatokat (például az elemzett képet vagy szöveget) a Microsoftnak.Cognitive Services containers do not send customer data (e.g., the image or text that is being analyzed) to Microsoft.

További lépésekNext steps