Tekst-naar-spraakcontainers met Docker

Artikel
01/23/2024

De neurale tekst naar spraakcontainer converteert tekst naar natuurlijke spraak met behulp van deep neurale netwerktechnologie, waardoor natuurlijkere gesynthetiseerde spraak mogelijk is. In dit artikel leert u hoe u een tekst-naar-spraakcontainer downloadt, installeert en uitvoert.

Voor meer informatie over vereisten, valideren dat een container wordt uitgevoerd, meerdere containers op dezelfde host uitvoeren en niet-verbonden containers uitvoeren, raadpleegt u Speech-containers installeren en uitvoeren met Docker.

Containerinstallatiekopieën

De neurale tekst naar spraakcontainerinstallatiekopie voor alle ondersteunde versies en landinstellingen vindt u in het MCR-syndicat (Microsoft Container Registry). Deze bevindt zich in de azure-cognitive-services/speechservices/ opslagplaats en heeft de naam neural-text-to-speech.

De volledig gekwalificeerde containerinstallatiekopieënnaam is. mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech Voeg een specifieke versie toe of voeg toe :latest om de meest recente versie op te halen.

Versie	Pad
Laatste	`mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:latest` De `latest` tag haalt de `en-US` landinstelling en `en-us-arianeural` stem op.
3.1.0	`mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:3.1.0-amd64-en-us-arianeural`

Alle tags, met uitzondering van latest, hebben de volgende indeling en zijn hoofdlettergevoelig:

<major>.<minor>.<patch>-<platform>-<voice>-<preview>

De tags zijn ook beschikbaar in JSON-indeling voor uw gemak. De hoofdtekst bevat het containerpad en de lijst met tags. De tags worden niet gesorteerd op versie, maar "latest" worden altijd opgenomen aan het einde van de lijst, zoals wordt weergegeven in dit fragment:

{
  "name": "azure-cognitive-services/speechservices/neural-text-to-speech",
  "tags": [
    <--redacted for brevity-->
    "3.1.0-amd64-en-us-arianeural",
    "3.1.0-amd64-en-us-guyneural",
    "3.1.0-amd64-en-us-jennymultilingualneural",
    "3.1.0-amd64-en-us-jennyneural",
    "3.1.0-amd64-en-us-michelleneural",
    "3.1.0-amd64-es-es-alvaroneural",
    "3.1.0-amd64-es-es-elviraneural",
    "3.1.0-amd64-es-mx-candelaneural",
    "3.1.0-amd64-es-mx-dalianeural",
    "3.1.0-amd64-es-mx-jorgeneural",
    <--redacted for brevity-->
    "latest"
  ]
}

Belangrijk

We hebben de standaard spraaksynthesestemmen en standaardtekst op 31 augustus 2021 buiten gebruik gesteld. Gebruik in plaats daarvan neurale stemmen met de neurale-tekst-naar-spraakcontainer versie 3.0 en hoger.

Vanaf 29 februari 2024 worden de tekst naar spraak en neurale tekst naar spraakcontainerversie 2.19 en eerder niet ondersteund. Zie Migreren van standaardstem naar vooraf samengestelde neurale spraak voor meer informatie over het bijwerken van uw toepassing.

De containerinstallatiekopie ophalen met docker pull

U hebt de vereisten nodig, inclusief vereiste hardware. Zie ook de aanbevolen toewijzing van resources voor elke Speech-container.

Gebruik de opdracht docker pull om een containerinstallatiekopie te downloaden uit Microsoft Container Registry:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:latest

Belangrijk

De latest tag haalt de en-US landinstelling en en-us-arianeural stem op. Zie tekst naar spraakcontainerinstallatiekopieën voor aanvullende landinstellingen en stemmen.

De container uitvoeren met docker-uitvoering

Gebruik de opdracht docker run om de container uit te voeren.

Neurale tekst naar spraak
Niet-verbonden neurale tekst naar spraak

De volgende tabel vertegenwoordigt de verschillende docker run parameters en de bijbehorende beschrijvingen:

Parameter	Description
`{ENDPOINT_URI}`	Het eindpunt is vereist voor het meten en factureren. Zie factureringsargumenten voor meer informatie.
`{API_KEY}`	De API-sleutel is vereist. Zie factureringsargumenten voor meer informatie.

Wanneer u de tekst naar spraakcontainer uitvoert, configureert u de poort, het geheugen en de CPU op basis van de vereisten en aanbevelingen voor spraakcontainers.

Hier volgt een voorbeeldopdracht docker run met tijdelijke aanduidingen. U moet de ENDPOINT_URI en API_KEY waarden opgeven:

docker run --rm -it -p 5000:5000 --memory 12g --cpus 6 \
mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Met deze opdracht gebeurt het volgende:

Voert een neurale tekst naar spraakcontainer uit vanuit de containerinstallatiekopie.
Wijst 6 CPU-kernen en 12 GB geheugen toe.
Maakt TCP-poort 5000 beschikbaar en wijst een pseudo-TTY toe voor de container.
Hiermee wordt de container automatisch verwijderd nadat deze is afgesloten. De containerinstallatiekopie is nog steeds beschikbaar op de hostcomputer.

Als u niet-verbonden containers wilt uitvoeren (niet verbonden met internet), moet u dit aanvraagformulier indienen en wachten op goedkeuring. Zie Containers gebruiken in niet-verbonden omgevingen in de documentatie van Azure AI-services voor meer informatie over het toepassen en aanschaffen van een toezeggingsplan voor het gebruik van containers in niet-verbonden omgevingen .

Als u bent goedgekeurd om de container uit te voeren die is losgekoppeld van internet, ziet u in het volgende voorbeeld de opmaak van de docker run opdracht die moet worden gebruikt, met tijdelijke aanduidingen. Vervang deze tijdelijke aanduidingen door uw eigen waarden.

De DownloadLicense=True parameter in uw docker run opdracht downloadt een licentiebestand om uw Docker-container uit te voeren wanneer deze niet is verbonden met internet. Het bevat ook een vervaldatum, waarna het licentiebestand ongeldig is om de container uit te voeren. U kunt alleen een licentiebestand gebruiken met de juiste container waarvoor u bent goedgekeurd. U kunt bijvoorbeeld geen licentiebestand gebruiken voor een speech-to-text container met een neural-text-to-speech container.

Plaatsaanduiding	Beschrijving
`{IMAGE}`	De containerinstallatiekopieën die u wilt gebruiken. Bijvoorbeeld: `mcr.microsoft.com/azure-cognitive-services/neural-text-to-speech:latest`
`{LICENSE_MOUNT}`	Het pad waar de licentie is gedownload en gekoppeld. Bijvoorbeeld: `/host/license:/path/to/license/directory`
`{ENDPOINT_URI}`	Het eindpunt voor het verifiëren van uw serviceaanvraag. U vindt deze op de pagina Sleutel en eindpunt van uw resource, in Azure Portal. Bijvoorbeeld: `https://<your-resource-name>.cognitiveservices.azure.com`
`{API_KEY}`	De sleutel voor uw Spraak-resource. U vindt deze op de pagina Sleutel en eindpunt van uw resource, in Azure Portal.
`{CONTAINER_LICENSE_DIRECTORY}`	Locatie van de licentiemap in het lokale bestandssysteem van de container. Bijvoorbeeld: `/path/to/license/directory`

docker run --rm -it -p 5000:5000 \ 
-v {LICENSE_MOUNT} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}

Zodra het licentiebestand is gedownload, kunt u de container uitvoeren in een niet-verbonden omgeving. In het volgende voorbeeld ziet u de opmaak van de opdracht die docker run u gebruikt, met tijdelijke aanduidingen. Vervang deze tijdelijke aanduidingen door uw eigen waarden.

Waar de container ook wordt uitgevoerd, moet het licentiebestand worden gekoppeld aan de container en moet de locatie van de licentiemap in het lokale bestandssysteem van de container worden opgegeven met Mounts:License=. Er moet ook een uitvoerkoppeling worden opgegeven, zodat factureringsgebruiksrecords kunnen worden geschreven.

Tijdelijke aanduiding	Weergegeven als	Opmaak of voorbeeld
`{IMAGE}`	De containerinstallatiekopieën die u wilt gebruiken. Bijvoorbeeld: `mcr.microsoft.com/azure-cognitive-services/neural-text-to-speech:latest`
`{MEMORY_SIZE}`	De juiste grootte van het geheugen dat moet worden toegewezen voor uw container. Bijvoorbeeld: `4g`
`{NUMBER_CPUS}`	Het juiste aantal CPU's dat moet worden toegewezen voor uw container. Bijvoorbeeld: `4`
`{LICENSE_MOUNT}`	Het pad waar de licentie zich bevindt en is gekoppeld. Bijvoorbeeld: `/host/license:/path/to/license/directory`
`{OUTPUT_PATH}`	Het uitvoerpad voor logboekregistratie. Bijvoorbeeld: `/host/output:/path/to/output/directory` Zie de documentatie voor Azure AI-services voor meer informatie.
`{CONTAINER_LICENSE_DIRECTORY}`	Locatie van de licentiemap in het lokale bestandssysteem van de container. Bijvoorbeeld: `/path/to/license/directory`
`{CONTAINER_OUTPUT_DIRECTORY}`	Locatie van de uitvoermap in het lokale bestandssysteem van de container. Bijvoorbeeld: `/path/to/output/directory`

docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \ 
-v {LICENSE_MOUNT} \ 
-v {OUTPUT_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}

Spraakcontainers bieden een standaardmap voor het schrijven van het licentiebestand en het factureringslogboek tijdens runtime. De standaardmappen zijn respectievelijk /license en /output.

Wanneer u deze mappen aan de container wilt koppelen met de docker run -v opdracht, moet u ervoor zorgen dat de map van de lokale computer het eigendom user:group nonroot:nonroot heeft ingesteld voordat u de container uitvoert.

Hier volgt een voorbeeldopdracht voor het instellen van eigendom van bestanden/mappen.

sudo chown -R nonroot:nonroot <YOUR_LOCAL_MACHINE_PATH_1> <YOUR_LOCAL_MACHINE_PATH_2> ...

Zie Speech-containers installeren en uitvoeren met Docker voor meer informatie over docker run spraakcontainers.

De container gebruiken

Spraakcontainers bieden websocket-api's voor query-eindpunten die toegankelijk zijn via de Speech SDK en Speech CLI. De Speech SDK en Speech CLI maken standaard gebruik van de openbare Speech-service. Als u de container wilt gebruiken, moet u de initialisatiemethode wijzigen.

Belangrijk

Wanneer u de Speech-service met containers gebruikt, moet u hostverificatie gebruiken. Als u de sleutel en regio configureert, worden aanvragen naar de openbare Spraak-service verzonden. Resultaten van de Speech-service zijn mogelijk niet wat u verwacht. Aanvragen van niet-verbonden containers mislukken.