Delen via


Spraak-naar-tekstcontainers met Docker

De spraak-naar-tekstcontainer transcribeert realtime spraak- of batchaudio-opnamen met tussenliggende resultaten. In dit artikel leert u hoe u een spraak-naar-tekstcontainer downloadt, installeert en uitvoert.

Voor meer informatie over vereisten, valideren dat een container wordt uitgevoerd, meerdere containers op dezelfde host uitvoeren en niet-verbonden containers uitvoeren, raadpleegt u Speech-containers installeren en uitvoeren met Docker.

Containerinstallatiekopieën

De containerinstallatiekopie voor spraak-naar-tekst voor alle ondersteunde versies en landinstellingen vindt u in het MCR-syndicat (Microsoft Container Registry). Deze bevindt zich in de azure-cognitive-services/speechservices/ opslagplaats en heeft de naam speech-to-text.

A screenshot of the search connectors and triggers dialog.

De volledig gekwalificeerde containerinstallatiekopieënnaam is. mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text Voeg een specifieke versie toe of voeg toe :latest om de meest recente versie op te halen.

Versie Pad
Laatste mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:latest

Met latest de tag wordt de meest recente installatiekopie voor de en-US landinstelling opgehaald.
4.6.0 mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:4.6.0-amd64-mr-in

Alle tags, met uitzondering van latest, hebben de volgende indeling en zijn hoofdlettergevoelig:

<major>.<minor>.<patch>-<platform>-<locale>-<prerelease>

De tags zijn ook beschikbaar in JSON-indeling voor uw gemak. De hoofdtekst bevat het containerpad en de lijst met tags. De tags worden niet gesorteerd op versie, maar "latest" worden altijd opgenomen aan het einde van de lijst, zoals wordt weergegeven in dit fragment:

{
  "name": "azure-cognitive-services/speechservices/speech-to-text",
  "tags": [
    "2.10.0-amd64-ar-ae",
    "2.10.0-amd64-ar-bh",
    "2.10.0-amd64-ar-eg",
    "2.10.0-amd64-ar-iq",
    "2.10.0-amd64-ar-jo",
    <--redacted for brevity-->
    "latest"
  ]
}

De containerinstallatiekopie ophalen met docker pull

U hebt de vereisten nodig, inclusief vereiste hardware. Zie ook de aanbevolen toewijzing van resources voor elke Speech-container.

Gebruik de opdracht docker pull om een containerinstallatiekopie te downloaden uit Microsoft Container Registry:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:latest

Belangrijk

Met latest de tag wordt de meest recente installatiekopie voor de en-US landinstelling opgehaald. Zie spraak-naar-tekstcontainerinstallatiekopieën voor aanvullende versies en landinstellingen.

De container uitvoeren met docker-uitvoering

Gebruik de opdracht docker run om de container uit te voeren.

De volgende tabel vertegenwoordigt de verschillende docker run parameters en de bijbehorende beschrijvingen:

Parameter Description
{ENDPOINT_URI} Het eindpunt is vereist voor het meten en factureren. Zie factureringsargumenten voor meer informatie.
{API_KEY} De API-sleutel is vereist. Zie factureringsargumenten voor meer informatie.

Wanneer u de spraak-naar-tekstcontainer uitvoert, configureert u de poort, het geheugen en de CPU op basis van de spraak-naar-tekstcontainervereisten en -aanbevelingen.

Hier volgt een voorbeeldopdracht docker run met tijdelijke aanduidingen. U moet de ENDPOINT_URI en API_KEY waarden opgeven:

docker run --rm -it -p 5000:5000 --memory 8g --cpus 4 \
mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Met deze opdracht gebeurt het volgende:

  • Voert een speech-to-text container uit vanuit de containerinstallatiekopieën.
  • Wijst 4 CPU-kernen en 8 GB geheugen toe.
  • Maakt TCP-poort 5000 beschikbaar en wijst een pseudo-TTY toe voor de container.
  • Hiermee wordt de container automatisch verwijderd nadat deze is afgesloten. De containerinstallatiekopie is nog steeds beschikbaar op de hostcomputer.

Zie Speech-containers installeren en uitvoeren met Docker voor meer informatie over docker run spraakcontainers.

De container gebruiken

Spraakcontainers bieden websocket-api's voor query-eindpunten die toegankelijk zijn via de Speech SDK en Speech CLI. De Speech SDK en Speech CLI maken standaard gebruik van de openbare Speech-service. Als u de container wilt gebruiken, moet u de initialisatiemethode wijzigen.

Belangrijk

Wanneer u de Speech-service met containers gebruikt, moet u hostverificatie gebruiken. Als u de sleutel en regio configureert, worden aanvragen naar de openbare Spraak-service verzonden. Resultaten van de Speech-service zijn mogelijk niet wat u verwacht. Aanvragen van niet-verbonden containers mislukken.

In plaats van deze azure-cloud-initialisatieconfiguratie te gebruiken:

var config = SpeechConfig.FromSubscription(...);

Gebruik deze configuratie met de containerhost:

var config = SpeechConfig.FromHost(
    new Uri("ws://localhost:5000"));

In plaats van deze azure-cloud-initialisatieconfiguratie te gebruiken:

auto speechConfig = SpeechConfig::FromSubscription(...);

Gebruik deze configuratie met de containerhost:

auto speechConfig = SpeechConfig::FromHost("ws://localhost:5000");

In plaats van deze azure-cloud-initialisatieconfiguratie te gebruiken:

speechConfig, err := speech.NewSpeechConfigFromSubscription(...)

Gebruik deze configuratie met de containerhost:

speechConfig, err := speech.NewSpeechConfigFromHost("ws://localhost:5000")

In plaats van deze azure-cloud-initialisatieconfiguratie te gebruiken:

SpeechConfig speechConfig = SpeechConfig.fromSubscription(...);

Gebruik deze configuratie met de containerhost:

SpeechConfig speechConfig = SpeechConfig.fromHost("ws://localhost:5000");

In plaats van deze azure-cloud-initialisatieconfiguratie te gebruiken:

const speechConfig = sdk.SpeechConfig.fromSubscription(...);

Gebruik deze configuratie met de containerhost:

const speechConfig = sdk.SpeechConfig.fromHost("ws://localhost:5000");

In plaats van deze azure-cloud-initialisatieconfiguratie te gebruiken:

SPXSpeechConfiguration *speechConfig = [[SPXSpeechConfiguration alloc] initWithSubscription:...];

Gebruik deze configuratie met de containerhost:

SPXSpeechConfiguration *speechConfig = [[SPXSpeechConfiguration alloc] initWithHost:"ws://localhost:5000"];

In plaats van deze azure-cloud-initialisatieconfiguratie te gebruiken:

let speechConfig = SPXSpeechConfiguration(subscription: "", region: "");

Gebruik deze configuratie met de containerhost:

let speechConfig = SPXSpeechConfiguration(host: "ws://localhost:5000");

In plaats van deze azure-cloud-initialisatieconfiguratie te gebruiken:

speech_config = speechsdk.SpeechConfig(
    subscription=speech_key, region=service_region)

Gebruik deze configuratie met het containereindpunt:

speech_config = speechsdk.SpeechConfig(
    host="ws://localhost:5000")

Wanneer u de Speech CLI in een container gebruikt, neemt u de --host ws://localhost:5000/ optie op. U moet ook opgeven --key none om ervoor te zorgen dat de CLI geen spraaksleutel probeert te gebruiken voor verificatie. Zie Aan de slag met de Azure AI Speech CLI voor informatie over het configureren van de Speech CLI.

Probeer de snelstart voor spraak-naar-tekst met behulp van hostverificatie in plaats van sleutel en regio.

Volgende stappen