Egyéni beszédprojekt létrehozása

Az egyéni beszédprojektek modelleket, betanítási és tesztelési adatkészleteket és üzembehelyezési végpontokat tartalmaznak. Minden projekt egy területi beállításhoz tartozik. Létrehozhat például egy angol nyelvű projektet a Egyesült Államok.

Projekt létrehozása

Egyéni beszédprojekt létrehozásához kövesse az alábbi lépéseket:

  1. Jelentkezzen be a Speech Studióba.

  2. Válassza ki azt az előfizetést és speech-erőforrást, amellyel dolgozni szeretne.

    Fontos

    Ha egyéni modellt fog betanításra hangadatokkal, válasszon egy beszéderőforrás-régiót dedikált hardverrel a hangadatok betanításához. További információkért tekintse meg a Régiók táblában található lábjegyzeteket.

  3. Válassza az Egyéni beszéd>új projekt létrehozása lehetőséget.

  4. A projekt létrehozásához kövesse a varázsló utasításait.

Válassza ki az új projektet név szerint, vagy válassza az Ugrás a projekthez lehetőséget. A bal oldali panelen a következő menüpontok láthatók: Beszédadatkészletek, egyéni modellek betanítása, Modellek tesztelése és Modellek üzembe helyezése.

Projekt létrehozásához használja a spx csr project create parancsot. A kérelemparamétereket az alábbi utasítások szerint hozhatja létre:

  • Adja meg a szükséges language paramétert. A projekt területi beállításának és a tartalmazott adathalmazoknak azonosnak kell lenniük. A területi beállítás később nem módosítható. A Speech CLI language paraméter megfelel a locale JSON-kérés és -válasz tulajdonságának.
  • Adja meg a szükséges name paramétert. Ez az a név, amely a Speech Studióban jelenik meg. A Speech CLI name paraméter megfelel a displayName JSON-kérés és -válasz tulajdonságának.

Íme egy példa a Speech CLI-parancsra, amely létrehoz egy projektet:

spx csr project create --api-version v3.1 --name "My Project" --description "My Project Description" --language "en-US"

A válasz törzsének a következő formátumban kell érkeznie:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed",
  "links": {
    "evaluations": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/evaluations",
    "datasets": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/datasets",
    "models": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/models",
    "endpoints": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/endpoints",
    "transcriptions": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/transcriptions"       
  },
  "properties": {
    "datasetCount": 0,
    "evaluationCount": 0,
    "modelCount": 0,
    "transcriptionCount": 0,
    "endpointCount": 0
  },
  "createdDateTime": "2022-05-17T22:15:18Z",
  "locale": "en-US",
  "displayName": "My Project",
  "description": "My Project Description"
}

A válasz törzsének legfelső szintű self tulajdonsága a projekt URI-ja. Ezzel az URI-val részletes információkat kaphat a projekt kiértékeléseiről, adatkészleteiről, modelljeiről, végpontjairól és átiratairól. Ezzel az URI-val is frissíthet vagy törölhet egy projektet.

A Speech CLI projektekhez kapcsolódó súgójához futtassa a következő parancsot:

spx help csr project

Projekt létrehozásához használja a Speech to text REST API Projects_Create műveletét. A kérelem törzsének összeállítása az alábbi utasítások szerint:

  • Állítsa be a szükséges locale tulajdonságot. Ennek kell lennie a tartalmazott adathalmazok területi beállításainak. A területi beállítás később nem módosítható.
  • Állítsa be a szükséges displayName tulajdonságot. Ez az a projektnév, amely a Speech Studióban jelenik meg.

Http POST-kérést készíthet az URI használatával az alábbi Projects_Create példában látható módon. Cserélje le YourSubscriptionKey a Speech erőforráskulcsát, cserélje le YourServiceRegion a Speech erőforrásterületre, és állítsa be a kérés törzstulajdonságait a korábban leírtak szerint.

curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey" -H "Content-Type: application/json" -d '{
  "displayName": "My Project",
  "description": "My Project Description",
  "locale": "en-US"
} '  "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/projects"

A válasz törzsének a következő formátumban kell érkeznie:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed",
  "links": {
    "evaluations": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/evaluations",
    "datasets": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/datasets",
    "models": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/models",
    "endpoints": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/endpoints",
    "transcriptions": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/1cdfa276-0f9d-425b-a942-5f2be93017ed/transcriptions"       
  },
  "properties": {
    "datasetCount": 0,
    "evaluationCount": 0,
    "modelCount": 0,
    "transcriptionCount": 0,
    "endpointCount": 0
  },
  "createdDateTime": "2022-05-17T22:15:18Z",
  "locale": "en-US",
  "displayName": "My Project",
  "description": "My Project Description"
}

A válasz törzsének legfelső szintű self tulajdonsága a projekt URI-ja. Ezzel az URI-val részletes információkat kaphat a projekt kiértékeléseiről, adatkészleteiről, modelljeiről, végpontjairól és átiratairól. Ezzel az URI-val is frissíthet vagy törölhet egy projektet.

A modell kiválasztása

Az egyéni beszédmodellek használatának néhány módszere van:

  • Az alapmodell számos forgatókönyvhöz biztosít pontos beszédfelismerést. Az alapmodellek rendszeres frissítése a pontosság és a minőség javítása érdekében. Javasoljuk, hogy alapmodellek használata esetén használja a legújabb alapértelmezett alapmodelleket. Ha egy szükséges testreszabási funkció csak egy régebbi modellel érhető el, akkor választhat egy régebbi alapmodellt.
  • Az egyéni modell kibővíti az alapmodellt, hogy az az egyéni tartomány minden területén megosztott tartományspecifikus szókincset tartalmazzon.
  • Több egyéni modell is használható, ha az egyéni tartomány több területtel rendelkezik, amelyek mindegyike egy adott szókészlettel rendelkezik.

Az egyik ajánlott módszer annak megtekintésére, hogy az alapmodell elegendő-e az alapmodellből előállított átirat elemzéséhez, és hasonlítsa össze egy emberileg létrehozott átirattal ugyanahhoz a hanghoz. Összehasonlíthatja az átiratokat, és lekérjük a szavak hibaarányának (WER) pontszámát. Ha a WER-pontszám magas, ajánlott egyéni modellt betaníteni a helytelenül azonosított szavak felismerésére.

Több modell használata javasolt, ha a szókincs a tartomány különböző területein eltérő. Az olimpiai kommentátorok például különböző eseményekről számolnak be, amelyek mindegyike saját csúcspontjaihoz van társítva. Mivel minden olimpiai esemény szókincse jelentősen eltér a többitől, az eseményre jellemző egyéni modell létrehozása növeli a pontosságot azáltal, hogy korlátozza a kimondott szöveg adatait az adott eseményhez képest. Ennek eredményeképpen a modellnek nem kell átszeletelnie a nem kapcsolódó adatokat, hogy egyezést hozzon létre. Ettől függetlenül a betanításhoz továbbra is megfelelő számú betanítási adat szükséges. Vegye fel a különböző kommentátorok hangjait, akik különböző ékezetekkel, nemekkel, életkorsal stb. rendelkeznek.

Modell stabilitása és életciklusa

Az egyéni beszédet használó végponton üzembe helyezett alapmodell vagy egyéni modell mindaddig javítva lesz, amíg ön nem dönt a frissítés mellett. A beszédfelismerés pontossága és minősége egységes marad, még akkor is, ha új alapmodellt ad ki. Ez lehetővé teszi egy adott modell viselkedésének zárolását, amíg el nem dönt egy újabb modell használata mellett.

Akár saját modellt tanít be, akár egy alapmodell pillanatképét használja, korlátozott ideig használhatja a modellt. További információ: Modell és végpont életciklusa.

Következő lépések