Migrace kódu z verze 3.1 na v3.2 rozhraní REST API

Rozhraní REST API pro převod řeči na text se používá pro dávkový přepis a vlastní řeč. Tento článek popisuje změny verze 3.1 na 3.2.

Důležité

Rozhraní REST API pro převod řeči na text verze 3.2 je k dispozici ve verzi Preview. Rozhraní REST API pro převod řeči na text verze 3.1 je obecně dostupné. Rozhraní REST API pro převod řeči na text verze 3.0 bude vyřazeno 1. dubna 2026. Další informace najdete v průvodcích migrací rozhraní REST API pro převod řeči na text v3.0 na verzi 3.1 a v3.1 do verze 3.2 .

Základní cesta

Je nutné aktualizovat základní cestu v kódu z /speechtotext/v3.1 do /speechtotext/v3.2-preview.2. Pokud například chcete získat základní modely v eastus oblasti, použijte https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/models/base místo https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base.

Další informace najdete v části ID operací dále v této příručce.

Dávkový přepis

Důležité

Nové ceny platí pro dávkový přepis prostřednictvím rozhraní REST API pro převod řeči na text v3.2. Další informace najdete v průvodci cenami.

Omezení zpětné kompatibility

Nepoužívejte službu Speech k textovému rozhraní REST API verze 3.0 nebo v3.1 k načtení přepisu vytvořeného prostřednictvím rozhraní REST API pro převod řeči na text v3.2. Může se zobrazit chybová zpráva typu Verze rozhraní API se nedá použít pro přístup k tomuto přepisu. Použijte rozhraní API verze 3.2 nebo vyšší."

Režim identifikace jazyka

Je LanguageIdentificationMode přidán jako LanguageIdentificationPropertiescandidateLocalesspeechModelMappingstejné a . Režimy, které jsou k dispozici pro identifikaci jazyka, jsou Continuous nebo Single. Výchozí je průběžná identifikace jazyka. Další informace naleznete v tématu Identifikace jazyka.

Šeptající modely

Azure AI Speech teď podporuje model šeptající OpenAI prostřednictvím rozhraní REST API pro text v3.2. Další informace najdete v průvodci vytvořením dávkového přepisu .

Poznámka:

Služba Azure OpenAI podporuje také model šeptajícího jazyka OpenAI pro převod řeči na text pomocí synchronního rozhraní REST API. Další informace najdete v rychlém startu. Podívejte se na model Šeptaní? Dozvíte se více o tom, kdy používat Službu Azure AI Speech vs. Azure OpenAI.

Vlastní řeč

Důležité

Pokud byl základní model vytvořen 1. října 2023 a novější, budou se vám účtovat poplatky za trénování vlastního modelu řeči. Pokud byl základní model vytvořen před říjnem 2023, neúčtují se vám poplatky za trénování. Další informace najdete v tématu Ceny služby Azure AI Speech.

Pokud chcete programově určit, zda byl model vytvořen před nebo po 1. říjnu 2023, použijte chargedForAdaptation vlastnost, která je nová ve verzi 3.2.

Vlastní formátování textu pro zobrazení

Pokud chcete podporovat přizpůsobení modelu s vlastními daty formátování textu pro zobrazení, operace Datasets_Create podporuje typ dat OutputFormatting. Další informace najdete v tématu nahrání datových sad.

Byla přidána definice pro OutputFormatType hodnoty výčtu Lexical a Display výčtu.

"OutputFormatType": {
    "title": "OutputFormatType",
    "enum": [
        "Lexical",
        "Display"
    ],
    "type": "string",
    "x-ms-enum": {
        "name": "OutputFormatType",
        "modelAsString": true,
        "values": [
            {
                "value": "Lexical",
                "description": "Model provides the transcription output without formatting."
            },
            {
                "value": "Display",
                "description": "Model supports display formatting transcriptions output or endpoints."
            }
        ]
    }
},

Hodnota OutputFormattingData výčtu se přidá do FileKind (typ vstupních dat).

Vlastnost supportedOutputFormat je přidána do BaseModelFeatures. Tato vlastnost se nachází v definici BaseModel .

"BaseModelFeatures": {
    "title": "BaseModelFeatures",
    "description": "Features supported by the model.",
    "type": "object",
    "allOf": [
        {
            "$ref": "#/definitions/SharedModelFeatures"
        }
    ],
    "properties": {
        "supportsAdaptationsWith": {
            "description": "Supported dataset kinds to adapt the model.",
            "type": "array",
            "items": {
                "$ref": "#/definitions/DatasetKind"
            },
            "readOnly": true
        },
        "supportedOutputFormat": {
            "description": "Supported output formats.",
            "type": "array",
            "items": {
                "$ref": "#/definitions/OutputFormatType"
            },
            "readOnly": true
        }
    }
},

Poplatek za přizpůsobení

Vlastnost chargeForAdaptation je přidána do BaseModelProperties. Tato vlastnost se nachází v definici BaseModel .

Důležité

Pokud byl základní model vytvořen 1. října 2023 a novější, budou se vám účtovat poplatky za trénování vlastního modelu řeči. Pokud byl základní model vytvořen před říjnem 2023, neúčtují se vám poplatky za trénování. Další informace najdete v tématu Ceny služby Azure AI Speech.

Pokud je truehodnota chargeForAdaptation , bude se vám účtovat trénování modelu. Pokud je falsehodnota, účtuje se vám trénování modelu. chargeForAdaptation Pomocí vlastnosti místo data vytvoření můžete programově určit, jestli se vám bude účtovat trénování modelu.

"BaseModelProperties": {
    "title": "BaseModelProperties",
    "type": "object",
    "properties": {
        "deprecationDates": {
            "$ref": "#/definitions/BaseModelDeprecationDates"
        },
        "features": {
            "$ref": "#/definitions/BaseModelFeatures"
        },
        "chargeForAdaptation": {
            "description": "A value indicating whether model adaptation is charged.",
            "type": "boolean",
            "readOnly": true
        }
    }
},

Normalizace textu

Vlastnost textNormalizationKind je přidána do DatasetProperties.

Definice entity pro TextNormalizationKind: Druh normalizace textu.

  • Výchozí: Výchozí normalizace textu (například "dva až tři" nahradí hodnotu 2 až 3 v en-US).
  • Žádné: U vstupního textu se nepoužije normalizace textu. Tato hodnota je možnost přepsání, která by měla být použita pouze v případě, že je text normalizován před odesláním.

Vlastnosti vyhodnocení

Přidání vlastností počtu tokenů a chyb tokenu EvaluationProperties do vlastností:

  • correctTokenCount1: Počet správně rozpoznaných tokenů podle modelu 1.
  • tokenCount1: Počet zpracovaných tokenů podle modelu 1.
  • tokenDeletionCount1: Počet rozpoznanýchtokenchch
  • tokenErrorRate1: Míra chyb tokenu rozpoznávání pomocí modelu 1.
  • tokenInsertionCount1: Počet rozpoznaných tokenů podle modelu 1, které jsou vloženy.
  • tokenSubstitutionCount1: Počet rozpoznaných slov podle modelu 1, která jsou nahrazována.
  • correctTokenCount2: Počet správně rozpoznaných tokenů podle modelu2.
  • tokenCount2: Počet zpracovaných tokenů podle modelu2.
  • tokenDeletionCount2: Počet rozpoznaných tokenů podle modelu2, které se odstraní.
  • tokenErrorRate2: Míra chyb tokenu rozpoznávání s modelem 2.
  • tokenInsertionCount2: Počet rozpoznaných tokenů podle modelu 2, které jsou vloženy.
  • tokenSubstitutionCount2: Počet rozpoznaných slov podle modelu2, která jsou nahrazována.

Kopírování modelu

Následující změny platí pro scénář, ve kterém model kopírujete.

Přidání nové definice entity pro ModelCopyAuthorization:

"ModelCopyAuthorization": {
    "title": "ModelCopyAuthorization",
    "required": [
        "expirationDateTime",
        "id",
        "sourceResourceId",
        "targetResourceEndpoint",
        "targetResourceId",
        "targetResourceRegion"
    ],
    "type": "object",
    "properties": {
        "targetResourceRegion": {
            "description": "The region (aka location) of the target speech resource (e.g., westus2).",
            "minLength": 1,
            "type": "string"
        },
        "targetResourceId": {
            "description": "The Azure Resource ID of the target speech resource.",
            "minLength": 1,
            "type": "string"
        },
        "targetResourceEndpoint": {
            "description": "The endpoint (base url) of the target resource (with custom domain name when it is used).",
            "minLength": 1,
            "type": "string"
        },
        "sourceResourceId": {
            "description": "The Azure Resource ID of the source speech resource.",
            "minLength": 1,
            "type": "string"
        },
        "expirationDateTime": {
            "format": "date-time",
            "description": "The expiration date of this copy authorization.",
            "type": "string"
        },
        "id": {
            "description": "The ID of this copy authorization.",
            "minLength": 1,
            "type": "string"
        }
    }
},

Přidání nové definice entity pro ModelCopyAuthorizationDefinition:

"ModelCopyAuthorizationDefinition": {
    "title": "ModelCopyAuthorizationDefinition",
    "required": [
        "sourceResourceId"
    ],
    "type": "object",
    "properties": {
        "sourceResourceId": {
            "description": "The Azure Resource ID of the source speech resource.",
            "minLength": 1,
            "type": "string"
        }
    }
},

Byla přidána nová copy vlastnost.

  • copyTo Identifikátor URI: Umístění zastaralé akce kopírování modelu. Další podrobnosti najdete v operaci Models_CopyTo .
  • copy Identifikátor URI: Umístění akce kopírování modelu. Další podrobnosti najdete v operaci Models_Copy .
"CustomModelLinks": {
    "title": "CustomModelLinks",
    "type": "object",
    "properties": {
      "copyTo": {
        "format": "uri",
        "description": "The location to the obsolete model copy action. See operation \"Models_CopyTo\" for more details.",
        "type": "string",
        "readOnly": true
      },
      "copy": {
        "format": "uri",
        "description": "The location to the model copy action. See operation \"Models_Copy\" for more details.",
        "type": "string",
        "readOnly": true
      },
      "files": {
        "format": "uri",
        "description": "The location to get all files of this entity. See operation \"Models_ListFiles\" for more details.",
        "type": "string",
        "readOnly": true
      },
      "manifest": {
        "format": "uri",
        "description": "The location to get a manifest for this model to be used in the on-prem container. See operation \"Models_GetCustomModelManifest\" for more details.",
        "type": "string",
        "readOnly": true
      }
    },
    "readOnly": true
},

ID operací

Je nutné aktualizovat základní cestu v kódu z /speechtotext/v3.1 do /speechtotext/v3.2-preview.2. Pokud například chcete získat základní modely v eastus oblasti, použijte https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/models/base místo https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base.

Další kroky