Datasets - Create

Nahraje a vytvoří novou datovou sadu načtením dat ze zadané adresy URL nebo začne čekat na nahrání datových bloků.

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

Parametry identifikátoru URI

Name V Vyžadováno Typ Description
endpoint
path True

string

Podporované koncové body služeb Cognitive Services (protokol a název hostitele, například: https://westus.api.cognitive.microsoft.com).

Text požadavku

Name Vyžadováno Typ Description
displayName True

string

Zobrazovaný název objektu.

kind True

DatasetKind

DatasetKind
Typ importu dat

locale True

string

Národní prostředí obsažených dat.

contentUrl

string

Adresa URL dat pro datovou sadu

customProperties

object

Vlastní vlastnosti této entity. Maximální povolená délka klíče je 64 znaků, maximální délka povolené hodnoty je 256 znaků a počet povolených položek je 10.

description

string

Popis objektu.

project

EntityReference

EntityReference

properties

DatasetProperties

Datové sadyVlastnosti

Odpovědi

Name Typ Description
201 Created

Dataset

Odpověď obsahuje informace o entitě jako datové části a jejím umístění jako hlavičce.

Headers

Location: string

Other Status Codes

Error

Došlo k chybě.

Zabezpečení

Ocp-Apim-Subscription-Key

Tady zadejte svůj klíč účtu služeb Cognitive Services.

Type: apiKey
In: header

Authorization

Zadejte přístupový token z JWT vrácený službou STS této oblasti. Nezapomeňte do tokenu přidat obor správy přidáním následujícího řetězce dotazu do adresy URL služby STS: ?scope=speechservicesmanagement.

Type: apiKey
In: header

Příklady

Create a dataset with content url
Create dataset from data blocks

Create a dataset with content url

Sample Request

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

{
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/location",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Sample Response

Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
  },
  "properties": {
    "textNormalizationKind": "Default",
    "acceptedLineCount": 11,
    "rejectedLineCount": 2,
    "duration": "PT4M12S"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "Succeeded",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Create dataset from data blocks

Sample Request

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

{
  "kind": "Acoustic",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Sample Response

{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files",
    "commitBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks:commit",
    "listBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks",
    "uploadBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "NotStarted",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Definice

Name Description
Dataset

Datová sada

DatasetKind

DatasetKind

DatasetLinks

Odkazy na datové sady

DatasetProperties

Datové sadyVlastnosti

DetailedErrorCode

Podrobný kód chyby

EntityError

Chyba entity

EntityReference

EntityReference

Error

Chyba

ErrorCode

ErrorCode

InnerError

Vnitřní chyba

Status

Stav

TextNormalizationKind

TextNormalizationKind

Dataset

Datová sada

Name Typ Description
contentUrl

string

Adresa URL dat pro datovou sadu

createdDateTime

string

Časové razítko, kdy byl objekt vytvořen. Časové razítko je kódováno jako formát data a času ISO 8601 ("RRRR-MM-DDThh:mm:ssZ", viz https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

customProperties

object

Vlastní vlastnosti této entity. Maximální povolená délka klíče je 64 znaků, maximální délka povolené hodnoty je 256 znaků a počet povolených položek je 10.

description

string

Popis objektu.

displayName

string

Zobrazovaný název objektu.

kind

DatasetKind

DatasetKind
Typ importu dat

lastActionDateTime

string

Časové razítko, kdy byl zadán aktuální stav. Časové razítko je kódováno jako formát data a času ISO 8601 ("RRRR-MM-DDThh:mm:ssZ", viz https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

links

DatasetLinks

Odkazy na datové sady

locale

string

Národní prostředí obsažených dat.

project

EntityReference

EntityReference

properties

DatasetProperties

Datové sadyVlastnosti

self

string

Umístění této entity.

status

Status

Stav
Popis aktuálního stavu rozhraní API

DatasetKind

DatasetKind

Name Typ Description
Acoustic

string

Akustická datová sada.

AudioFiles

string

Datová sada zvukových souborů.

Language

string

Jazyková datová sada.

LanguageMarkdown

string

Datová sada markdownu jazyka.

OutputFormatting

string

Datová sada obsahující pravidla pro přizpůsobení normalizace inverzního textu, velká písmena, přeformátování, vulgární výrazy a také definuje testy pro ověření datové sady.

Pronunciation

string

Datová sada výslovnosti.

Odkazy na datové sady

Name Typ Description
commitBlocks

string

Umístění pro potvrzení seznamu bloků při nahrávání datové sady pomocí bloků Další podrobnosti najdete v operaci "Datasets_CommitBlocks".

files

string

Umístění pro získání všech souborů této entity Další podrobnosti najdete v operaci "Datasets_ListFiles".

listBlocks

string

Umístění pro výpis již nahraných bloků této entity při nahrávání datové sady pomocí bloků Další podrobnosti najdete v části operace "Datasets_GetBlocks".

uploadBlocks

string

Umístění, do které se mají nahrát bloky při nahrávání datové sady pomocí bloků Další podrobnosti najdete v operaci "Datasets_UploadBlock".

DatasetProperties

Datové sadyVlastnosti

Name Typ Description
acceptedLineCount

integer

Počet řádků přijatých pro tuto sadu dat.

duration

string

Celková doba trvání datových sad, pokud obsahují zvukové soubory. Doba trvání je zakódovaná jako doba trvání ISO 8601 ("PnYnMnDTnHnMnS", viz https://en.wikipedia.org/wiki/ISO_8601#Durations).

email

string

E-mailová adresa, na kterou se mají odesílat e-mailová oznámení pro případ, že se operace dokončí. Hodnota se po úspěšném odeslání e-mailu odebere.

error

EntityError

Chyba entity

rejectedLineCount

integer

Počet řádků odmítnutých pro tuto sadu dat.

textNormalizationKind

TextNormalizationKind

TextNormalizationKind
Typ normalizace textu.

DetailedErrorCode

Podrobný kód chyby

Name Typ Description
DataImportFailed

string

Import dat se nezdařil.

DeleteNotAllowed

string

Odstranění není povoleno.

DeployNotAllowed

string

Nasazení není povoleno.

DeployingFailedModel

string

Nasazení neúspěšného modelu

EmptyRequest

string

Prázdný požadavek.

EndpointCannotBeDefault

string

Koncový bod nemůže být výchozí.

EndpointNotUpdatable

string

Koncový bod není možné aktualizovat.

EndpointWithoutLogging

string

Koncový bod bez protokolování.

ExceededNumberOfRecordingsUris

string

Překročili jsme počet nahrávek uris.

FailedDataset

string

Datová sada se nezdařila.

Forbidden

string

Zakázáno.

InUseViolation

string

Porušením používání.

InaccessibleCustomerStorage

string

Nepřístupné úložiště zákazníka.

InvalidAdaptationMapping

string

Neplatné mapování adaptace

InvalidBaseModel

string

Neplatný základní model.

InvalidCallbackUri

string

Neplatný identifikátor URI zpětného volání

InvalidCollection

string

Neplatná kolekce.

InvalidDataset

string

Neplatná datová sada

InvalidDocument

string

Neplatný dokument.

InvalidDocumentBatch

string

Neplatná dávka dokumentu.

InvalidLocale

string

Neplatné národní prostředí.

InvalidLogDate

string

Neplatné datum protokolu

InvalidLogEndTime

string

Neplatný koncový čas protokolu.

InvalidLogId

string

Neplatné ID protokolu.

InvalidLogStartTime

string

Neplatný čas spuštění protokolu.

InvalidModel

string

Neplatný model.

InvalidModelUri

string

Neplatný identifikátor URI modelu

InvalidParameter

string

Neplatný parametr.

InvalidParameterValue

string

Neplatná hodnota parametru

InvalidPayload

string

Neplatná datová část.

InvalidPermissions

string

Neplatná oprávnění.

InvalidPrerequisite

string

Neplatný předpoklad.

InvalidProductId

string

Neplatné ID produktu.

InvalidProject

string

Neplatný projekt.

InvalidProjectKind

string

Neplatný druh projektu.

InvalidRecordingsUri

string

Neplatný identifikátor URI nahrávek

InvalidRequestBodyFormat

string

Neplatný formát textu požadavku.

InvalidSasValidityDuration

string

Neplatná doba platnosti sas.

InvalidSkipTokenForLogs

string

Neplatný token skip pro protokoly.

InvalidSourceAzureResourceId

string

Neplatné ID zdrojového prostředku Azure.

InvalidSubscription

string

Neplatné předplatné.

InvalidTest

string

Neplatný test.

InvalidTimeToLive

string

Neplatný čas do života.

InvalidTopForLogs

string

Neplatná horní část pro protokoly.

InvalidTranscription

string

Neplatný přepis.

InvalidWebHookEventKind

string

Neplatný druh události web hooku

MissingInputRecords

string

Chybí vstupní záznamy.

ModelCopyOperationExists

string

Existuje operace kopírování modelu.

ModelDeploymentNotCompleteState

string

Nasazení modelu není dokončeno.

ModelDeprecated

string

Model je zastaralý.

ModelExists

string

Model existuje.

ModelMismatch

string

Neshoda modelů.

ModelNotDeployable

string

Model nejde nasadit.

ModelVersionIncorrect

string

Nesprávná verze modelu.

NoUtf8WithBom

string

Ne utf8 s bom.

OnlyOneOfUrlsOrContainerOrDataset

string

Pouze jednu z adres URL nebo kontejneru nebo datové sady.

ProjectGenderMismatch

string

Neshoda mezi pohlavími projektu.

QuotaViolation

string

Porušení kvóty.

SingleDefaultEndpoint

string

Jeden výchozí koncový bod.

SkuLimitsExist

string

Existují omezení skladových položek.

SubscriptionNotFound

string

Předplatné se nenašlo.

UnexpectedError

string

Neočekávaná chyba.

UnsupportedClassBasedAdaptation

string

Nepodporovaná adaptace na základě tříd.

UnsupportedDelta

string

Nepodporovaný rozdíl.

UnsupportedDynamicConfiguration

string

Nepodporovaná dynamická konfigurace.

UnsupportedFilter

string

Nepodporovaný filtr.

UnsupportedLanguageCode

string

Nepodporovaný kód jazyka.

UnsupportedOrderBy

string

Nepodporované pořadí podle.

UnsupportedPagination

string

Nepodporované stránkování.

UnsupportedTimeRange

string

Nepodporovaný časový rozsah.

EntityError

Chyba entity

Name Typ Description
code

string

Kód této chyby.

message

string

Zpráva pro tuto chybu.

EntityReference

EntityReference

Name Typ Description
self

string

Umístění odkazované entity.

Error

Chyba

Name Typ Description
code

ErrorCode

ErrorCode
Kódy chyb vysoké úrovně.

details

Error[]

Další podrobnosti podpory týkající se chyby nebo očekávaných zásad

innerError

InnerError

Vnitřní chyba
Nový formát vnitřní chyby, který odpovídá pokynům k rozhraní API služeb Cognitive Services, které jsou k dispozici na adrese https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Obsahuje požadované vlastnosti ErrorCode, message a optional properties target, details(key value pair), inner error (to může být vnořené).

message

string

Chybová zpráva vysoké úrovně.

target

string

Zdroj chyby. Například v případě neplatného dokumentu by to byly "dokumenty" nebo "ID dokumentu".

ErrorCode

ErrorCode

Name Typ Description
Conflict

string

Představuje kód chyby konfliktu.

Forbidden

string

Představuje zakázaný kód chyby.

InternalCommunicationFailed

string

Představuje kód chyby selhání interní komunikace.

InternalServerError

string

Představuje kód vnitřní chyby serveru.

InvalidArgument

string

Představuje neplatný kód chyby argumentu.

InvalidRequest

string

Představuje neplatný kód chyby požadavku.

NotAllowed

string

Představuje nepovolený kód chyby.

NotFound

string

Představuje kód chyby nenalezena.

PipelineError

string

Představuje kód chyby kanálu.

ServiceUnavailable

string

Představuje kód chyby nedostupné služby.

TooManyRequests

string

Představuje kód chyby příliš mnoho požadavků.

Unauthorized

string

Představuje neoprávněný kód chyby.

UnprocessableEntity

string

Představuje nezpracovaný kód chyby entity.

UnsupportedMediaType

string

Představuje kód chyby nepodporovaného typu média.

InnerError

Vnitřní chyba

Name Typ Description
code

DetailedErrorCode

Podrobný kód chyby
Podrobný výčet kódu chyby

details

object

Další podrobnosti podpory týkající se chyby nebo očekávaných zásad

innerError

InnerError

Vnitřní chyba
Nový formát vnitřní chyby, který odpovídá pokynům k rozhraní API služeb Cognitive Services, které jsou k dispozici na adrese https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Obsahuje požadované vlastnosti ErrorCode, message a optional properties target, details(key value pair), inner error (to může být vnořené).

message

string

Chybová zpráva vysoké úrovně.

target

string

Zdroj chyby. Například v případě neplatného dokumentu by to byly "dokumenty" nebo "ID dokumentu".

Status

Stav

Name Typ Description
Failed

string

Dlouhotrvající operace selhala.

NotStarted

string

Dlouhotrvající operace ještě nebyla spuštěna.

Running

string

Dlouhotrvající operace se právě zpracovává.

Succeeded

string

Dlouhotrvající operace se úspěšně dokončila.

TextNormalizationKind

TextNormalizationKind

Name Typ Description
Default

string

Výchozí normalizace textu (např. "2 až 3" se v en-US nahrazuje slovem "two to three" (dva až tři).

None

string

U vstupního textu se nepoužije žádná normalizace textu. Jedná se o možnost přepsání, která by se měla použít pouze v případě, že je text před nahráním normalizován.