Uppgradera från Read v2.x till Read v3.x

Den här guiden visar hur du uppgraderar din befintliga container eller moln-API-kod från Läs v2.x till Läs v3.x.

Fastställa din API-sökväg

Använd följande tabell för att fastställa versionssträngen i API-sökvägen baserat på den Read 3.x-version som du migrerar till.

Produkttyp Version Versionssträng i 3.x API-sökväg
Tjänst Läs 3.0, 3.1 eller 3.2 v3.0, v3.1 respektive v3.2
Tjänst Läs 3.2 förhandsversion v3.2-preview.1
Container Läs 3.0 förhandsversion eller Läs 3.1 förhandsversion v3.0 eller v3.1-preview.2 respektive

Använd sedan följande avsnitt för att begränsa dina åtgärder och ersätta versionssträngen i API-sökvägen med värdet från tabellen. För read v3.2 preview cloud and container versions uppdaterar du till exempel API-sökvägen till https://{endpoint}/vision/v3.2-preview.1/read/analyze[?language].

Tjänst/container

Batch Read File

Läs 2.x Läs 3.x
https://{endpoint}/vision/v2.0/read/core/asyncBatchAnalyze https://{endpoint}/vision/<version string>/read/analyze[?language]

Det finns en ny valfri språkparameter. Om du inte känner till språket i dokumentet eller om det kan vara flerspråkigt ska du inte ta med det.

Get Read Results

Läs 2.x Läs 3.x
https://{endpoint}/vision/v2.0/read/operations/{operationId} https://{endpoint}/vision/<version string>/read/analyzeResults/{operationId}

Get Read Operation Result statusflagga

När anropet till Get Read Operation Result lyckas returneras ett statussträngfält i JSON-brödtexten.

Läs 2.x Läs 3.x
"NotStarted" "notStarted"
"Running" "running"
"Failed" "failed"
"Succeeded" "succeeded"

API-svar (JSON)

Observera följande ändringar i json:

  • I v2.x Get Read Operation Result returnerar OCR-igenkännings-json när statusen är Succeeded". I v3.0 är succeededdet här fältet .
  • Om du vill hämta roten för sidmatrisen ändrar du json-hierarkin från recognitionResults till analyzeResult/readResults. Json-hierarkin per sida och ord förblir oförändrade, så inga kodändringar krävs.
  • Sidvinkeln clockwiseOrientation har bytt namn till angle och intervallet har ändrats från 0 till 360 grader till -180 till 180 grader. Beroende på din kod kanske du inte behöver göra ändringar eftersom de flesta matematiska funktioner kan hantera något av intervallen.

V3.0-API:et introducerar även följande förbättringar som du kan använda:

  • createdDateTime och lastUpdatedDateTime läggs till så att du kan spåra bearbetningens varaktighet.
  • version anger vilken version av API:et som används för att generera resultat
  • Ett ord per ord confidence har lagts till. Det här värdet kalibreras så att värdet 0,95 innebär att det finns en 95%-chans att igenkänningen är korrekt. Konfidenspoängen kan användas för att välja vilken text som ska skickas till mänsklig granskning.

I 2.X är utdataformatet följande:

{
    {
    "status": "Succeeded",
    "recognitionResults": [
        {
        "page": 1,
        "language": "en",
        "clockwiseOrientation": 349.59,
        "width": 2661,
        "height": 1901,
        "unit": "pixel",
        "lines": [
            {
            "boundingBox": [
                67,
                646,
                2582,
                713,
                2580,
                876,
                67,
                821
            ],
            "text": "The quick brown fox jumps",
            "words": [
                {
                "boundingBox": [
                    143,
                    650,
                    435,
                    661,
                    436,
                    823,
                    144,
                    824
                ],
                "text": "The",
                },
        // The rest of result is omitted for brevity 
            
}

I v3.0 har den justerats:

{
    {
    "status": "succeeded",
    "createdDateTime": "2020-05-28T05:13:21Z",
    "lastUpdatedDateTime": "2020-05-28T05:13:22Z",
    "analyzeResult": {
    "version": "3.0.0",
    "readResults": [
        {
        "page": 1,
        "language": "en",
        "angle": 0.8551,
        "width": 2661,
        "height": 1901,
        "unit": "pixel",
        "lines": [
            {
            "boundingBox": [
                67,
                646,
                2582,
                713,
                2580,
                876,
                67,
                821
            ],
            "text": "The quick brown fox jumps",
            "words": [
                {
                "boundingBox": [
                    143,
                    650,
                    435,
                    661,
                    436,
                    823,
                    144,
                    824
                ],
                "text": "The",
                "confidence": 0.958
                },
// The rest of result is omitted for brevity 
    
}

Endast molntjänst

Recognize Text

Recognize Text är en förhandsgranskningsåtgärd som är inaktuell i alla versioner av Azure AI Vision API. Du måste migrera från Recognize Text till Read (v3.0) eller Batch Read File (v2.0, v2.1). v3.0 innehåller Read nyare, bättre modeller för textigenkänning och andra funktioner, så det rekommenderas. Så här uppgraderar du från Recognize Text till Read:

Identifiera text 2.x Läs 3.x
https://{endpoint}/vision/v2.0/recognizeText[?mode] https://{endpoint}/vision/<version string>/read/analyze[?language]

Lägesparametern stöds inte i Read. Både handskriven och tryckt text stöds automatiskt.

En ny valfri språkparameter finns i v3.0. Om du inte känner till språket i dokumentet eller om det kan vara flerspråkigt ska du inte ta med det.

Get Recognize Text Operation Result

Identifiera text 2.x Läs 3.x
https://{endpoint}/vision/v2.0/textOperations/{operationId} https://{endpoint}/vision/<version string>/read/analyzeResults/{operationId}

Get Recognize Text Operation Result statusflaggor

När anropet till Get Recognize Text Operation Result lyckas returneras ett statussträngfält i JSON-brödtexten.

Identifiera text 2.x Läs 3.x
"NotStarted" "notStarted"
"Running" "running"
"Failed" "failed"
"Succeeded" "succeeded"

API-svar (JSON)

Observera följande ändringar i json:

  • I v2.x Get Read Operation Result returnerar OCR-igenkännings-json när statusen är Succeeded. I v3.x är succeededdet här fältet .
  • Om du vill hämta roten för sidmatrisen ändrar du json-hierarkin från recognitionResult till analyzeResult/readResults. Json-hierarkin per sida och ord förblir oförändrade, så inga kodändringar krävs.

V3.0-API:et introducerar även följande förbättringar som du kan använda. Mer information finns i API-referensen:

  • createdDateTime och lastUpdatedDateTime läggs till så att du kan spåra bearbetningens varaktighet.
  • version anger vilken version av API:et som används för att generera resultat
  • Ett ord per ord confidence har lagts till. Det här värdet kalibreras så att värdet 0,95 innebär att det finns en 95%-chans att igenkänningen är korrekt. Konfidenspoängen kan användas för att välja vilken text som ska skickas till mänsklig granskning.
  • angle allmän orientering av texten i medsols riktning, mätt i grader mellan (-180, 180].
  • width och "height" ger dig dimensionerna för dokumentet och "unit" tillhandahåller enheten för dessa dimensioner (bildpunkter eller tum, beroende på dokumenttyp.)
  • page multipage-dokument stöds
  • languageindataspråket i dokumentet (från den valfria språkparametern.)

I 2.X är utdataformatet följande:

{
    {
    "status": "Succeeded",
    "recognitionResult": [
        {
        "lines": [
            {
            "boundingBox": [
                67,
                646,
                2582,
                713,
                2580,
                876,
                67,
                821
            ],
            "text": "The quick brown fox jumps",
            "words": [
                {
                "boundingBox": [
                    143,
                    650,
                    435,
                    661,
                    436,
                    823,
                    144,
                    824
                ],
                "text": "The",
                },
// The rest of result is omitted for brevity 
        
}

I v3.x har den justerats:

{
    {
    "status": "succeeded",
    "createdDateTime": "2020-05-28T05:13:21Z",
    "lastUpdatedDateTime": "2020-05-28T05:13:22Z",
    "analyzeResult": {
    "version": "3.0.0",
    "readResults": [
        {
        "page": 1,
        "angle": 0.8551,
        "width": 2661,
        "height": 1901,
        "unit": "pixel",
        "lines": [
            {
            "boundingBox": [
                67,
                646,
                2582,
                713,
                2580,
                876,
                67,
                821
            ],
            "text": "The quick brown fox jumps",
            "words": [
                {
                "boundingBox": [
                    143,
                    650,
                    435,
                    661,
                    436,
                    823,
                    144,
                    824
                ],
                "text": "The",
                "confidence": 0.958
                },
// The rest of result is omitted for brevity 
    
}

Endast container

Synchronous Read

Läs 2.0 Läs 3.x
https://{endpoint}/vision/v2.0/read/core/Analyze https://{endpoint}/vision/<version string>/read/syncAnalyze[?language]