Rövid útmutató: Azure AI Vision v3.2 GA Read

OCR (Olvasás) kiadások

Fontos

Válassza ki a követelményeknek leginkább megfelelő olvasási kiadást.

Bevitel Példák Kiadás olvasása Juttatás
Képek: Általános, vadon élő képek címkék, utcatáblák és plakátok OCR képekhez (4.0-s verzió) Általános, nem dokumentumképekhez optimalizált, teljesítmény-továbbfejlesztett szinkron API-val, amely megkönnyíti az OCR beágyazását a felhasználói élmény forgatókönyveibe.
Dokumentumok: Digitális és szkennelt, képeket is beleértve könyvek, cikkek és jelentések Dokumentumintelligencia-olvasási modell Aszinkron API-val szövegigényes beolvasott és digitális dokumentumokhoz optimalizálva az intelligens dokumentumfeldolgozás nagy léptékű automatizálásához.

Tudnivalók az Azure AI Vision 3.2-s ga-olvasásáról

A legújabb Azure AI Vision v3.2 GA-olvasást keresi? A Read OCR jövőbeli fejlesztései a korábban felsorolt két szolgáltatás részét képezik. Nincsenek további frissítések az Azure AI Vision 3.2-ben. További információ: Az Azure AI Vision 3.2 GA Read API meghívása és rövid útmutató: Azure AI Vision v3.2 GA Read.

Ismerkedés az Azure AI Vision Read REST API-val vagy ügyfélkódtárakkal. A Read API AI-algoritmusokat biztosít a szövegek képekből való kinyeréhez és strukturált sztringekként való visszaadásához. Az alábbi lépéseket követve telepíthet egy csomagot az alkalmazásba, és kipróbálhatja az alapműveletek mintakódját.

Az optikai karakterfelismerési (OCR) ügyféloldali kódtár használatával nyomtatott és kézzel írt szöveget olvashat egy képből. Az OCR szolgáltatás képes beolvasni egy kép látható szövegét, és karakterfolyammá alakítani. A szövegfelismerésről további információt az OCR áttekintésében talál. A jelen szakaszban szereplő kód a legújabb Azure AI Vision-csomagot használja.

Tipp.

Egy helyi képből is kinyerhet szöveget. Lásd a ComputerVisionClient metódusokat, például a ReadInStreamAsyncet. Vagy tekintse meg a GitHub mintakódját a helyi rendszerképeket érintő forgatókönyvekhez.

Referenciadokumentáció Kódtár forráskódcsomagja | (NuGet) | -minták |

Előfeltételek

  • Azure-előfizetés – Hozzon létre egyet ingyenesen.

  • A Visual Studio IDE vagy a .NET Core aktuális verziója.

  • Egy Azure AI Vision-erőforrás. Az ingyenes tarifacsomag (F0) használatával kipróbálhatja a szolgáltatást, és később frissíthet egy fizetős szintre az éles környezetben.

  • Az alkalmazás azure AI Vision szolgáltatáshoz való csatlakoztatásához létrehozott erőforrás kulcsa és végpontja.

    1. Az Azure Vision-erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget.
    2. A bal oldali navigációs menüben válassza a Kulcsok és végpont lehetőséget.
    3. Másolja ki az egyik kulcsot és a végpontot a rövid útmutató későbbi részében való használatra.

Környezeti változók létrehozása

Ebben a példában írja meg a hitelesítő adatait az alkalmazást futtató helyi gépen lévő környezeti változókba.

Nyissa meg az Azure Portalt. Ha az Előfeltételek szakaszban létrehozott erőforrás sikeresen üzembe lett helyezve, válassza az Ugrás az erőforrásra lehetőséget a Következő lépések csoportban. A kulcsot és a végpontot a Kulcsok és végpontok lapon, az Erőforrás-kezelés területen találja. Az erőforráskulcs nem ugyanaz, mint az Azure-előfizetés azonosítója.

Tipp.

Ne vegye fel közvetlenül a kulcsot a kódba, és soha ne tegye közzé nyilvánosan. Az Azure AI-szolgáltatások biztonsági cikkében további hitelesítési lehetőségeket talál, például az Azure Key Vaultot.

A kulcs és a végpont környezeti változójának beállításához nyisson meg egy konzolablakot, és kövesse az operációs rendszer és a fejlesztési környezet utasításait.

  1. A VISION_KEY környezeti változó beállításához cserélje le your-key az erőforrás egyik kulcsára.
  2. A VISION_ENDPOINT környezeti változó beállításához cserélje le your-endpoint az erőforrás végpontját.
setx VISION_KEY your-key
setx VISION_ENDPOINT your-endpoint

A környezeti változók hozzáadása után előfordulhat, hogy újra kell indítania a futó programokat, amelyek felolvassák a környezeti változókat, beleértve a konzolablakot is.

Nyomtatott és kézzel írt szöveg olvasása

  1. Hozzon létre egy új C#-alkalmazást.

    A Visual Studio használatával hozzon létre egy konzolalkalmazási (.NET-keretrendszer) projektet c#, Windows, Console rendszerhez.

    Új projekt létrehozása után telepítse az ügyfélkódtárat:

    1. Kattintson a jobb gombbal a projektmegoldásra a Megoldáskezelő, és válassza a Megoldáshoz készült NuGet-csomagok kezelése lehetőséget.
    2. A megnyíló csomagkezelőben válassza a Tallózás lehetőséget. Válassza az Előválasztás belefoglalása lehetőséget.
    3. Keresse meg és válassza ki a Microsoft.Azure.CognitiveServices.Vision.ComputerVision elemet.
    4. A Részletek párbeszédpanelen válassza ki a projektet, és válassza ki a legújabb stabil verziót. Ezután válassza a Telepítés parancsot.
  2. A projektkönyvtárban nyissa meg a Program.cs fájlt az előnyben részesített szerkesztőben vagy IDE-ben. Cserélje le a Program.cs tartalmát a következő kódra.

    using System;
    using System.Collections.Generic;
    using Microsoft.Azure.CognitiveServices.Vision.ComputerVision;
    using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models;
    using System.Threading.Tasks;
    using System.IO;
    using Newtonsoft.Json;
    using Newtonsoft.Json.Linq;
    using System.Threading;
    using System.Linq;
    
    namespace ComputerVisionQuickstart
    {
        class Program
        {
            // Add your Computer Vision key and endpoint
            static string key = Environment.GetEnvironmentVariable("VISION_KEY");
            static string endpoint = Environment.GetEnvironmentVariable("VISION_ENDPOINT");
    
            private const string READ_TEXT_URL_IMAGE = "https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg";
    
            static void Main(string[] args)
            {
                Console.WriteLine("Azure Cognitive Services Computer Vision - .NET quickstart example");
                Console.WriteLine();
    
                ComputerVisionClient client = Authenticate(endpoint, key);
    
                // Extract text (OCR) from a URL image using the Read API
                ReadFileUrl(client, READ_TEXT_URL_IMAGE).Wait();
            }
    
            public static ComputerVisionClient Authenticate(string endpoint, string key)
            {
                ComputerVisionClient client =
                  new ComputerVisionClient(new ApiKeyServiceClientCredentials(key))
                  { Endpoint = endpoint };
                return client;
            }
    
            public static async Task ReadFileUrl(ComputerVisionClient client, string urlFile)
            {
                Console.WriteLine("----------------------------------------------------------");
                Console.WriteLine("READ FILE FROM URL");
                Console.WriteLine();
    
                // Read text from URL
                var textHeaders = await client.ReadAsync(urlFile);
                // After the request, get the operation location (operation ID)
                string operationLocation = textHeaders.OperationLocation;
                Thread.Sleep(2000);
    
                // Retrieve the URI where the extracted text will be stored from the Operation-Location header.
                // We only need the ID and not the full URL
                const int numberOfCharsInOperationId = 36;
                string operationId = operationLocation.Substring(operationLocation.Length - numberOfCharsInOperationId);
    
                // Extract the text
                ReadOperationResult results;
                Console.WriteLine($"Extracting text from URL file {Path.GetFileName(urlFile)}...");
                Console.WriteLine();
                do
                {
                    results = await client.GetReadResultAsync(Guid.Parse(operationId));
                }
                while ((results.Status == OperationStatusCodes.Running ||
                    results.Status == OperationStatusCodes.NotStarted));
    
                // Display the found text.
                Console.WriteLine();
                var textUrlFileResults = results.AnalyzeResult.ReadResults;
                foreach (ReadResult page in textUrlFileResults)
                {
                    foreach (Line line in page.Lines)
                    {
                        Console.WriteLine(line.Text);
                    }
                }
                Console.WriteLine();
            }
    
        }
    }
    
  3. Választható lépésként tekintse meg az adatok feldolgozásának módját. Például a legújabb GA-modell explicit megadásához szerkessze a hívást az ReadAsync ábrán látható módon. Hagyja ki a paramétert, vagy használja "latest" a legújabb GA-modellt.

      // Read text from URL with a specific model version
      var textHeaders = await client.ReadAsync(urlFile,null,null,"2022-04-30");
    
  4. Futtassa az alkalmazást.

    • A Hibakeresés menüben válassza a Hibakeresés indítása lehetőséget.

Hozam

Azure AI Vision - .NET quickstart example

----------------------------------------------------------
READ FILE FROM URL

Extracting text from URL file printed_text.jpg...


Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.

Az erőforrások eltávolítása

Ha törölni és eltávolítani szeretne egy Azure AI-szolgáltatási előfizetést, törölheti az erőforrást vagy az erőforráscsoportot. Az erőforráscsoport törlése a hozzá társított egyéb erőforrásokat is törli.

Következő lépések

Ebben a rövid útmutatóban megtanulta, hogyan telepítheti az OCR-ügyfélkódtárat, és hogyan használhatja a Read API-t. Ezután további információ az API olvasási funkcióiról.

Az optikai karakterfelismerő (OCR) ügyfélkódtár használatával nyomtatott és kézzel írt szöveget olvashat egy távoli képről. Az OCR szolgáltatás képes beolvasni egy kép látható szövegét, és karakterfolyammá alakítani. A szövegfelismerésről további információt az OCR áttekintésében talál.

Tipp.

A helyi képről is olvashat szöveget. Lásd a ComputerVisionClientOperationsMixin metódusokat, például read_in_stream. Vagy tekintse meg a GitHub mintakódját a helyi rendszerképeket érintő forgatókönyvekhez.

Referenciadokumentáció Kódtár forráskódcsomagja | (PiPy) | -minták |

Előfeltételek

  • Azure-előfizetés – Hozzon létre egyet ingyenesen.

  • Python 3.x.

  • A Python-telepítésnek tartalmaznia kell a pipet. Ellenőrizheti, hogy telepítve van-e a pip, és fut-e pip --version a parancssorban. Kérje le a pipet a Python legújabb verziójának telepítésével.

  • Egy Azure AI Vision-erőforrás. Az ingyenes tarifacsomag (F0) használatával kipróbálhatja a szolgáltatást, és később frissíthet egy fizetős szintre az éles környezetben.

  • Az alkalmazás azure AI Vision szolgáltatáshoz való csatlakoztatásához létrehozott erőforrás kulcsa és végpontja.

    1. Az Azure Vision-erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget.
    2. A bal oldali navigációs menüben válassza a Kulcsok és végpont lehetőséget.
    3. Másolja ki az egyik kulcsot és a végpontot a rövid útmutató későbbi részében való használatra.

Környezeti változók létrehozása

Ebben a példában írja meg a hitelesítő adatait az alkalmazást futtató helyi gépen lévő környezeti változókba.

Nyissa meg az Azure Portalt. Ha az Előfeltételek szakaszban létrehozott erőforrás sikeresen üzembe lett helyezve, válassza az Ugrás az erőforrásra lehetőséget a Következő lépések csoportban. A kulcsot és a végpontot a Kulcsok és végpontok lapon, az Erőforrás-kezelés területen találja. Az erőforráskulcs nem ugyanaz, mint az Azure-előfizetés azonosítója.

Tipp.

Ne vegye fel közvetlenül a kulcsot a kódba, és soha ne tegye közzé nyilvánosan. Az Azure AI-szolgáltatások biztonsági cikkében további hitelesítési lehetőségeket talál, például az Azure Key Vaultot.

A kulcs és a végpont környezeti változójának beállításához nyisson meg egy konzolablakot, és kövesse az operációs rendszer és a fejlesztési környezet utasításait.

  1. A VISION_KEY környezeti változó beállításához cserélje le your-key az erőforrás egyik kulcsára.
  2. A VISION_ENDPOINT környezeti változó beállításához cserélje le your-endpoint az erőforrás végpontját.
setx VISION_KEY your-key
setx VISION_ENDPOINT your-endpoint

A környezeti változók hozzáadása után előfordulhat, hogy újra kell indítania a futó programokat, amelyek felolvassák a környezeti változókat, beleértve a konzolablakot is.

Nyomtatott és kézzel írt szöveg olvasása

  1. Telepítse az ügyfélkódtárat.

    Egy konzolablakban futtassa a következő parancsot:

    pip install --upgrade azure-cognitiveservices-vision-computervision
    
  2. Telepítse a Párna könyvtárat.

    pip install pillow
    
  3. Hozzon létre egy új Python-alkalmazásfájlt, quickstart-file.py. Ezután nyissa meg a kívánt szerkesztőben vagy IDE-ben.

  4. Cserélje le a quickstart-file.py tartalmát a következő kódra.

    from azure.cognitiveservices.vision.computervision import ComputerVisionClient
    from azure.cognitiveservices.vision.computervision.models import OperationStatusCodes
    from azure.cognitiveservices.vision.computervision.models import VisualFeatureTypes
    from msrest.authentication import CognitiveServicesCredentials
    
    from array import array
    import os
    from PIL import Image
    import sys
    import time
    
    '''
    Authenticate
    Authenticates your credentials and creates a client.
    '''
    subscription_key = os.environ["VISION_KEY"]
    endpoint = os.environ["VISION_ENDPOINT"]
    
    computervision_client = ComputerVisionClient(endpoint, CognitiveServicesCredentials(subscription_key))
    '''
    END - Authenticate
    '''
    
    '''
    OCR: Read File using the Read API, extract text - remote
    This example will extract text in an image, then print results, line by line.
    This API call can also extract handwriting style text (not shown).
    '''
    print("===== Read File - remote =====")
    # Get an image with text
    read_image_url = "https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png"
    
    # Call API with URL and raw response (allows you to get the operation location)
    read_response = computervision_client.read(read_image_url,  raw=True)
    
    # Get the operation location (URL with an ID at the end) from the response
    read_operation_location = read_response.headers["Operation-Location"]
    # Grab the ID from the URL
    operation_id = read_operation_location.split("/")[-1]
    
    # Call the "GET" API and wait for it to retrieve the results 
    while True:
        read_result = computervision_client.get_read_result(operation_id)
        if read_result.status not in ['notStarted', 'running']:
            break
        time.sleep(1)
    
    # Print the detected text, line by line
    if read_result.status == OperationStatusCodes.succeeded:
        for text_result in read_result.analyze_result.read_results:
            for line in text_result.lines:
                print(line.text)
                print(line.bounding_box)
    print()
    '''
    END - Read File - remote
    '''
    
    print("End of Computer Vision quickstart.")
    
    
  5. Választható lépésként tekintse meg az adatok feldolgozásának módját. A legújabb GA-modell explicit megadásához például szerkessze az utasítást az read ábrán látható módon. A paraméter kihagyása vagy automatikus használata "latest" a legújabb GA-modellt használja.

       # Call API with URL and raw response (allows you to get the operation location)
       read_response = computervision_client.read(read_image_url,  raw=True, model_version="2022-04-30")
    
  6. Futtassa az alkalmazást a python paranccsal a gyorsútmutatós fájlon.

    python quickstart-file.py
    

Hozam

===== Read File - remote =====
The quick brown fox jumps
[38.0, 650.0, 2572.0, 699.0, 2570.0, 854.0, 37.0, 815.0]
Over
[184.0, 1053.0, 508.0, 1044.0, 510.0, 1123.0, 184.0, 1128.0]
the lazy dog!
[639.0, 1011.0, 1976.0, 1026.0, 1974.0, 1158.0, 637.0, 1141.0]

End of Azure AI Vision quickstart.

Az erőforrások eltávolítása

Ha törölni és eltávolítani szeretne egy Azure AI-szolgáltatási előfizetést, törölheti az erőforrást vagy az erőforráscsoportot. Az erőforráscsoport törlése a hozzá társított egyéb erőforrásokat is törli.

Következő lépések

Ebben a rövid útmutatóban megtanulta, hogyan telepítheti az OCR-ügyfélkódtárat, és hogyan használhatja a Read API-t. Ezután további információ az API olvasási funkcióiról.

Az optikai karakterfelismerési (OCR) ügyféloldali kódtár használatával nyomtatott és kézzel írt szöveget olvashat a Read API-val. Az OCR szolgáltatás képes beolvasni egy kép látható szövegét, és karakterfolyammá alakítani. A szövegfelismerésről további információt az OCR áttekintésében talál.

Tipp.

A helyi képről is olvashat szöveget. Lásd a ComputerVisionClient metódusokat, például a readInStreamet. Vagy tekintse meg a GitHub mintakódját a helyi rendszerképeket érintő forgatókönyvekhez.

Referenciadokumentáció Kódtár forráskódcsomagja | (npm)Minták | |

Előfeltételek

  • Azure-előfizetés – Hozzon létre egyet ingyenesen.

  • A Node.js aktuális verziója.

  • Egy Azure AI Vision-erőforrás. Az ingyenes tarifacsomag (F0) használatával kipróbálhatja a szolgáltatást, és később frissíthet egy fizetős szintre az éles környezetben.

  • Az alkalmazás azure AI Vision szolgáltatáshoz való csatlakoztatásához létrehozott erőforrás kulcsa és végpontja.

    1. Az Azure Vision-erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget.
    2. A bal oldali navigációs menüben válassza a Kulcsok és végpont lehetőséget.
    3. Másolja ki az egyik kulcsot és a végpontot a rövid útmutató későbbi részében való használatra.

Környezeti változók létrehozása

Ebben a példában írja meg a hitelesítő adatait az alkalmazást futtató helyi gépen lévő környezeti változókba.

Nyissa meg az Azure Portalt. Ha az Előfeltételek szakaszban létrehozott erőforrás sikeresen üzembe lett helyezve, válassza az Ugrás az erőforrásra lehetőséget a Következő lépések csoportban. A kulcsot és a végpontot a Kulcsok és végpontok lapon, az Erőforrás-kezelés területen találja. Az erőforráskulcs nem ugyanaz, mint az Azure-előfizetés azonosítója.

Tipp.

Ne vegye fel közvetlenül a kulcsot a kódba, és soha ne tegye közzé nyilvánosan. Az Azure AI-szolgáltatások biztonsági cikkében további hitelesítési lehetőségeket talál, például az Azure Key Vaultot.

A kulcs és a végpont környezeti változójának beállításához nyisson meg egy konzolablakot, és kövesse az operációs rendszer és a fejlesztési környezet utasításait.

  1. A VISION_KEY környezeti változó beállításához cserélje le your-key az erőforrás egyik kulcsára.
  2. A VISION_ENDPOINT környezeti változó beállításához cserélje le your-endpoint az erőforrás végpontját.
setx VISION_KEY your-key
setx VISION_ENDPOINT your-endpoint

A környezeti változók hozzáadása után előfordulhat, hogy újra kell indítania a futó programokat, amelyek felolvassák a környezeti változókat, beleértve a konzolablakot is.

Nyomtatott és kézzel írt szöveg olvasása

Hozzon létre egy új Node.js alkalmazást.

  1. Egy konzolablakban hozzon létre egy új könyvtárat az alkalmazáshoz, és navigáljon hozzá.

    mkdir myapp
    cd myapp
    
  2. Futtassa az npm init parancsot egy Node-alkalmazás package.json fájllal való létrehozásához. Válassza az Enter billentyűt az esetleges kérdésekhez.

    npm init
    
  3. Az ügyfélkódtár telepítéséhez telepítse az ms-rest-azure npm-csomagot @azure/cognitiveservices-computervision :

    npm install ms-rest-azure
    npm install @azure/cognitiveservices-computervision
    
  4. Telepítse az aszinkron modult:

    npm install async
    

    Az alkalmazás fájlja package.json frissül a függőségekkel.

  5. Hozzon létre egy új fájlt, index.js, és nyissa meg egy szövegszerkesztőben.

  6. Illessze be a következő kódot a index.js fájlba.

    'use strict';
    
    const async = require('async');
    const fs = require('fs');
    const https = require('https');
    const path = require("path");
    const createReadStream = require('fs').createReadStream
    const sleep = require('util').promisify(setTimeout);
    const ComputerVisionClient = require('@azure/cognitiveservices-computervision').ComputerVisionClient;
    const ApiKeyCredentials = require('@azure/ms-rest-js').ApiKeyCredentials;
    /**
     * AUTHENTICATE
     * This single client is used for all examples.
     */
    const key = process.env.VISION_KEY;
    const endpoint = process.env.VISION_ENDPOINT;
    
    const computerVisionClient = new ComputerVisionClient(
      new ApiKeyCredentials({ inHeader: { 'Ocp-Apim-Subscription-Key': key } }), endpoint);
    /**
     * END - Authenticate
     */
    
    function computerVision() {
      async.series([
        async function () {
    
          /**
           * OCR: READ PRINTED & HANDWRITTEN TEXT WITH THE READ API
           * Extracts text from images using OCR (optical character recognition).
           */
          console.log('-------------------------------------------------');
          console.log('READ PRINTED, HANDWRITTEN TEXT AND PDF');
          console.log();
    
          // URL images containing printed and/or handwritten text. 
          // The URL can point to image files (.jpg/.png/.bmp) or multi-page files (.pdf, .tiff).
          const printedTextSampleURL = 'https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg';
    
          // Recognize text in printed image from a URL
          console.log('Read printed text from URL...', printedTextSampleURL.split('/').pop());
          const printedResult = await readTextFromURL(computerVisionClient, printedTextSampleURL);
          printRecText(printedResult);
    
          // Perform read and await the result from URL
          async function readTextFromURL(client, url) {
            // To recognize text in a local image, replace client.read() with readTextInStream() as shown:
            let result = await client.read(url);
            // Operation ID is last path segment of operationLocation (a URL)
            let operation = result.operationLocation.split('/').slice(-1)[0];
    
            // Wait for read recognition to complete
            // result.status is initially undefined, since it's the result of read
            while (result.status !== "succeeded") { await sleep(1000); result = await client.getReadResult(operation); }
            return result.analyzeResult.readResults; // Return the first page of result. Replace [0] with the desired page if this is a multi-page file such as .pdf or .tiff.
          }
    
          // Prints all text from Read result
          function printRecText(readResults) {
            console.log('Recognized text:');
            for (const page in readResults) {
              if (readResults.length > 1) {
                console.log(`==== Page: ${page}`);
              }
              const result = readResults[page];
              if (result.lines.length) {
                for (const line of result.lines) {
                  console.log(line.words.map(w => w.text).join(' '));
                }
              }
              else { console.log('No recognized text.'); }
            }
          }
    
          /**
           * 
           * Download the specified file in the URL to the current local folder
           * 
           */
          function downloadFilesToLocal(url, localFileName) {
            return new Promise((resolve, reject) => {
              console.log('--- Downloading file to local directory from: ' + url);
              const request = https.request(url, (res) => {
                if (res.statusCode !== 200) {
                  console.log(`Download sample file failed. Status code: ${res.statusCode}, Message: ${res.statusMessage}`);
                  reject();
                }
                var data = [];
                res.on('data', (chunk) => {
                  data.push(chunk);
                });
                res.on('end', () => {
                  console.log('   ... Downloaded successfully');
                  fs.writeFileSync(localFileName, Buffer.concat(data));
                  resolve();
                });
              });
              request.on('error', function (e) {
                console.log(e.message);
                reject();
              });
              request.end();
            });
          }
    
          /**
           * END - Recognize Printed & Handwritten Text
           */
          console.log();
          console.log('-------------------------------------------------');
          console.log('End of quickstart.');
    
        },
        function () {
          return new Promise((resolve) => {
            resolve();
          })
        }
      ], (err) => {
        throw (err);
      });
    }
    
    computerVision();
    
  7. Választható lépésként tekintse meg az adatok feldolgozásának módját. A legújabb GA-modell explicit megadásához például szerkessze az utasítást az read ábrán látható módon. A paraméter kihagyása vagy automatikus használata "latest" a legújabb GA-modellt használja.

      let result = await client.read(url,{modelVersion:"2022-04-30"});
    
  8. Futtassa az alkalmazást a node paranccsal a gyorsútmutatós fájlon.

    node index.js
    

Hozam

-------------------------------------------------
READ PRINTED, HANDWRITTEN TEXT AND PDF

Read printed text from URL... printed_text.jpg
Recognized text:
Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.

-------------------------------------------------
End of quickstart.

Az erőforrások eltávolítása

Ha törölni és eltávolítani szeretne egy Azure AI-szolgáltatási előfizetést, törölheti az erőforrást vagy az erőforráscsoportot. Az erőforráscsoport törlése a hozzá társított egyéb erőforrásokat is törli.

Következő lépések

Ebben a rövid útmutatóban megtanulta, hogyan telepítheti az OCR-ügyfélkódtárat, és hogyan használhatja a Read API-t. Ezután további információ az API olvasási funkcióiról.

Az optikai karakterfelismerési (OCR) REST API-val nyomtatott és kézzel írt szöveget olvashat.

Feljegyzés

Ez a rövid útmutató cURL-parancsokkal hívja meg a REST API-t. A REST API-t programozási nyelv használatával is meghívhatja. A GitHub-mintákat a C#, a Python, a Java és a JavaScript használatával szemlélteti.

Előfeltételek

  • Azure-előfizetés – Hozzon létre egyet ingyenesen.

  • a cURL telepítve van.

  • Egy Azure AI Vision-erőforrás. Az ingyenes tarifacsomag (F0) használatával kipróbálhatja a szolgáltatást, és később frissíthet egy fizetős szintre az éles környezetben.

  • Az alkalmazás azure AI Vision szolgáltatáshoz való csatlakoztatásához létrehozott erőforrás kulcsa és végpontja.

    1. Az Azure Vision-erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget.
    2. A bal oldali navigációs menüben válassza a Kulcsok és végpont lehetőséget.
    3. Másolja ki az egyik kulcsot és a végpontot a rövid útmutató későbbi részében való használatra.

Nyomtatott és kézzel írt szöveg olvasása

Az optikai karakterfelismerési (OCR) szolgáltatás képes kinyerni egy kép vagy dokumentum látható szövegét, és karakterfolyammá konvertálni. A szövegkinyerésről további információt az OCR áttekintésében talál.

A Read API meghívása

A minta létrehozásához és futtatásához az alábbi lépéseket kell végrehajtania:

  1. Másolja az alábbi parancsot egy szövegszerkesztőbe.

  2. Hajtsa végre a következő módosításokat a parancs megfelelő területein:

    1. Cserélje le a kulcs értékét <key> .
    2. Cserélje le a kérelem URL-címének (https://westcentralus.api.cognitive.microsoft.com/) első részét a saját végpont URL-címében lévő szövegre.

      Feljegyzés

      A 2019. július 1. után létrehozott új erőforrások egyéni altartományneveket fognak használni. További információkért és a regionális végpontok teljes listájáért tekintse meg az Azure AI-szolgáltatások egyéni altartományneveit.

    3. Igény szerint cserélje a kép URL-címét a kérelem törzsében (https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png) egy másik elemzendő kép URL-címére.
  3. Nyisson meg egy parancsablakot.

  4. Illessze be a szövegszerkesztőből a parancsot, majd futtassa.

curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"

A válasz tartalmaz egy Operation-Location fejlécet, amelynek értéke egy egyedi URL-cím. Ezzel az URL-címvel kérdezheti le az olvasási művelet eredményeit. Az URL-cím 48 órán belül lejár.

Igény szerint adja meg a modell verzióját

Választható lépésként tekintse meg az adatok feldolgozásának módját. Például a legújabb GA-modell explicit megadásához használja model-version=2022-04-30 paraméterként. A paraméter kihagyása vagy automatikus használata model-version=latest a legújabb GA-modellt használja.

curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze?model-version=2022-04-30" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"

Olvasási eredmények lekérése

  1. Másolja a következő parancsot a szövegszerkesztőbe.

  2. Cserélje le az URL-címet az Operation-Location előző eljárásban másolt értékre.

  3. Cserélje le a kulcs értékét <key> .

  4. Nyisson meg egy konzolablakot.

  5. Illessze be a parancsot a szövegszerkesztőből a konzolablakba, majd futtassa a parancsot.

    curl -v -X GET "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyzeResults/{operationId}" -H "Ocp-Apim-Subscription-Key: {key}" --data-ascii "{body}" 
    

A válasz vizsgálata

A rendszer JSON formátumban adja vissza a sikeres választ. A mintaalkalmazás elemzi és megjeleníti a sikeres választ a konzolablakban, a következő példához hasonló módon:

{
  "status": "succeeded",
  "createdDateTime": "2021-04-08T21:56:17.6819115+00:00",
  "lastUpdatedDateTime": "2021-04-08T21:56:18.4161316+00:00",
  "analyzeResult": {
    "version": "3.2",
    "readResults": [
      {
        "page": 1,
        "angle": 0,
        "width": 338,
        "height": 479,
        "unit": "pixel",
        "lines": [
          {
            "boundingBox": [
              25,
              14,
              318,
              14,
              318,
              59,
              25,
              59
            ],
            "text": "NOTHING",
            "appearance": {
              "style": {
                "name": "other",
                "confidence": 0.971
              }
            },
            "words": [
              {
                "boundingBox": [
                  27,
                  15,
                  294,
                  15,
                  294,
                  60,
                  27,
                  60
                ],
                "text": "NOTHING",
                "confidence": 0.994
              }
            ]
          }
        ]
      }
    ]
  }
}

Az erőforrások eltávolítása

Ha törölni és eltávolítani szeretne egy Azure AI-szolgáltatási előfizetést, törölheti az erőforrást vagy az erőforráscsoportot. Az erőforráscsoport törlése a hozzá társított egyéb erőforrásokat is törli.

Következő lépések

Ebben a rövid útmutatóban megtanulta, hogyan hívhatja meg a Read REST API-t. Ezután további információ az API olvasási funkcióiról.

Előfeltételek

  • Azure-előfizetés – Hozzon létre egyet ingyenesen.

  • Egy Azure AI Vision-erőforrás. Az ingyenes tarifacsomag (F0) használatával kipróbálhatja a szolgáltatást, és később frissíthet egy fizetős szintre az éles környezetben.

  • CsatlakozásVision Studio.

    • Előfordulhat, hogy be kell jelentkeznie.
    • A bejelentkezés után válassza az Összes erőforrás megtekintése lehetőséget. Ha szükséges, válassza a Frissítés lehetőséget. Ellenőrizze, hogy az erőforrás elérhető-e.

    További információ: A Vision Studio használatának első lépései.

Nyomtatott és kézzel írt szöveg olvasása

  1. Az Optikai karakterfelismerés területen válassza a Szöveg kinyerése képekből lehetőséget.

  2. A Kipróbálás területen nyugtázza, hogy ez a bemutató használatot von maga után az Azure-fiókjában. További információkért tekintse meg az Azure AI Vision díjszabását.

  3. Válasszon egy képet az elérhető készletből, vagy töltse fel a sajátját.

  4. Ha szükséges, válassza a Kérjük, válasszon egy erőforrást az erőforrás kiválasztásához.

    A kép kijelölése után a kinyert szöveg megjelenik a kimeneti ablakban. A JSON fülre kattintva megtekintheti az API-hívás által visszaadott JSON-kimenetet.

A kipróbálás élménye alatt a következő lépéseket követve elkezdheti használni ezt a képességet a saját alkalmazásában.

Következő lépések

Ebben a rövid útmutatóban a Vision Studiót használta a Read API eléréséhez. Ezután további információ az API olvasási funkcióiról.