Rövid útmutató: Az Olvasás ügyféloldali kódtár vagy REST API

Első lépések a Read REST API vagy ügyfélkódtárakkal. Az Olvasási szolgáltatás AI-algoritmusokat biztosít a látható szövegek képekből való kinyerésére és strukturált sztringekként való visszaadása érdekében. Kövesse az alábbi lépéseket egy csomag alkalmazásba való telepítéséhez, és próbálja ki az alapszintű feladatokhoz szükséges mintakódot.

Az OCR ügyféloldali kódtár használatával nyomtatott és kézzel írt szöveget olvashat be egy képből.

Referenciadokumentáció | Kódtár forráskódja | Package (NuGet) | Minták

Előfeltételek

  • Azure-előfizetés – Hozzon létre egyet ingyenesen
  • A Visual Studio IDE vagy a .NET Core aktuális verziója.
  • Ha már rendelkezik Azure-előfizetéssel, hozzon létre egy Computer Vision-erőforrást, és hozzon létre egy Computer Vision-erőforrást a Azure Portal a kulcs és a végpont lekért létrehozásához. Az üzembe helyezés után kattintson az Erőforráshoz való ugrás gombra.
    • Szüksége lesz a létrehozott erőforrás kulcsára és végpontjára az alkalmazás a Computer Vision csatlakoztatásához. A kulcsot és a végpontot a rövid útmutató későbbi, alábbi kódába fogja beilleszteni.
    • Az ingyenes tarifacsomag ( ) használatával kipróbálhatja a szolgáltatást, és később frissíthet fizetős szolgáltatási szintre éles F0 környezetben.

Beállítása

Új C#-alkalmazás létrehozása

A Visual Studio hozzon létre egy új .NET Core-alkalmazást.

Az ügyféloldali kódtár telepítése

Miután létrehozott egy új projektet, telepítse az ügyféloldali kódtárat. Kattintson a jobb gombbal a projektmegoldásra a Megoldáskezelő majd válassza a Manage NuGet Packages (NuGet-csomagok kezelése) gombra. A megnyíló csomagkezelőben válassza a Tallózás lehetőséget, jelölje be az Include prerelease(Előzetes) jelölőnégyzetet, és keressen a következőre: Microsoft.Azure.CognitiveServices.Vision.ComputerVision . Válassza a 7.0.0 verziót, majd a Telepítés lehetőséget.

Tipp

Szeretné egyszerre megtekinteni a teljes gyorsindítási kódfájlt? Ez a GitHubon található,amely a rövid útmutatóban található példakódokat tartalmazza.

A projektkönyvtárból nyissa meg a Program.cs fájlt a kívánt szerkesztőben vagy IDE-ban.

Az előfizetői kulcs és a végpont megkeresve

Nyissa meg az Azure Portalt. Ha Computer Vision az Előfeltételek szakaszban létrehozott erőforrás, kattintson az Erőforráshoz ugrás gombra a Következő lépések területen. Az előfizetési kulcsot és a végpontot az erőforrás kulcs- és végpontoldalán, az erőforrás-kezelés alatt találja.

Az alkalmazás Program osztályában hozzon létre változókat a Computer Vision előfizetői előfizetési kulcshoz és végponthoz. Illessze be az előfizetői kulcsot és a végpontot az alábbi kódba, ahol a jel látható. A Computer Vision végpont a következő formában van: https://<your_computer_vision_resource_name>.cognitiveservices.azure.com/ .

using System;
using System.Collections.Generic;
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision;
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models;
using System.Threading.Tasks;
using System.IO;
using Newtonsoft.Json;
using Newtonsoft.Json.Linq;
using System.Threading;
using System.Linq;

namespace ComputerVisionQuickstart
{
    class Program
    {
        // Add your Computer Vision subscription key and endpoint
        static string subscriptionKey = "PASTE_YOUR_COMPUTER_VISION_SUBSCRIPTION_KEY_HERE";
        static string endpoint = "PASTE_YOUR_COMPUTER_VISION_ENDPOINT_HERE";

Fontos

Ne felejtse el eltávolítani az előfizetői kulcsot a kódból, amikor végzett, és soha ne tegye közzé nyilvánosan. Éles környezetben érdemes lehet biztonságos módon tárolni és elérni a hitelesítő adatokat. Például: Azure Key Vault.

Az alkalmazás metódusában adja hozzá az ebben a rövid Main útmutatóban használt metódusok hívásait. Ezeket később fogja létrehozni.

ComputerVisionClient client = Authenticate(endpoint, subscriptionKey);

// Extract text (OCR) from a URL image using the Read API
ReadFileUrl(client, READ_TEXT_URL_IMAGE).Wait();

Objektummodell

A következő osztályok és felületek az OCR .NET SDK néhány fő funkcióját kezelik.

Név Leírás
ComputerVisionClient Ez az osztály minden funkcióhoz Computer Vision szükséges. Példányosodhat az előfizetés adataival, és a legtöbb rendszerkép-művelethez használhatja.
ComputerVisionClientExtensions Ez az osztály további metódusokat tartalmaz a ComputerVisionClient számára.

Kódpéldák

Ezek a kódrészletek a következő feladatok elvégzését mutatják be a .NET OCR-ügyfélkódtárával:

Az ügyfél hitelesítése

A Program osztály egy új metódusában példányosíthat egy ügyfelet a végponttal és az előfizetői kulccsal. Hozzon létre egy ApiKeyServiceClientCredentials objektumot az előfizetői kulccsal, és használja a végponttal egy ComputerVisionClient objektum létrehozásához.

/*
 * AUTHENTICATE
 * Creates a Computer Vision client used by each example.
 */
public static ComputerVisionClient Authenticate(string endpoint, string key)
{
    ComputerVisionClient client =
      new ComputerVisionClient(new ApiKeyServiceClientCredentials(key))
      { Endpoint = endpoint };
    return client;
}

Nyomtatott és kézzel írt szöveg olvasása

Az OCR szolgáltatás képes olvasni a képeken látható szövegeket, és konvertálni karakterfolyamokká. A szövegfelismeréssel kapcsolatos további információkért lásd az optikai karakterfelismerés (OCR) áttekintését. Az ebben a szakaszban található kód a Read 3.0 legújabb Computer Vision SDK-kiadását használja, és meghatároz egy metódust, amely az ügyfélobjektummal észleli és kinyeri a képen látható BatchReadFileUrl szöveget.

Tipp

Helyi képből is kinyerhet szöveget. Lásd: ComputerVisionClient metódusok, például ReadInStreamAsync. Vagy tekintse meg a GitHubon a helyi rendszerképekkel kapcsolatos forgatókönyveket tartalmazó mintakódot.

Tesztkép beállítása

A Program osztályban mentsen egy hivatkozást annak a képnek az URL-címére, amelyből szöveget szeretne kinyerni. Ez a kódrészlet nyomtatott és kézzel írt szöveg mintaképét is tartalmazza.

private const string READ_TEXT_URL_IMAGE = "https://intelligentkioskstore.blob.core.windows.net/visionapi/suggestedphotos/3.png";

A Read API hívása

Definiálja a szövegolvasás új metódusát. Adja hozzá az alábbi kódot, amely a ReadAsync metódust hívja meg az adott rendszerképhez. Ez egy műveletazonosítót ad vissza, és elindít egy aszinkron folyamatot a kép tartalmának beolvassa.

/*
 * READ FILE - URL 
 * Extracts text. 
 */
public static async Task ReadFileUrl(ComputerVisionClient client, string urlFile)
{
    Console.WriteLine("----------------------------------------------------------");
    Console.WriteLine("READ FILE FROM URL");
    Console.WriteLine();

    // Read text from URL
    var textHeaders = await client.ReadAsync(urlFile);
    // After the request, get the operation location (operation ID)
    string operationLocation = textHeaders.OperationLocation;
    Thread.Sleep(2000);

Olvasási eredmények lekérte

Ezután szerezze be a ReadAsync hívásból visszaadott műveletazonosítót, és a használatával lekérdezheti a szolgáltatásból a műveleti eredményeket. A következő kód ellenőrzi a műveletet, amíg az eredmények vissza nem térnek. Ezután kinyomtatja a kinyert szöveges adatokat a konzolon.

// Retrieve the URI where the extracted text will be stored from the Operation-Location header.
// We only need the ID and not the full URL
const int numberOfCharsInOperationId = 36;
string operationId = operationLocation.Substring(operationLocation.Length - numberOfCharsInOperationId);

// Extract the text
ReadOperationResult results;
Console.WriteLine($"Extracting text from URL file {Path.GetFileName(urlFile)}...");
Console.WriteLine();
do
{
    results = await client.GetReadResultAsync(Guid.Parse(operationId));
}
while ((results.Status == OperationStatusCodes.Running ||
    results.Status == OperationStatusCodes.NotStarted));

Olvasási eredmények megjelenítése

Adja hozzá a következő kódot a lekért szöveges adatok kinyeréhez és megjelenítéséhez, majd fejezze be a metódus definícióját.

    // Display the found text.
    Console.WriteLine();
    var textUrlFileResults = results.AnalyzeResult.ReadResults;
    foreach (ReadResult page in textUrlFileResults)
    {
        foreach (Line line in page.Lines)
        {
            Console.WriteLine(line.Text);
        }
    }
    Console.WriteLine();
}

Az alkalmazás futtatása

Futtassa az alkalmazást az IDE ablakának tetején található Hibakeresés gombra kattintva.

Az erőforrások eltávolítása

Ha törölni vagy eltávolítani szeretne egy Cognitive Services előfizetést, törölheti az erőforrást vagy az erőforráscsoportot. Az erőforráscsoport törlésével a hozzá társított összes többi erőforrást is törli.

Következő lépések

Ebben a rövid útmutatóban megtanulta, hogyan telepítheti az OCR ügyféloldali kódtárat, és hogyan használhatja a Read API-t. A következő lépés a Read API-funkciókkal kapcsolatos további tudnivalók.

Az optikai karakterfelismerési ügyféloldali kódtár használatával nyomtatott és kézzel írt szöveget olvashat be a Read API-val.

Referenciadokumentáció | Kódtár forráskódja | Csomag (PiPy) | Minták

Előfeltételek

  • Azure-előfizetés – Hozzon létre egyet ingyenesen

  • Python 3.x

    • A Python-telepítésnek tartalmaznia kell a pip et. A parancssorban futtatva ellenőrizheti, hogy telepítve pip --version van-e a pip. A python legújabb verziójának telepítésével szerezze be a pip-et.
  • Ha már rendelkezik Azure-előfizetéssel, hozzon létre egy Computer Vision-erőforrást, és hozzon létre egy Computer Vision-erőforrást a Azure Portal a kulcs és a végpont lekért létrehozásához. Az üzembe helyezés után kattintson az Erőforráshoz való ugrás gombra.

    • Szüksége lesz a létrehozott erőforrás kulcsára és végpontjára az alkalmazás a Computer Vision csatlakoztatásához. A kulcsot és a végpontot a rövid útmutató későbbi, alábbi kódába fogja beilleszteni.
    • Az ingyenes tarifacsomag ( ) használatával kipróbálhatja a szolgáltatást, és később frissíthet fizetős szolgáltatási szintre éles F0 környezetben.

Beállítása

Az ügyféloldali kódtár telepítése

Az ügyféloldali kódtárat a következővel telepítheti:

pip install --upgrade azure-cognitiveservices-vision-computervision

Telepítse a Egyedtárat is.

pip install pillow

Új Python-alkalmazás létrehozása

Tipp

Szeretné egyszerre megtekinteni a teljes gyorsindítási kódfájlt? Ez a GitHubon található,amely az ebben a rövid útmutatóban található példakódokat tartalmazza.

Hozzon létre például egy — quickstart-file.py Python-fájlt. Ezután nyissa meg a kívánt szerkesztőben vagy IDE-ban.

Az előfizetői kulcs és a végpont megkeresve

Nyissa meg az Azure Portalt. Ha az Computer Vision szakaszban létrehozott Computer Vision, kattintson az Ugrás az erőforráshoz gombra a Következő lépések területen. Az előfizetési kulcsot és a végpontot az erőforrás kulcs- és végpontoldalán, az erőforrás-kezelés alatt találja.

Hozzon létre változókat a Computer Vision előfizetői előfizetési kulcshoz és végponthoz. Illessze be az előfizetői kulcsot és a végpontot a következő kódba, ahol a jel látható. A Computer Vision végpont a következő formában van: https://<your_computer_vision_resource_name>.cognitiveservices.azure.com/ .

from azure.cognitiveservices.vision.computervision import ComputerVisionClient
from azure.cognitiveservices.vision.computervision.models import OperationStatusCodes
from azure.cognitiveservices.vision.computervision.models import VisualFeatureTypes
from msrest.authentication import CognitiveServicesCredentials

from array import array
import os
from PIL import Image
import sys
import time

'''
Authenticate
Authenticates your credentials and creates a client.
'''
subscription_key = "PASTE_YOUR_COMPUTER_VISION_SUBSCRIPTION_KEY_HERE"
endpoint = "PASTE_YOUR_COMPUTER_VISION_ENDPOINT_HERE"

Fontos

Ne felejtse el eltávolítani az előfizetői kulcsot a kódból, amikor végzett, és soha ne tegye közzé nyilvánosan. Éles környezetben érdemes lehet biztonságos módon tárolni és elérni a hitelesítő adatokat. Például: Azure Key Vault.

Objektummodell

Az alábbi osztályok és felületek az OCR Python SDK néhány fő funkcióját kezelik.

Név Leírás
ComputerVisionClientOperationsMixin Ez az osztály közvetlenül kezeli az összes képműveletet, például a képelemzést, a szövegészlelést és a miniatűrök generálást.
ComputerVisionClient Ez az osztály minden funkcióhoz Computer Vision szükséges. Példányosodhat az előfizetés adataival, és más osztályok példányainak előállítására használhatja. Implementálja a ComputerVisionClientOperationsMixin et.
VisualFeatureTypes Ez az enum határozza meg a képelemzés különböző típusait, amelyek egy standard Elemzés műveletben végrehajtásához végrehajtásához szükséges. A VisualFeatureTypes értékeket az igényeinek megfelelően adhatja meg.

Kódpéldák

Ezek a kódrészletek a következő feladatok elvégzését mutatják be a Python OCR ügyfélkódtárával:

Az ügyfél hitelesítése

Példányosíthat egy ügyfelet a végponttal és a kulccsal. Hozzon létre egy CognitiveServicesCredentials objektumot a kulccsal, és használja a végponttal egy ComputerVisionClient objektum létrehozásához.

computervision_client = ComputerVisionClient(endpoint, CognitiveServicesCredentials(subscription_key))

Nyomtatott és kézzel írt szöveg olvasása

Az OCR szolgáltatás képes olvasni a képeken látható szövegeket, és konvertálni karakterfolyamokká. Ezt két részből kell megtenni.

A Read API hívása

Először a következő kóddal hívja meg az adott rendszerkép read metódusát. Ez egy műveletazonosítót ad vissza, és elindít egy aszinkron folyamatot a kép tartalmának beolvassa.

'''
OCR: Read File using the Read API, extract text - remote
This example will extract text in an image, then print results, line by line.
This API call can also extract handwriting style text (not shown).
'''
print("===== Read File - remote =====")
# Get an image with text
read_image_url = "https://raw.githubusercontent.com/MicrosoftDocs/azure-docs/master/articles/cognitive-services/Computer-vision/Images/readsample.jpg"

# Call API with URL and raw response (allows you to get the operation location)
read_response = computervision_client.read(read_image_url,  raw=True)

Tipp

Helyi képből is olvashat szöveget. Lásd a ComputerVisionClientOperationsMixin metódusokat, például a read_in_stream. Vagy tekintse meg a GitHubon a helyi rendszerképekkel kapcsolatos forgatókönyveket tartalmazó mintakódot.

Olvasási eredmények lekérte

Ezután szerezze be az olvasási hívásból visszaadott műveletazonosítót, és a használatával lekérdezheti a szolgáltatásból a műveleti eredményeket. A következő kód egy másodperces időközönként ellenőrzi a műveletet, amíg az eredmények vissza nem térnek. Ezután kinyomtatja a kinyert szöveges adatokat a konzolon.

# Get the operation location (URL with an ID at the end) from the response
read_operation_location = read_response.headers["Operation-Location"]
# Grab the ID from the URL
operation_id = read_operation_location.split("/")[-1]

# Call the "GET" API and wait for it to retrieve the results 
while True:
    read_result = computervision_client.get_read_result(operation_id)
    if read_result.status not in ['notStarted', 'running']:
        break
    time.sleep(1)

# Print the detected text, line by line
if read_result.status == OperationStatusCodes.succeeded:
    for text_result in read_result.analyze_result.read_results:
        for line in text_result.lines:
            print(line.text)
            print(line.bounding_box)
print()

Az alkalmazás futtatása

Futtassa az alkalmazást az python paranccsal a gyorsindítási fájlban.

python quickstart-file.py

Az erőforrások eltávolítása

Ha törölni vagy eltávolítani szeretne egy Cognitive Services előfizetést, törölheti az erőforrást vagy az erőforráscsoportot. Az erőforráscsoport törlésével a hozzá társított összes többi erőforrást is törli.

Következő lépések

Ebben a rövid útmutatóban megtanulta, hogyan telepítheti az OCR ügyféloldali kódtárat, és hogyan használhatja a Read API-t. A következő lépés a Read API-funkciókkal kapcsolatos további tudnivalók.

Az optikai karakterfelismerési ügyféloldali kódtár használatával nyomtatott és kézzel írt szövegeket olvashat be képeken.

Referenciadokumentáció | Kódtár forráskódja | Összetevő (Maven) | Minták

Előfeltételek

  • Azure-előfizetés – Hozzon létre egyet ingyenesen
  • A Java fejlesztői készlet (JDK) aktuális verziója
  • A Gradle buildeszköz ,vagy egy másik függőségkezelő.
  • Az Azure-előfizetés létrehozása után hozzon létre egy Computer Vision-erőforrást, Computer Vision erőforrást a Azure Portal a kulcs és a végpont lekért létrehozásához. Az üzembe helyezés után kattintson az Erőforráshoz való ugrás elemre.
    • Szüksége lesz a létrehozott erőforrás kulcsára és végpontjára az alkalmazás és a Computer Vision csatlakoztatásához. A kulcsot és a végpontot a rövid útmutató későbbi, alábbi kódába fogja beilleszteni.
    • Az ingyenes tarifacsomag ( ) használatával kipróbálhatja a szolgáltatást, és később frissíthet fizetős szolgáltatási szintre éles F0 környezetben.

Beállítása

Új Gradle-projekt létrehozása

Egy konzolablakban (például cmd, PowerShell vagy Bash) hozzon létre egy új könyvtárat az alkalmazáshoz, és navigáljon hozzá.

mkdir myapp && cd myapp

Futtassa gradle init a parancsot a munkakönyvtárból. Ez a parancs alapvető buildfájlokat hoz létre a Gradle-hez, beleértve a build.gradle.kts fájlt, amely futásidőben használatos az alkalmazás létrehozásához és konfigurálásához.

gradle init --type basic

Amikor a rendszer kéri, hogy válasszon egy DSL-t, válassza a Kotlin lehetőséget.

Az ügyféloldali kódtár telepítése

Ez a rövid útmutató a Gradle függőségkezelőt használja. Az ügyféloldali kódtárat és az egyéb függőségkezelőkre vonatkozó információkat a Maven központi adattárában találja.

Keresse meg a build.gradle.kts et, és nyissa meg a kívánt IDE-val vagy szövegszerkesztővel. Ezután másolja be a következő buildkonfigurációt. Ez a konfiguráció java-alkalmazásként definiálja a projektet, amelynek belépési pontja a ComputerVisionQuickstart osztály. Importálja a Computer Vision kódtárat.

plugins {
    java
    application
}
application { 
    mainClass.set("ComputerVisionQuickstart")
}
repositories {
    mavenCentral()
}
dependencies {
    implementation(group = "com.microsoft.azure.cognitiveservices", name = "azure-cognitiveservices-computervision", version = "1.0.6-beta")
}

Java-fájl létrehozása

Futtassa a következő parancsot a munkakönyvtárban egy projektforrásmappa létrehozásához:

mkdir -p src/main/java

Tipp

Szeretné egyszerre megtekinteni a teljes gyorsindítási kódfájlt? Ezt a GitHubon találhatjameg, amely ebben a rövid útmutatóban található példakódokat tartalmazza.

Lépjen az új mappára, és hozzon létre egy ComputerVisionQuickstart.java nevű fájlt. Nyissa meg a kívánt szerkesztőben vagy IDE-ban.

Az előfizetői kulcs és a végpont megkeresve

Nyissa meg az Azure Portalt. Ha az Computer Vision szakaszban létrehozott erőforrás sikeresen üzembe lett stb., kattintson az Erőforrás ugrás gombra a Következő lépések területen. Az előfizetési kulcsot és a végpontot az erőforrás kulcs- és végpontoldalán, az erőforrás-kezelés alatt találja.

Határozza meg a ComputerVisionQuickstart osztályt. Hozzon létre változókat a Computer Vision előfizetői előfizetési kulcshoz és végponthoz. Illessze be az előfizetői kulcsot és a végpontot a következő kódba, ahol a jel látható. A Computer Vision végpont a következő formában van: https://<your_computer_vision_resource_name>.cognitiveservices.azure.com/ .

import com.microsoft.azure.cognitiveservices.vision.computervision.*;
import com.microsoft.azure.cognitiveservices.vision.computervision.implementation.ComputerVisionImpl;
import com.microsoft.azure.cognitiveservices.vision.computervision.models.*;

import java.io.*;
import java.nio.file.Files;

import java.util.ArrayList;
import java.util.List;
import java.util.UUID;

public class ComputerVisionQuickstart {

    static String subscriptionKey = "PASTE_YOUR_COMPUTER_VISION_SUBSCRIPTION_KEY_HERE";
    static String endpoint = "PASTE_YOUR_COMPUTER_VISION_ENDPOINT_HERE";

Fontos

Ne felejtse el eltávolítani az előfizetői kulcsot a kódból, amikor végzett, és soha ne tegye közzé nyilvánosan. Éles környezetben érdemes lehet biztonságos módon tárolni és elérni a hitelesítő adatokat. Például: Azure Key Vault.

Az alkalmazás fő metódusában adja hozzá az ebben a rövid útmutatóban használt metódusok hívásait. Ezeket később fogja meghatározni.

public static void main(String[] args) {
    
    System.out.println("\nAzure Cognitive Services Computer Vision - Java Quickstart Sample");

    // Create an authenticated Computer Vision client.
    ComputerVisionClient compVisClient = Authenticate(subscriptionKey, endpoint); 

    // Read from local file
    ReadFromFile(compVisClient);
}

Objektummodell

Az alábbi osztályok és felületek az OCR Java SDK néhány fő funkcióját kezelik.

Név Leírás
ComputerVisionClient Ez az osztály minden funkcióhoz Computer Vision szükséges. Példányosodhat az előfizetés adataival, és más osztályok példányainak előállítására használhatja.

Kódpéldák

Ezek a kódrészletek azt mutatják be, hogyan kell elvégezni a következő feladatokat a Java OCR-ügyfélkódtárával:

Az ügyfél hitelesítése

Egy új metódusban példányosítania kell egy ComputerVisionClient objektumot a végponttal és a kulccsal.

public static ComputerVisionClient Authenticate(String subscriptionKey, String endpoint){
    return ComputerVisionManager.authenticate(subscriptionKey).withEndpoint(endpoint);
}

Nyomtatott és kézzel írt szöveg olvasása

Az OCR szolgáltatás képes olvasni a képeken látható szövegeket, és konvertálni karakterfolyamokká. Ez a szakasz egy metódust határoz meg, amely egy helyi fájl elérési útját használja, és kiírja a kép szövegét a ReadFromFile konzolra.

Tipp

Az URL-cím alapján hivatkozott távoli képeken található szövegeket is olvashatja. Lásd a ComputerVision metódusokat, például a következőt:. Vagy tekintse meg a GitHubon található mintakódot a távoli rendszerképeket érintő forgatókönyvekért.

Tesztkép beállítása

Hozzon létre egy resources/folder mappát a projekt src/main/ mappájában, és adjon hozzá egy képet, amelyből szöveget szeretne olvasni. A használathoz letölthet egy mintaképet.

Ezután adja hozzá a következő metódusdefiníciót a ComputerVisionQuickstart osztályhoz. Módosítsa a értékét úgy, localFilePath hogy megfeleljen a képfájlnak.

/**
 * OCR with READ : Performs a Read Operation on a local image
 * @param client instantiated vision client
 * @param localFilePath local file path from which to perform the read operation against
 */
private static void ReadFromFile(ComputerVisionClient client) {
    System.out.println("-----------------------------------------------");
    
    String localFilePath = "src\\main\\resources\\myImage.png";
    System.out.println("Read with local file: " + localFilePath);

A Read API hívása

Ezután adja hozzá a következő kódot a readInStreamWithServiceResponseAsync metódusnak az adott rendszerképhez való hívására.


try {
    File rawImage = new File(localFilePath);
    byte[] localImageBytes = Files.readAllBytes(rawImage.toPath());

    // Cast Computer Vision to its implementation to expose the required methods
    ComputerVisionImpl vision = (ComputerVisionImpl) client.computerVision();

    // Read in remote image and response header
    ReadInStreamHeaders responseHeader =
            vision.readInStreamWithServiceResponseAsync(localImageBytes, null, null)
                .toBlocking()
                .single()
                .headers();

A következő kódblokk kinyeri a műveletazonosítót az Olvasás hívás válaszból. Ezt az azonosítót egy segítő metódussal használja a szöveges olvasási eredmények konzolra való nyomtatására.

// Extract the operationLocation from the response header
String operationLocation = responseHeader.operationLocation();
System.out.println("Operation Location:" + operationLocation);

getAndPrintReadResult(vision, operationLocation);

Zárja be a try/catch blokkot és a metódus definícióját.


    } catch (Exception e) {
        System.out.println(e.getMessage());
        e.printStackTrace();
    }
}

Olvasási eredmények lekérte

Ezután adjon hozzá egy definíciót a segítő metódushoz. Ez a metódus az előző lépés műveletazonosítójával lekérdezi az olvasási műveletet, és lekérdezi az OCR-eredményeket, amikor azok elérhetők.

/**
 * Polls for Read result and prints results to console
 * @param vision Computer Vision instance
 * @return operationLocation returned in the POST Read response header
 */
private static void getAndPrintReadResult(ComputerVision vision, String operationLocation) throws InterruptedException {
    System.out.println("Polling for Read results ...");

    // Extract OperationId from Operation Location
    String operationId = extractOperationIdFromOpLocation(operationLocation);

    boolean pollForResult = true;
    ReadOperationResult readResults = null;

    while (pollForResult) {
        // Poll for result every second
        Thread.sleep(1000);
        readResults = vision.getReadResult(UUID.fromString(operationId));

        // The results will no longer be null when the service has finished processing the request.
        if (readResults != null) {
            // Get request status
            OperationStatusCodes status = readResults.status();

            if (status == OperationStatusCodes.FAILED || status == OperationStatusCodes.SUCCEEDED) {
                pollForResult = false;
            }
        }
    }

A metódus többi része elemezi az OCR eredményeit, és kinyomtatja őket a konzolon.

    // Print read results, page per page
    for (ReadResult pageResult : readResults.analyzeResult().readResults()) {
        System.out.println("");
        System.out.println("Printing Read results for page " + pageResult.page());
        StringBuilder builder = new StringBuilder();

        for (Line line : pageResult.lines()) {
            builder.append(line.text());
            builder.append("\n");
        }

        System.out.println(builder.toString());
    }
}

Végül adja hozzá a fent használt másik segítő metódust, amely kinyeri a művelet azonosítóját a kezdeti válaszból.

/**
 * Extracts the OperationId from a Operation-Location returned by the POST Read operation
 * @param operationLocation
 * @return operationId
 */
private static String extractOperationIdFromOpLocation(String operationLocation) {
    if (operationLocation != null && !operationLocation.isEmpty()) {
        String[] splits = operationLocation.split("/");

        if (splits != null && splits.length > 0) {
            return splits[splits.length - 1];
        }
    }
    throw new IllegalStateException("Something went wrong: Couldn't extract the operation id from the operation location");
}

Az alkalmazás futtatása

Az alkalmazást a következővel építheti fel:

gradle build

Futtassa az alkalmazást az gradle run paranccsal:

gradle run

Az erőforrások eltávolítása

Ha törölni vagy eltávolítani szeretne egy Cognitive Services előfizetést, törölheti az erőforrást vagy erőforráscsoportot. Az erőforráscsoport törlésével a hozzá társított összes többi erőforrást is törli.

Következő lépések

Ebben a rövid útmutatóban megtanulta, hogyan telepítheti az OCR ügyféloldali kódtárat, és hogyan használhatja a Read API-t. A következő lépés a Read API-funkciókkal kapcsolatos további tudnivalók.

Az optikai karakterfelismerési ügyféloldali kódtár használatával nyomtatott és kézzel írt szövegeket olvashat be a Read API-val.

Referenciadokumentáció | Kódtár forráskódja | Csomag (npm) | Minták

Előfeltételek

  • Azure-előfizetés – Hozzon létre egyet ingyenesen
  • ANode.js
  • Ha már rendelkezik Azure-előfizetéssel, hozzon létre egy Computer Vision-erőforrást, Computer Vision erőforrást a Azure Portal a kulcs és a végpont lekért létrehozásához. Az üzembe helyezés után kattintson az Erőforráshoz való ugrás gombra.
    • Szüksége lesz a létrehozott erőforrás kulcsára és végpontjára az alkalmazás a Computer Vision csatlakoztatásához. A kulcsot és a végpontot a rövid útmutató későbbi, alábbi kódába fogja beilleszteni.
    • Az ingyenes tarifacsomag ( ) használatával kipróbálhatja a szolgáltatást, és később frissíthet fizetős szolgáltatási szintre éles F0 környezetben.

Beállítása

Új Node.js-alkalmazás létrehozása

Egy konzolablakban (például cmd, PowerShell vagy Bash) hozzon létre egy új könyvtárat az alkalmazáshoz, és keresse meg.

mkdir myapp && cd myapp

Az parancs npm init futtatásával hozzon létre egy node-alkalmazást egy package.json fájllal.

npm init

Az ügyféloldali kódtár telepítése

Telepítse az ms-rest-azure és @azure/cognitiveservices-computervision az NPM-csomagot:

npm install @azure/cognitiveservices-computervision

Telepítse az async modult is:

npm install async

Az alkalmazás package.json fájlja frissül a függőségekkel.

Tipp

Szeretné egyszerre megtekinteni a teljes gyorsindítási kódfájlt? Ez a GitHubon található,amely a rövid útmutatóban található példakódokat tartalmazza.

Hozzon létre egy új fájlt, index.js, majd nyissa meg egy szövegszerkesztőben.

Az előfizetői kulcs és a végpont megkeresve

Nyissa meg az Azure Portalt. Ha Computer Vision az Előfeltételek szakaszban létrehozott erőforrás, kattintson az Erőforráshoz ugrás gombra a Következő lépések területen. Az előfizetési kulcsot és a végpontot az erőforrás kulcs- és végpontoldalán, az erőforrás-kezelés alatt találja.

Hozzon létre változókat a Computer Vision előfizetői előfizetési kulcshoz és végponthoz. Illessze be az előfizetői kulcsot és a végpontot az alábbi kódba, ahol a jel látható. A Computer Vision végpont a következő formában van: https://<your_computer_vision_resource_name>.cognitiveservices.azure.com/ .

'use strict';

const async = require('async');
const fs = require('fs');
const https = require('https');
const path = require("path");
const createReadStream = require('fs').createReadStream
const sleep = require('util').promisify(setTimeout);
const ComputerVisionClient = require('@azure/cognitiveservices-computervision').ComputerVisionClient;
const ApiKeyCredentials = require('@azure/ms-rest-js').ApiKeyCredentials;

/**
 * AUTHENTICATE
 * This single client is used for all examples.
 */
const key = 'PASTE_YOUR_COMPUTER_VISION_SUBSCRIPTION_KEY_HERE';
const endpoint = 'PASTE_YOUR_COMPUTER_VISION_ENDPOINT_HERE';

Fontos

Ne felejtse el eltávolítani az előfizetői kulcsot a kódból, amikor végzett, és soha ne tegye közzé nyilvánosan. Éles környezetben érdemes lehet biztonságos módon tárolni és elérni a hitelesítő adatokat. Például: Azure Key Vault.

Objektummodell

A következő osztályok és felületek az OCR sdk néhány fő funkcióját Node.js kezelik.

Név Leírás
ComputerVisionClient Erre az osztályra az összes Computer Vision szükség. Példányosodhat az előfizetés adataival, és a legtöbb rendszerkép-művelethez használhatja.

Kódpéldák

Ezek a kódrészletek a következő feladatok elvégzését mutatják be az OCR ügyféloldali kódtára Node.js:

Az ügyfél hitelesítése

Példányosíthat egy ügyfelet a végponttal és a kulccsal. Hozzon létre egy ApiKeyCredentials objektumot a kulccsal és a végponttal, majd hozzon létre vele egy ComputerVisionClient objektumot.

const computerVisionClient = new ComputerVisionClient(
  new ApiKeyCredentials({ inHeader: { 'Ocp-Apim-Subscription-Key': key } }), endpoint);

Ezután definiálhat egy függvényt, computerVision és deklarálhat egy aszinkron sorozatot az elsődleges függvény és a visszahívási függvény használatával. A szkript végén befejezi ezt a függvénydefiníciót, és meg fogja hívni.

function computerVision() {
  async.series([
    async function () {

Nyomtatott és kézzel írt szöveg olvasása

Az OCR szolgáltatás képes kinyerni a képen látható szöveget, és karakterfolyamra konvertálni. Ez a minta az Olvasási műveleteket használja.

Tesztképek beállítása

Mentse annak a képnek az URL-címét, amelyből szöveget szeretne kinyerni.

// URL images containing printed and/or handwritten text. 
// The URL can point to image files (.jpg/.png/.bmp) or multi-page files (.pdf, .tiff).
const printedTextSampleURL = 'https://moderatorsampleimages.blob.core.windows.net/samples/sample2.jpg';
const multiLingualTextURL = 'https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/MultiLingual.png';
const mixedMultiPagePDFURL = 'https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/MultiPageHandwrittenForm.pdf';

Megjegyzés

Helyi képből is olvashat szöveget. Lásd a ComputerVisionClient metódusokat, például a readInStream metódust. Vagy tekintse meg a GitHubon a helyi rendszerképekkel kapcsolatos forgatókönyveket tartalmazó mintakódot.

A Read API hívása

Definiálja a következő mezőket a függvényben, amelyek a Hívás állapotának olvasása értékeket jelölik.

// Status strings returned from Read API. NOTE: CASING IS SIGNIFICANT.
// Before Read 3.0, these are "Succeeded" and "Failed"
const STATUS_SUCCEEDED = "succeeded";
const STATUS_FAILED = "failed"

Adja hozzá az alábbi kódot, amely az readTextFromURL adott képekhez hívja meg a függvényt.

// Recognize text in printed image from a URL
console.log('Read printed text from URL...', printedTextSampleURL.split('/').pop());
const printedResult = await readTextFromURL(computerVisionClient, printedTextSampleURL);
printRecText(printedResult);

// Recognize multi-lingual text in a PNG from a URL
console.log('\nRead printed multi-lingual text in a PNG from URL...', multiLingualTextURL.split('/').pop());
const multiLingualResult = await readTextFromURL(computerVisionClient, multiLingualTextURL);
printRecText(multiLingualResult);

// Recognize printed text and handwritten text in a PDF from a URL
console.log('\nRead printed and handwritten text from a PDF from URL...', mixedMultiPagePDFURL.split('/').pop());
const mixedPdfResult = await readTextFromURL(computerVisionClient, mixedMultiPagePDFURL);
printRecText(mixedPdfResult);

Definiálja a readTextFromURL függvényt. Ez az olvasási metódust hívja meg az ügyfélobjektumon, amely egy műveletazonosítót ad vissza, és elindít egy aszinkron folyamatot a kép tartalmának beolvassa. Ezután a művelet azonosítóját használja a művelet állapotának ellenőrzéshez, amíg az eredmények vissza nem térnek. Visszaadják a kinyert eredményeket.

// Perform read and await the result from URL
async function readTextFromURL(client, url) {
  // To recognize text in a local image, replace client.read() with readTextInStream() as shown:
  let result = await client.read(url);
  // Operation ID is last path segment of operationLocation (a URL)
  let operation = result.operationLocation.split('/').slice(-1)[0];

  // Wait for read recognition to complete
  // result.status is initially undefined, since it's the result of read
  while (result.status !== STATUS_SUCCEEDED) { await sleep(1000); result = await client.getReadResult(operation); }
  return result.analyzeResult.readResults; // Return the first page of result. Replace [0] with the desired page if this is a multi-page file such as .pdf or .tiff.
}

Ezután határozza meg a segítő függvényt, amely kiírja az olvasási műveletek eredményeit a printRecText konzolra.

// Prints all text from Read result
function printRecText(readResults) {
  console.log('Recognized text:');
  for (const page in readResults) {
    if (readResults.length > 1) {
      console.log(`==== Page: ${page}`);
    }
    const result = readResults[page];
    if (result.lines.length) {
      for (const line of result.lines) {
        console.log(line.words.map(w => w.text).join(' '));
      }
    }
    else { console.log('No recognized text.'); }
  }
}

A függvény bezárása

Zárja be a computerVision függvényt, és hívja meg.


    },
    function () {
      return new Promise((resolve) => {
        resolve();
      })
    }
  ], (err) => {
    throw (err);
  });
}

computerVision();

Az alkalmazás futtatása

Futtassa az alkalmazást az node paranccsal a gyorsindítási fájlban.

node index.js

Az erőforrások eltávolítása

Ha törölni vagy eltávolítani szeretne egy Cognitive Services előfizetést, törölheti az erőforrást vagy az erőforráscsoportot. Az erőforráscsoport törlésével a hozzá társított összes többi erőforrást is törli.

Következő lépések

Ebben a rövid útmutatóban megtanulta, hogyan telepítheti az OCR ügyféloldali kódtárat, és hogyan használhatja a Read API-t. A következő lépés a Read API-funkciókkal kapcsolatos további tudnivalók.

Az OCR ügyféloldali kódtára segítségével nyomtatott és kézzel írt szöveget olvashat be képekről.

Referenciadokumentáció | Kódtár forráskódja | Csomag

Előfeltételek

  • Azure-előfizetés – Hozzon létre egyet ingyenesen
  • A Go legújabb verziója
  • Az Azure-előfizetés létrehozása után hozzon létre egy Computer Vision-erőforrást, Computer Vision erőforrást a Azure Portal a kulcs és a végpont lekért létrehozásához. Az üzembe helyezés után kattintson az Erőforráshoz való ugrás elemre.
    • Szüksége lesz a létrehozott erőforrás kulcsára és végpontjára az alkalmazás és a Computer Vision csatlakoztatásához. A kulcsot és a végpontot a rövid útmutató későbbi, alábbi kódába fogja beilleszteni.
    • Az ingyenes tarifacsomag ( ) használatával kipróbálhatja a szolgáltatást, és később frissíthet fizetős szolgáltatási szintre éles F0 környezetben.

Beállítása

Go-projektkönyvtár létrehozása

Egy konzolablakban (cmd, PowerShell, Terminal, Bash) hozzon létre egy új munkaterületet a Go-projekthez nevű névvel, és keresse my-app meg.

mkdir -p my-app/{src, bin, pkg}  
cd my-app

A munkaterület három mappát fog tartalmazni:

  • src – Ez a könyvtár forráskódot és csomagokat fog tartalmazni. A paranccsal telepített go get összes csomag ebbe a könyvtárba kerül.
  • pkg – Ez a könyvtár fogja tartalmazni a lefordított Go-csomagobjektumokat. Ezek a fájlok mind kiterjesztéssel .a vannak bővítve.
  • bin – Ez a könyvtár tartalmazza a futtatásakor létrehozott bináris végrehajtható go install fájlokat.

Tipp

A Go-munkaterületek szerkezetével kapcsolatos további információkért tekintse meg a Go nyelv dokumentációját. Ez az útmutató a és a beállításával kapcsolatos $GOPATH információkat $GOROOT tartalmaz.

A Go ügyféloldali kódtárának telepítése

Ezután telepítse a Go ügyféloldali kódtárát:

go get -u https://github.com/Azure/azure-sdk-for-go/tree/master/services/cognitiveservices/v2.1/computervision

vagy ha a depet használja, futtassa a következőt az adott repoban:

dep ensure -add https://github.com/Azure/azure-sdk-for-go/tree/master/services/cognitiveservices/v2.1/computervision

Go-alkalmazás létrehozása

Ezután hozzon létre egy nevű fájlt az src sample-app.go könyvtárban:

cd src
touch sample-app.go

Tipp

Szeretné egyszerre megtekinteni a teljes gyorsindítási kódfájlt? Ezt a GitHubon találhatjameg, amely ebben a rövid útmutatóban található példakódokat tartalmazza.

Nyissa sample-app.go meg az előnyben részesített IDE-ben vagy szövegszerkesztőben.

Deklarál egy környezetet a szkript gyökerében. Erre az objektumra szüksége lesz a legtöbb Computer Vision függvényhívások végrehajtásához.

Az előfizetői kulcs és a végpont megkeresve

Nyissa meg az Azure Portalt. Ha az Computer Vision szakaszban létrehozott erőforrás sikeresen üzembe lett stb., kattintson az Erőforrás ugrás gombra a Következő lépések területen. Az előfizetési kulcsot és a végpontot az erőforrás kulcs- és végpontoldalán, az erőforrás-kezelés alatt találja.

Hozzon létre változókat a Computer Vision előfizetői előfizetési kulcshoz és végponthoz. Illessze be az előfizetői kulcsot és a végpontot a következő kódba, ahol a jel látható. A Computer Vision végpont a következő formában van: https://<your_computer_vision_resource_name>.cognitiveservices.azure.com/ .

package main

import (
    "context"
    "encoding/json"
    "fmt"
    "github.com/Azure/azure-sdk-for-go/services/cognitiveservices/v2.0/computervision"
    "github.com/Azure/go-autorest/autorest"
    "io"
    "log"
    "os"
    "strings"
    "time"
)

// Declare global so don't have to pass it to all of the tasks.
var computerVisionContext context.Context

func main() {
    computerVisionKey := "PASTE_YOUR_COMPUTER_VISION_SUBSCRIPTION_KEY_HERE"
    endpointURL := "PASTE_YOUR_COMPUTER_VISION_ENDPOINT_HERE"

Fontos

Ne felejtse el eltávolítani az előfizetői kulcsot a kódból, amikor végzett, és soha ne tegye közzé nyilvánosan. Éles környezetben érdemes lehet biztonságos módon tárolni és elérni a hitelesítő adatokat. Például: Azure Key Vault.

A következő lépés a különböző OCR-műveletek végrehajtásához szükséges kód hozzáadása.

Objektummodell

Az alábbi osztályok és felületek az OCR Go SDK néhány fő funkcióját kezelik.

Név Leírás
BaseClient Erre az osztályra az összes Computer Vision, például képelemzéshez és szövegolvasáshoz is szükség van. Példányosodhat az előfizetés adataival, és a legtöbb képművelethez használhatja.
ReadOperationResult Ez a típus egy Kötegelt olvasási művelet eredményeit tartalmazza.

Kódpéldák

Ezek a kódrészletek azt mutatják be, hogyan kell elvégezni a következő feladatokat a Go OCR-ügyfélkódtárával:

Az ügyfél hitelesítése

Megjegyzés

Ez a lépés azt feltételezi, hogy létrehozott környezeti változókat a Computer Vision nevű kulcshoz és COMPUTER_VISION_SUBSCRIPTION_KEY COMPUTER_VISION_ENDPOINT végponthoz.

Hozzon létre egy függvényt, és adja hozzá a következő kódot, hogy példányosít egy ügyfelet main a végponttal és a kulccsal.

/*  
 * Configure the Computer Vision client
 */
computerVisionClient := computervision.New(endpointURL);
computerVisionClient.Authorizer = autorest.NewCognitiveServicesAuthorizer(computerVisionKey)

computerVisionContext = context.Background()
/*
 * END - Configure the Computer Vision client
 */

Nyomtatott és kézzel írt szöveg olvasása

Az OCR szolgáltatás képes olvasni a képeken látható szövegeket, és konvertálni karakterfolyamokká. Az ebben a szakaszban található kód egy függvényt határoz meg, amely az ügyfélobjektummal észleli és kinyeri a nyomtatott vagy kézzel írt szöveget a RecognizeTextReadAPIRemoteImage képen.

Adja hozzá a minta képhivatkozást és a függvényhívást a main függvényhez.

// Analyze text in an image, remote
BatchReadFileRemoteImage(computerVisionClient, printedImageURL)

Tipp

Helyi képből is kinyerhet szöveget. Lásd a BaseClient metódusokat, például a BatchReadFileInStream metódust. Vagy tekintse meg a GitHubon található mintakódot a helyi rendszerképeket érintő forgatókönyvekért.

A Read API hívása

Definiálja az új függvényt szöveg beolvasása RecognizeTextReadAPIRemoteImage érdekében. Adja hozzá az alábbi kódot, amely a BatchReadFile metódust hívja meg az adott rendszerképhez. Ez a metódus egy műveletazonosítót ad vissza, és elindít egy aszinkron folyamatot a kép tartalmának beolvassa.

func BatchReadFileRemoteImage(client computervision.BaseClient, remoteImageURL string) {
    fmt.Println("-----------------------------------------")
    fmt.Println("BATCH READ FILE - remote")
    fmt.Println()
    var remoteImage computervision.ImageURL
    remoteImage.URL = &remoteImageURL

    // The response contains a field called "Operation-Location", 
    // which is a URL with an ID that you'll use for GetReadOperationResult to access OCR results.
    textHeaders, err := client.BatchReadFile(computerVisionContext, remoteImage)
    if err != nil { log.Fatal(err) }

    // Use ExtractHeader from the autorest library to get the Operation-Location URL
    operationLocation := autorest.ExtractHeaderValue("Operation-Location", textHeaders.Response)

    numberOfCharsInOperationId := 36
    operationId := string(operationLocation[len(operationLocation)-numberOfCharsInOperationId : len(operationLocation)])

Olvasási eredmények lekérte

Ezután szerezze be a BatchReadFile hívásból visszaadott műveletazonosítót, és használja a GetReadOperationResult metódussal a szolgáltatás műveleti eredményeinek lekérdezéséhez. A következő kód egy másodperces időközönként ellenőrzi a műveletet, amíg az eredmények vissza nem térnek. Ezután kinyomtatja a kinyert szöveges adatokat a konzolon.

readOperationResult, err := client.GetReadOperationResult(computerVisionContext, operationId)
if err != nil { log.Fatal(err) }

// Wait for the operation to complete.
i := 0
maxRetries := 10

fmt.Println("Recognizing text in a remote image with the batch Read API ...")
for readOperationResult.Status != computervision.Failed &&
        readOperationResult.Status != computervision.Succeeded {
    if i >= maxRetries {
        break
    }
    i++

    fmt.Printf("Server status: %v, waiting %v seconds...\n", readOperationResult.Status, i)
    time.Sleep(1 * time.Second)

    readOperationResult, err = client.GetReadOperationResult(computerVisionContext, operationId)
    if err != nil { log.Fatal(err) }
}

Olvasási eredmények megjelenítése

Adja hozzá a következő kódot a lekért szöveges adatok megjelenítéséhez és a függvénydefiníció befejezéséhez.

// Display the results.
fmt.Println()
for _, recResult := range *(readOperationResult.RecognitionResults) {
    for _, line := range *recResult.Lines {
        fmt.Println(*line.Text)
    }
}

Az alkalmazás futtatása

Futtassa az alkalmazást az alkalmazáskönyvtárból az go run paranccsal.

go run sample-app.go

Az erőforrások eltávolítása

Ha törölni vagy eltávolítani szeretne egy Cognitive Services előfizetést, törölheti az erőforrást vagy erőforráscsoportot. Az erőforráscsoport törlésével a hozzá társított összes többi erőforrást is törli.

Következő lépések

Ebben a rövid útmutatóban megtanulta, hogyan telepítheti az OCR ügyféloldali kódtárat, és hogyan használhatja a Read API-t. A következő lépés a Read API-funkciókkal kapcsolatos további tudnivalók.

Az optikai karakterfelismerési REST API nyomtatott és kézzel írott szöveg elolvasása.

Megjegyzés

Ez a rövid útmutató cURL-parancsokat használ a REST API. Az alkalmazás egy REST API is hívható. Az alábbi GitHub C#, Python, Java, JavaScriptés Go nyelven talál példákat.

Előfeltételek

  • Azure-előfizetés – Hozzon létre egyet ingyenesen
  • Ha már rendelkezik Azure-előfizetéssel, hozzon létre egy Computer Vision-erőforrást, és hozzon Computer Vision erőforrást a Azure Portal a kulcs és a végpont lekért létrehozásához. Az üzembe helyezés után kattintson az Erőforráshoz való ugrás gombra.
    • Szüksége lesz a létrehozott erőforrás kulcsára és végpontjára az alkalmazás a Computer Vision szolgáltatáshoz való csatlakoztatásához. A kulcsot és a végpontot a rövid útmutató későbbi, alábbi kódába fogja beilleszteni.
    • Az ingyenes tarifacsomag ( ) használatával kipróbálhatja a szolgáltatást, és később frissíthet fizetős szintre F0 éles környezetben.
  • telepített cURL

Nyomtatott és kézzel írt szöveg kinyerása

Az OCR szolgáltatás képes kinyerni egy képen vagy dokumentumban látható szöveget, és konvertálni karakterfolyamra. További információ a szövegkinyerésről: Optikai karakterfelismerés (OCR) áttekintése.

A Read API hívása

A minta létrehozásához és futtatásához az alábbi lépéseket kell végrehajtania:

  1. Másolja az alábbi parancsot egy szövegszerkesztőbe.
  2. Hajtsa végre a következő módosításokat a parancs megfelelő területein:
    1. Cserélje le a <subscriptionKey> értéket az előfizetői azonosítóra.
    2. Cserélje le a kérelem URL-címének első részét ( ) a saját végponti westcentralus URL-címében található szövegre.

      Megjegyzés

      Az 2019. július 1. után létrehozott új erőforrások egyéni altartományneveket fognak használni. További információk és a regionális végpontok teljes listája: Cognitive Services egyéni altartománynevei nevei.

    3. Igény szerint cserélje a kép URL-címét a kérelem törzsében (https://upload.wikimedia.org/wikipedia/commons/thumb/a/af/Atomist_quote_from_Democritus.png/338px-Atomist_quote_from_Democritus.png\) egy másik elemzendő kép URL-címére.
  3. Nyisson meg egy parancsablakot.
  4. Illessze be a szövegszerkesztőből a parancsot, majd futtassa.
curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{\"url\":\"https://upload.wikimedia.org/wikipedia/commons/thumb/a/af/Atomist_quote_from_Democritus.png/338px-Atomist_quote_from_Democritus.png\"}"

A válasz tartalmazni fog egy Operation-Location fejlécet, amelynek értéke egy egyedi URL-cím. Ezt az URL-címet az Olvasási művelet eredményeinek lekérdezésére használhatja. Az URL-cím 48 óra múlva lejár.

Az előzetes verziójú funkciók használata

Az előzetes verziójú nyelvekről és funkciókról lásd: Modellverzió megadása a legújabb előzetes verzió használatára. Az előzetes verziójú modell az aktuálisan elérhető nyelvek és funkciók fejlesztéseit tartalmazza.

Olvasási eredmények lekérte

  1. Másolja a következő parancsot a szövegszerkesztőbe.
  2. Cserélje le az URL-címet az előző lépésben Operation-Location kimásott értékre.
  3. Hajtsa végre a következő módosításokat a parancs megfelelő területein:
    1. Cserélje le a <subscriptionKey> értéket az előfizetői azonosítóra.
  4. Nyisson meg egy parancsablakot.
  5. Illessze be a szövegszerkesztőből a parancsot, majd futtassa.
curl -v -X GET "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyzeResults/{operationId}" -H "Ocp-Apim-Subscription-Key: {subscription key}" --data-ascii "{body}" 

A válasz vizsgálata

A rendszer JSON formátumban adja vissza a sikeres választ. A mintaalkalmazás elemzi és megjeleníti a sikeres választ a parancssorban, a következő példához hasonló módon:

{
  "status": "succeeded",
  "createdDateTime": "2021-04-08T21:56:17.6819115+00:00",
  "lastUpdatedDateTime": "2021-04-08T21:56:18.4161316+00:00",
  "analyzeResult": {
    "version": "3.2",
    "readResults": [
      {
        "page": 1,
        "angle": 0,
        "width": 338,
        "height": 479,
        "unit": "pixel",
        "lines": [
          {
            "boundingBox": [
              25,
              14,
              318,
              14,
              318,
              59,
              25,
              59
            ],
            "text": "NOTHING",
            "appearance": {
              "style": {
                "name": "other",
                "confidence": 0.971
              }
            },
            "words": [
              {
                "boundingBox": [
                  27,
                  15,
                  294,
                  15,
                  294,
                  60,
                  27,
                  60
                ],
                "text": "NOTHING",
                "confidence": 0.994
              }
            ]
          }
        ]
      }
    ]
  }
}

Következő lépések

Ebben a rövid útmutatóban megtanulta, hogyan hívhatja meg a Read REST API. A következő lépés a Read API-funkciókkal kapcsolatos további tudnivalók.