Hızlı Başlangıç: Azure AI Vision v3.2 GA Okuma

Makale
08/11/2023

OCR (Okuma) sürümleri

Önemli

Gereksinimlerinize en uygun Okuma sürümünü seçin.

Girdi	Örnekler	Okuma sürümü	Avantaj
Görüntüler: Genel, vahşi görüntüler	etiketler, sokak işaretleri ve posterler	Görüntüler için OCR (sürüm 4.0)	Kullanıcı deneyimi senaryolarınıza OCR eklemeyi kolaylaştıran, performans açısından geliştirilmiş zaman uyumlu API'ye sahip genel, belge dışı görüntüler için iyileştirilmiştir.
Belgeler: Resimler de dahil olmak üzere dijital ve taranmış	kitaplar, makaleler ve raporlar	Belge Zekası okuma modeli	Akıllı belge işlemeyi büyük ölçekte otomatikleştirmeye yardımcı olmak için zaman uyumsuz API ile metin ağırlıklı taranmış ve dijital belgeler için iyileştirilmiştir.

Azure AI Vision v3.2 GA Okuma hakkında

En son Azure AI Vision v3.2 GA Okumasını mı arıyorsunuz? Gelecekteki tüm Okuma OCR geliştirmeleri, daha önce listelenen iki hizmetin bir parçasıdır. Azure AI Vision v3.2'de başka güncelleştirme yok. Daha fazla bilgi için bkz . Azure AI Vision 3.2 GA Okuma API'sini çağırma ve Hızlı Başlangıç: Azure AI Vision v3.2 GA Okuma.

Azure AI Vision Okuma REST API'sini veya istemci kitaplıklarını kullanmaya başlayın. Okuma API'si, görüntülerden metin ayıklamak ve bunu yapılandırılmış dizeler olarak döndürmek için size yapay zeka algoritmaları sağlar. Uygulamanıza paket yüklemek için bu adımları izleyin ve temel görevler için örnek kodu deneyin.

Bir görüntüden yazdırılan ve el yazısı metinleri okumak için optik karakter tanıma (OCR) istemci kitaplığını kullanın. OCR hizmeti bir görüntüdeki görünür metni okuyabilir ve bir karakter akışına dönüştürebilir. Metin tanıma hakkında daha fazla bilgi için bkz. OCR'ye genel bakış. Bu bölümdeki kod, en son Azure AI Vision paketini kullanır.

İpucu

Yerel görüntüden metin de ayıklayabilirsiniz. ReadInStreamAsync gibi ComputerVisionClient yöntemlerine bakın. Alternatif olarak, yerel görüntüleri içeren senaryolar için GitHub'da örnek koda bakın.

Başvuru belgeleri | Kitaplık kaynak kodu | Paketi (NuGet)Örnekleri |

Önkoşullar

Azure aboneliği - Ücretsiz bir abonelik oluşturun.
Visual Studio IDE veya .NET Core'un geçerli sürümü.
Azure AI Vision kaynağı. Hizmeti denemek ve daha sonra üretim için ücretli bir katmana yükseltmek için ücretsiz fiyatlandırma katmanını (F0) kullanabilirsiniz.
Uygulamanızı Azure AI Vision hizmetine bağlamak için oluşturduğunuz kaynaktan alınan anahtar ve uç nokta.
1. Azure Vision kaynağınız dağıtıldıktan sonra Kaynağa git'i seçin.
2. Sol gezinti menüsünde Anahtarlar ve Uç Nokta'yı seçin.
3. Hızlı başlangıcın ilerleyen bölümlerinde kullanmak üzere anahtarlardan birini ve Uç Noktayı kopyalayın.

Ortam değişkenlerini oluşturma

Bu örnekte, kimlik bilgilerinizi uygulamayı çalıştıran yerel makinedeki ortam değişkenlerine yazın.

Azure portalına gidin. Önkoşullar bölümünde oluşturduğunuz kaynak başarıyla dağıtıldıysa, Sonraki Adımlar'ın altında Kaynağa git'i seçin. Anahtarınızı ve uç noktanızı Anahtarlar ve Uç Nokta sayfasındaki Kaynak Yönetimi'nin altında bulabilirsiniz. Kaynak anahtarınız Azure abonelik kimliğiniz ile aynı değildir.

İpucu

Anahtarı doğrudan kodunuz içinde eklemeyin ve asla herkese açık olarak göndermeyin. Azure Key Vault gibi daha fazla kimlik doğrulama seçeneği için Azure AI hizmetleri güvenlik makalesine bakın.

Anahtarınızın ve uç noktanızın ortam değişkenini ayarlamak için bir konsol penceresi açın ve işletim sisteminiz ve geliştirme ortamınıza yönelik yönergeleri izleyin.

Ortam değişkenini VISION_KEY ayarlamak için değerini kaynağınızın anahtarlarından biriyle değiştirin your-key .
Ortam değişkenini VISION_ENDPOINT ayarlamak için değerini kaynağınızın uç noktasıyla değiştirin your-endpoint .

Windows
Linux

setx VISION_KEY your-key

setx VISION_ENDPOINT your-endpoint

Ortam değişkenlerini ekledikten sonra, konsol penceresi de dahil olmak üzere ortam değişkenlerini okuyacak tüm çalışan programları yeniden başlatmanız gerekebilir.

export VISION_KEY=your-key

export VISION_ENDPOINT=your-endpoint

Ortam değişkenlerini ekledikten sonra, değişiklikleri etkili hale getirmek için konsol pencerenizden komutunu çalıştırın source ~/.bashrc .

Yazdırılan ve el yazısı metinleri okuma

Yeni bir C# uygulaması oluşturun.
- Visual Studio IDE
- CLI
Visual Studio'yu kullanarak C#, Windows, Console için bir Konsol Uygulaması (.NET Framework) projesi oluşturun.

Yeni bir proje oluşturduktan sonra istemci kitaplığını yükleyin:
1. Çözüm Gezgini proje çözümüne sağ tıklayın ve Çözüm için NuGet Paketlerini Yönet'i seçin.
2. Açılan paket yöneticisinde Gözat'ı seçin. Ön sürümü dahil et'i seçin.
3. Microsoft.Azure.CognitiveServices.Vision.ComputerVision araması yapın ve sonuçlardan bunu seçin.
4. Ayrıntılar iletişim kutusunda projenizi seçin ve en son kararlı sürümü seçin. Ardından Yükle’yi seçin.
1. Konsol penceresinde komutunu kullanarak dotnet new adlı computer-vision-quickstartyeni bir konsol uygulaması oluşturun.
```
dotnet new console -n computer-vision-quickstart
```
  Bu komut, tek bir kaynak dosyayla basit bir Merhaba Dünya C# projesi oluşturur: Program.cs.
2. Dizini yeni oluşturulan uygulama klasörüne değiştirin ve uygulamayı derleyin:
```
dotnet build
```
  Derleme çıkışı hiçbir uyarı veya hata içermemelidir.
```
...
Build succeeded.
 0 Warning(s)
 0 Error(s)
...
```
3. Uygulama dizininde, aşağıdaki komutu kullanarak .NET için Azure AI Vision istemci kitaplığını yükleyin:
```
dotnet add package Microsoft.Azure.CognitiveServices.Vision.ComputerVision --version 7.0.0
```

Proje dizininden Program.cs dosyasını tercih ettiğiniz düzenleyicide veya IDE'de açın. Program.cs içeriğini aşağıdaki kodla değiştirin.

using System;
using System.Collections.Generic;
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision;
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models;
using System.Threading.Tasks;
using System.IO;
using Newtonsoft.Json;
using Newtonsoft.Json.Linq;
using System.Threading;
using System.Linq;

namespace ComputerVisionQuickstart
{
    class Program
    {
        // Add your Computer Vision key and endpoint
        static string key = Environment.GetEnvironmentVariable("VISION_KEY");
        static string endpoint = Environment.GetEnvironmentVariable("VISION_ENDPOINT");

        private const string READ_TEXT_URL_IMAGE = "https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg";

        static void Main(string[] args)
        {
            Console.WriteLine("Azure Cognitive Services Computer Vision - .NET quickstart example");
            Console.WriteLine();

            ComputerVisionClient client = Authenticate(endpoint, key);

            // Extract text (OCR) from a URL image using the Read API
            ReadFileUrl(client, READ_TEXT_URL_IMAGE).Wait();
        }

        public static ComputerVisionClient Authenticate(string endpoint, string key)
        {
            ComputerVisionClient client =
              new ComputerVisionClient(new ApiKeyServiceClientCredentials(key))
              { Endpoint = endpoint };
            return client;
        }

        public static async Task ReadFileUrl(ComputerVisionClient client, string urlFile)
        {
            Console.WriteLine("----------------------------------------------------------");
            Console.WriteLine("READ FILE FROM URL");
            Console.WriteLine();

            // Read text from URL
            var textHeaders = await client.ReadAsync(urlFile);
            // After the request, get the operation location (operation ID)
            string operationLocation = textHeaders.OperationLocation;
            Thread.Sleep(2000);

            // Retrieve the URI where the extracted text will be stored from the Operation-Location header.
            // We only need the ID and not the full URL
            const int numberOfCharsInOperationId = 36;
            string operationId = operationLocation.Substring(operationLocation.Length - numberOfCharsInOperationId);

            // Extract the text
            ReadOperationResult results;
            Console.WriteLine($"Extracting text from URL file {Path.GetFileName(urlFile)}...");
            Console.WriteLine();
            do
            {
                results = await client.GetReadResultAsync(Guid.Parse(operationId));
            }
            while ((results.Status == OperationStatusCodes.Running ||
                results.Status == OperationStatusCodes.NotStarted));

            // Display the found text.
            Console.WriteLine();
            var textUrlFileResults = results.AnalyzeResult.ReadResults;
            foreach (ReadResult page in textUrlFileResults)
            {
                foreach (Line line in page.Lines)
                {
                    Console.WriteLine(line.Text);
                }
            }
            Console.WriteLine();
        }

    }
}

İsteğe bağlı bir adım olarak bkz . Verilerin nasıl işleneceğini belirleme. Örneğin, en son GA modelini açıkça belirtmek için çağrıyı ReadAsync gösterildiği gibi düzenleyin. Parametresini atlayın veya en son GA modelini kullanmak için kullanın "latest" .
```
  // Read text from URL with a specific model version
  var textHeaders = await client.ReadAsync(urlFile,null,null,"2022-04-30");
```
Uygulamayı çalıştırın.
- Visual Studio IDE
- CLI
- Hata Ayıkla menüsünden Hata Ayıklamayı Başlat'ı seçin.
- dotnet run Komutunu proje dizininizde kullanın.
```
dotnet run
```

Çıktı

Azure AI Vision - .NET quickstart example

----------------------------------------------------------
READ FILE FROM URL

Extracting text from URL file printed_text.jpg...


Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.

Kaynakları temizleme

Azure AI hizmetleri aboneliğini temizlemek ve kaldırmak istiyorsanız, kaynağı veya kaynak grubunu silebilirsiniz. Kaynak grubunun silinmesi, kaynak grubuyla ilişkili diğer tüm kaynakları da siler.

Sonraki adımlar

Bu hızlı başlangıçta, OCR istemci kitaplığını yüklemeyi ve Okuma API'sini kullanmayı öğrendiniz. Ardından Okuma API'sinin özellikleri hakkında daha fazla bilgi edinin.

Okuma API'sini çağırma

OCR'ye genel bakış
Bu örneğin kaynak kodu GitHub'da bulunabilir.

Uzak bir görüntüden yazdırılan ve el yazısı metinleri okumak için optik karakter tanıma (OCR) istemci kitaplığını kullanın. OCR hizmeti bir görüntüdeki görünür metni okuyabilir ve bir karakter akışına dönüştürebilir. Metin tanıma hakkında daha fazla bilgi için bkz. OCR'ye genel bakış.

İpucu

Yerel görüntüden metin de okuyabilirsiniz. bkz. read_in_stream gibi ComputerVisionClientOperationsMixin yöntemleri. Alternatif olarak, yerel görüntüleri içeren senaryolar için GitHub'da örnek koda bakın.

Başvuru belgeleri | Kitaplık kaynak kodu | Paketi (PiPy)Örnekler |

Önkoşullar

Azure aboneliği - Ücretsiz bir abonelik oluşturun.
Python 3.x.
Python yüklemeniz pip içermelidir. Pip'in yüklü olup olmadığını denetleyebilirsiniz, komut satırında komutunu çalıştırın pip --version . Python'ın en son sürümünü yükleyerek pip alın.
Azure AI Vision kaynağı. Hizmeti denemek ve daha sonra üretim için ücretli bir katmana yükseltmek için ücretsiz fiyatlandırma katmanını (F0) kullanabilirsiniz.
Uygulamanızı Azure AI Vision hizmetine bağlamak için oluşturduğunuz kaynaktan alınan anahtar ve uç nokta.
1. Azure Vision kaynağınız dağıtıldıktan sonra Kaynağa git'i seçin.
2. Sol gezinti menüsünde Anahtarlar ve Uç Nokta'yı seçin.
3. Hızlı başlangıcın ilerleyen bölümlerinde kullanmak üzere anahtarlardan birini ve Uç Noktayı kopyalayın.

Ortam değişkenlerini oluşturma

Bu örnekte, kimlik bilgilerinizi uygulamayı çalıştıran yerel makinedeki ortam değişkenlerine yazın.

İpucu

Anahtarınızın ve uç noktanızın ortam değişkenini ayarlamak için bir konsol penceresi açın ve işletim sisteminiz ve geliştirme ortamınıza yönelik yönergeleri izleyin.

Ortam değişkenini VISION_KEY ayarlamak için değerini kaynağınızın anahtarlarından biriyle değiştirin your-key .
Ortam değişkenini VISION_ENDPOINT ayarlamak için değerini kaynağınızın uç noktasıyla değiştirin your-endpoint .

Windows
Linux

setx VISION_KEY your-key

setx VISION_ENDPOINT your-endpoint

Ortam değişkenlerini ekledikten sonra, konsol penceresi de dahil olmak üzere ortam değişkenlerini okuyacak tüm çalışan programları yeniden başlatmanız gerekebilir.

export VISION_KEY=your-key

export VISION_ENDPOINT=your-endpoint

Ortam değişkenlerini ekledikten sonra, değişiklikleri etkili hale getirmek için konsol pencerenizden komutunu çalıştırın source ~/.bashrc .

Yazdırılan ve el yazısı metinleri okuma

İstemci kitaplığını yükleyin.

Konsol penceresinde aşağıdaki komutu çalıştırın:
```
pip install --upgrade azure-cognitiveservices-vision-computervision
```
Yastık kitaplığını yükleyin.
```
pip install pillow
```
quickstart-file.py yeni bir Python uygulama dosyası oluşturun. Ardından tercih ettiğiniz düzenleyicide veya IDE'de açın.

quickstart-file.py içeriğini aşağıdaki kodla değiştirin.

from azure.cognitiveservices.vision.computervision import ComputerVisionClient
from azure.cognitiveservices.vision.computervision.models import OperationStatusCodes
from azure.cognitiveservices.vision.computervision.models import VisualFeatureTypes
from msrest.authentication import CognitiveServicesCredentials

from array import array
import os
from PIL import Image
import sys
import time

'''
Authenticate
Authenticates your credentials and creates a client.
'''
subscription_key = os.environ["VISION_KEY"]
endpoint = os.environ["VISION_ENDPOINT"]

computervision_client = ComputerVisionClient(endpoint, CognitiveServicesCredentials(subscription_key))
'''
END - Authenticate
'''

'''
OCR: Read File using the Read API, extract text - remote
This example will extract text in an image, then print results, line by line.
This API call can also extract handwriting style text (not shown).
'''
print("===== Read File - remote =====")
# Get an image with text
read_image_url = "https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png"

# Call API with URL and raw response (allows you to get the operation location)
read_response = computervision_client.read(read_image_url,  raw=True)

# Get the operation location (URL with an ID at the end) from the response
read_operation_location = read_response.headers["Operation-Location"]
# Grab the ID from the URL
operation_id = read_operation_location.split("/")[-1]

# Call the "GET" API and wait for it to retrieve the results 
while True:
    read_result = computervision_client.get_read_result(operation_id)
    if read_result.status not in ['notStarted', 'running']:
        break
    time.sleep(1)

# Print the detected text, line by line
if read_result.status == OperationStatusCodes.succeeded:
    for text_result in read_result.analyze_result.read_results:
        for line in text_result.lines:
            print(line.text)
            print(line.bounding_box)
print()
'''
END - Read File - remote
'''

print("End of Computer Vision quickstart.")

İsteğe bağlı bir adım olarak bkz . Verilerin nasıl işleneceğini belirleme. Örneğin, en son GA modelini açıkça belirtmek için deyimini read gösterildiği gibi düzenleyin. parametresini atlamak veya kullanmak "latest" otomatik olarak en son GA modelini kullanır.
```
   # Call API with URL and raw response (allows you to get the operation location)
   read_response = computervision_client.read(read_image_url,  raw=True, model_version="2022-04-30")
```
Uygulamayı hızlı başlangıç dosyanızdaki python komutuyla çalıştırın.
```
python quickstart-file.py
```

Çıktı

===== Read File - remote =====
The quick brown fox jumps
[38.0, 650.0, 2572.0, 699.0, 2570.0, 854.0, 37.0, 815.0]
Over
[184.0, 1053.0, 508.0, 1044.0, 510.0, 1123.0, 184.0, 1128.0]
the lazy dog!
[639.0, 1011.0, 1976.0, 1026.0, 1974.0, 1158.0, 637.0, 1141.0]

End of Azure AI Vision quickstart.

Kaynakları temizleme

Sonraki adımlar

Bu hızlı başlangıçta, OCR istemci kitaplığını yüklemeyi ve Okuma API'sini kullanmayı öğrendiniz. Ardından Okuma API'sinin özellikleri hakkında daha fazla bilgi edinin.

Okuma API'sini çağırma

OCR'ye genel bakış
Bu örneğin kaynak kodu GitHub'da bulunabilir.

Okuma API'siyle yazdırılan ve el yazısı metinleri okumak için optik karakter tanıma (OCR) istemci kitaplığını kullanın. OCR hizmeti bir görüntüdeki görünür metni okuyabilir ve bir karakter akışına dönüştürebilir. Metin tanıma hakkında daha fazla bilgi için bkz. OCR'ye genel bakış.

İpucu

Yerel görüntüden metin de okuyabilirsiniz. ReadInStream gibi ComputerVisionClient yöntemlerine bakın. Alternatif olarak, yerel görüntüleri içeren senaryolar için GitHub'da örnek koda bakın.

Başvuru belgeleri | Kitaplık kaynak kodu | Paketi (npm)Örnekler |

Önkoşullar

Azure aboneliği - Ücretsiz bir abonelik oluşturun.
Node.js’nin geçerli sürümü.
Azure AI Vision kaynağı. Hizmeti denemek ve daha sonra üretim için ücretli bir katmana yükseltmek için ücretsiz fiyatlandırma katmanını (F0) kullanabilirsiniz.
Uygulamanızı Azure AI Vision hizmetine bağlamak için oluşturduğunuz kaynaktan alınan anahtar ve uç nokta.
1. Azure Vision kaynağınız dağıtıldıktan sonra Kaynağa git'i seçin.
2. Sol gezinti menüsünde Anahtarlar ve Uç Nokta'yı seçin.
3. Hızlı başlangıcın ilerleyen bölümlerinde kullanmak üzere anahtarlardan birini ve Uç Noktayı kopyalayın.

Ortam değişkenlerini oluşturma

Bu örnekte, kimlik bilgilerinizi uygulamayı çalıştıran yerel makinedeki ortam değişkenlerine yazın.

İpucu

Anahtarınızın ve uç noktanızın ortam değişkenini ayarlamak için bir konsol penceresi açın ve işletim sisteminiz ve geliştirme ortamınıza yönelik yönergeleri izleyin.

Ortam değişkenini VISION_KEY ayarlamak için değerini kaynağınızın anahtarlarından biriyle değiştirin your-key .
Ortam değişkenini VISION_ENDPOINT ayarlamak için değerini kaynağınızın uç noktasıyla değiştirin your-endpoint .

Windows
Linux

setx VISION_KEY your-key

setx VISION_ENDPOINT your-endpoint

Ortam değişkenlerini ekledikten sonra, konsol penceresi de dahil olmak üzere ortam değişkenlerini okuyacak tüm çalışan programları yeniden başlatmanız gerekebilir.

export VISION_KEY=your-key

export VISION_ENDPOINT=your-endpoint

Ortam değişkenlerini ekledikten sonra, değişiklikleri etkili hale getirmek için konsol pencerenizden komutunu çalıştırın source ~/.bashrc .

Yazdırılan ve el yazısı metinleri okuma

Yeni bir Node.js uygulaması oluşturun.

Konsol penceresinde uygulamanız için yeni bir dizin oluşturun ve bu dizine gidin.
```
mkdir myapp
cd myapp
```
Bir package.json dosyası ile bir düğüm uygulaması oluşturmak için npm init komutunu çalıştırın. İstemler için Enter'ı seçin.
```
npm init
```
İstemci kitaplığını yüklemek için ve @azure/cognitiveservices-computervision npm paketini yükleyinms-rest-azure:
```
npm install ms-rest-azure
npm install @azure/cognitiveservices-computervision
```
Zaman uyumsuz modülü yükleyin:
```
npm install async
```
Uygulamanızın package.json dosyası bağımlılıklarla güncelleştirilir.
Yeni bir dosya oluşturun, index.js ve bir metin düzenleyicisinde açın.

Aşağıdaki kodu index.js dosyanıza yapıştırın.

'use strict';

const async = require('async');
const fs = require('fs');
const https = require('https');
const path = require("path");
const createReadStream = require('fs').createReadStream
const sleep = require('util').promisify(setTimeout);
const ComputerVisionClient = require('@azure/cognitiveservices-computervision').ComputerVisionClient;
const ApiKeyCredentials = require('@azure/ms-rest-js').ApiKeyCredentials;
/**
 * AUTHENTICATE
 * This single client is used for all examples.
 */
const key = process.env.VISION_KEY;
const endpoint = process.env.VISION_ENDPOINT;

const computerVisionClient = new ComputerVisionClient(
  new ApiKeyCredentials({ inHeader: { 'Ocp-Apim-Subscription-Key': key } }), endpoint);
/**
 * END - Authenticate
 */

function computerVision() {
  async.series([
    async function () {

      /**
       * OCR: READ PRINTED & HANDWRITTEN TEXT WITH THE READ API
       * Extracts text from images using OCR (optical character recognition).
       */
      console.log('-------------------------------------------------');
      console.log('READ PRINTED, HANDWRITTEN TEXT AND PDF');
      console.log();

      // URL images containing printed and/or handwritten text. 
      // The URL can point to image files (.jpg/.png/.bmp) or multi-page files (.pdf, .tiff).
      const printedTextSampleURL = 'https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg';

      // Recognize text in printed image from a URL
      console.log('Read printed text from URL...', printedTextSampleURL.split('/').pop());
      const printedResult = await readTextFromURL(computerVisionClient, printedTextSampleURL);
      printRecText(printedResult);

      // Perform read and await the result from URL
      async function readTextFromURL(client, url) {
        // To recognize text in a local image, replace client.read() with readTextInStream() as shown:
        let result = await client.read(url);
        // Operation ID is last path segment of operationLocation (a URL)
        let operation = result.operationLocation.split('/').slice(-1)[0];

        // Wait for read recognition to complete
        // result.status is initially undefined, since it's the result of read
        while (result.status !== "succeeded") { await sleep(1000); result = await client.getReadResult(operation); }
        return result.analyzeResult.readResults; // Return the first page of result. Replace [0] with the desired page if this is a multi-page file such as .pdf or .tiff.
      }

      // Prints all text from Read result
      function printRecText(readResults) {
        console.log('Recognized text:');
        for (const page in readResults) {
          if (readResults.length > 1) {
            console.log(`==== Page: ${page}`);
          }
          const result = readResults[page];
          if (result.lines.length) {
            for (const line of result.lines) {
              console.log(line.words.map(w => w.text).join(' '));
            }
          }
          else { console.log('No recognized text.'); }
        }
      }

      /**
       * 
       * Download the specified file in the URL to the current local folder
       * 
       */
      function downloadFilesToLocal(url, localFileName) {
        return new Promise((resolve, reject) => {
          console.log('--- Downloading file to local directory from: ' + url);
          const request = https.request(url, (res) => {
            if (res.statusCode !== 200) {
              console.log(`Download sample file failed. Status code: ${res.statusCode}, Message: ${res.statusMessage}`);
              reject();
            }
            var data = [];
            res.on('data', (chunk) => {
              data.push(chunk);
            });
            res.on('end', () => {
              console.log('   ... Downloaded successfully');
              fs.writeFileSync(localFileName, Buffer.concat(data));
              resolve();
            });
          });
          request.on('error', function (e) {
            console.log(e.message);
            reject();
          });
          request.end();
        });
      }

      /**
       * END - Recognize Printed & Handwritten Text
       */
      console.log();
      console.log('-------------------------------------------------');
      console.log('End of quickstart.');

    },
    function () {
      return new Promise((resolve) => {
        resolve();
      })
    }
  ], (err) => {
    throw (err);
  });
}

computerVision();

İsteğe bağlı bir adım olarak bkz . Verilerin nasıl işleneceğini belirleme. Örneğin, en son GA modelini açıkça belirtmek için deyimini read gösterildiği gibi düzenleyin. parametresini atlamak veya kullanmak "latest" otomatik olarak en son GA modelini kullanır.
```
  let result = await client.read(url,{modelVersion:"2022-04-30"});
```
Uygulamayı hızlı başlangıç dosyanızdaki node komutuyla çalıştırın.
```
node index.js
```

Çıktı

-------------------------------------------------
READ PRINTED, HANDWRITTEN TEXT AND PDF

Read printed text from URL... printed_text.jpg
Recognized text:
Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.

-------------------------------------------------
End of quickstart.

Kaynakları temizleme

Sonraki adımlar

Bu hızlı başlangıçta, OCR istemci kitaplığını yüklemeyi ve Okuma API'sini kullanmayı öğrendiniz. Ardından Okuma API'sinin özellikleri hakkında daha fazla bilgi edinin.

Okuma API'sini çağırma

OCR'ye genel bakış
Bu örneğin kaynak kodu GitHub'da bulunabilir.

Yazdırılan ve el yazısı metinleri okumak için optik karakter tanıma (OCR) REST API'sini kullanın.

Not

Bu hızlı başlangıçta REST API'yi çağırmak için cURL komutları kullanılır. Rest API'yi bir programlama dili kullanarak da çağırabilirsiniz. C#, Python , Java ve JavaScript örnekleri için GitHub örneklerine bakın.

Önkoşullar

Azure aboneliği - Ücretsiz bir abonelik oluşturun.
cURL yüklü.
Azure AI Vision kaynağı. Hizmeti denemek ve daha sonra üretim için ücretli bir katmana yükseltmek için ücretsiz fiyatlandırma katmanını (F0) kullanabilirsiniz.
Uygulamanızı Azure AI Vision hizmetine bağlamak için oluşturduğunuz kaynaktan alınan anahtar ve uç nokta.
1. Azure Vision kaynağınız dağıtıldıktan sonra Kaynağa git'i seçin.
2. Sol gezinti menüsünde Anahtarlar ve Uç Nokta'yı seçin.
3. Hızlı başlangıcın ilerleyen bölümlerinde kullanmak üzere anahtarlardan birini ve Uç Noktayı kopyalayın.

Yazdırılan ve el yazısı metinleri okuma

Optik karakter tanıma (OCR) hizmeti bir görüntü veya belgedeki görünür metni ayıklayabilir ve karakter akışına dönüştürebilir. Metin ayıklama hakkında daha fazla bilgi için bkz. OCR'ye genel bakış.

Okuma API'sini çağırma

Örneği oluşturup çalıştırmak için aşağıdaki adımları uygulayın:

Aşağıdaki komutu bir metin düzenleyicisine kopyalayın.
Gerektiğinde komutta aşağıdaki değişiklikleri yapın:
1. değerini <key> anahtarınız ile değiştirin.
2. İstek URL'sinin (https://westcentralus.api.cognitive.microsoft.com/) ilk bölümünü kendi uç nokta URL'nizdeki metinle değiştirin.
  
  Not
  
  1 Temmuz 2019'da oluşturulan yeni kaynaklar özel alt etki alanı adlarını kullanacaktır. Daha fazla bilgi ve bölgesel uç noktaların tam listesi için bkz . Azure AI hizmetleri için özel alt etki alanı adları.
3. İsteğe bağlı olarak, istek gövdesindeki görüntü URL’sini (https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png), analiz edilecek başka bir görüntünün URL’si ile değiştirin.
Bir komut istemi penceresi açın.
Metin düzenleyicisindeki komutu komut istemi penceresine yapıştırın ve komutu çalıştırın.

curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"

Yanıt, değeri benzersiz bir URL olan bir Operation-Location üst bilgi içerir. Okuma işleminin sonuçlarını sorgulamak için bu URL'yi kullanırsınız. URL'nin süresi 48 saat içinde dolar.

İsteğe bağlı olarak model sürümünü belirtin

İsteğe bağlı bir adım olarak bkz . Verilerin nasıl işleneceğini belirleme. Örneğin, en son GA modelini açıkça belirtmek için parametresi olarak kullanın model-version=2022-04-30 . parametresini atlamak veya kullanmak model-version=latest otomatik olarak en son GA modelini kullanır.

curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze?model-version=2022-04-30" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"

Okuma sonuçları alma

Aşağıdaki komutu metin düzenleyicinize kopyalayın.
URL'yi önceki yordamda kopyaladığınız değerle Operation-Location değiştirin.
değerini <key> anahtarınız ile değiştirin.
Bir konsol penceresi açın.

Metin düzenleyicisindeki komutu konsol penceresine yapıştırın ve ardından komutunu çalıştırın.

curl -v -X GET "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyzeResults/{operationId}" -H "Ocp-Apim-Subscription-Key: {key}" --data-ascii "{body}"

Yanıtı inceleme

Başarılı bir yanıt JSON biçiminde döndürülür. Örnek uygulama aşağıdaki örneğe benzer şekilde başarılı bir yanıtı ayrıştırıp konsol penceresinde görüntüler:

{
  "status": "succeeded",
  "createdDateTime": "2021-04-08T21:56:17.6819115+00:00",
  "lastUpdatedDateTime": "2021-04-08T21:56:18.4161316+00:00",
  "analyzeResult": {
    "version": "3.2",
    "readResults": [
      {
        "page": 1,
        "angle": 0,
        "width": 338,
        "height": 479,
        "unit": "pixel",
        "lines": [
          {
            "boundingBox": [
              25,
              14,
              318,
              14,
              318,
              59,
              25,
              59
            ],
            "text": "NOTHING",
            "appearance": {
              "style": {
                "name": "other",
                "confidence": 0.971
              }
            },
            "words": [
              {
                "boundingBox": [
                  27,
                  15,
                  294,
                  15,
                  294,
                  60,
                  27,
                  60
                ],
                "text": "NOTHING",
                "confidence": 0.994
              }
            ]
          }
        ]
      }
    ]
  }
}

Kaynakları temizleme

Sonraki adımlar

Bu hızlı başlangıçta Okuma REST API'sini çağırmayı öğrendiniz. Ardından Okuma API'sinin özellikleri hakkında daha fazla bilgi edinin.

Okuma API'sini çağırma

OCR'ye genel bakış

Önkoşullar

Azure aboneliği - Ücretsiz bir abonelik oluşturun.
Azure AI Vision kaynağı. Hizmeti denemek ve daha sonra üretim için ücretli bir katmana yükseltmek için ücretsiz fiyatlandırma katmanını (F0) kullanabilirsiniz.
BağlanVision Studio.
- Oturum açmanız gerekebilir.
- Oturum açtığınızda Tüm kaynakları görüntüle'yi seçin. Gerekirse Yenile'yi seçin. Kaynağınızın kullanılabilir olduğunu doğrulayın.
Daha fazla bilgi için bkz . Vision Studio'yu kullanmaya başlama.

Yazdırılan ve el yazısı metinleri okuma

Optik karakter tanıma'nın altında Görüntülerden metin ayıkla'yı seçin.
Deneyin bölümünde, bu tanıtımın Azure hesabınıza kullanım doğurduğunu kabul edin. Daha fazla bilgi için bkz . Azure AI Vision fiyatlandırması.
Kullanılabilir kümeden bir görüntü seçin veya kendi resminizi yükleyin.
Gerekirse kaynağınızı seçmek için Lütfen bir kaynak seçin'i seçin.

Görüntünüzü seçtikten sonra, ayıklanan metin çıkış penceresinde görünür. API çağrısının döndürdüğü JSON çıkışını görmek için JSON sekmesini de seçebilirsiniz.

Deneme deneyiminin altında, bu özelliği kendi uygulamanızda kullanmaya başlamak için sonraki adımlar yer alır.

Sonraki adımlar

Bu hızlı başlangıçta, Okuma API'sine erişmek için Vision Studio'yu kullandınız. Ardından Okuma API'sinin özellikleri hakkında daha fazla bilgi edinin.

Okuma API'sini çağırma

OCR'ye genel bakış

Hızlı Başlangıç: Azure AI Vision v3.2 GA Okuma

OCR (Okuma) sürümleri

Önkoşullar

Ortam değişkenlerini oluşturma

Yazdırılan ve el yazısı metinleri okuma

Çıktı

Kaynakları temizleme

Sonraki adımlar

Önkoşullar

Ortam değişkenlerini oluşturma

Yazdırılan ve el yazısı metinleri okuma

Çıktı

Kaynakları temizleme

Sonraki adımlar

Önkoşullar

Ortam değişkenlerini oluşturma

Yazdırılan ve el yazısı metinleri okuma

Çıktı

Kaynakları temizleme

Sonraki adımlar

Önkoşullar

Yazdırılan ve el yazısı metinleri okuma

Okuma API'sini çağırma

İsteğe bağlı olarak model sürümünü belirtin

Okuma sonuçları alma

Yanıtı inceleme

Kaynakları temizleme

Sonraki adımlar

Önkoşullar

Yazdırılan ve el yazısı metinleri okuma

Sonraki adımlar

Ek kaynaklar