Mulai Cepat: Azure AI Vision v3.2 GA Read

Edisi OCR (Baca)

Penting

Pilih Edisi Baca yang paling sesuai dengan kebutuhan Anda.

Input Contoh Edisi baca Keuntungan
Gambar: Gambar umum, di alam bebas label, tanda jalan, dan poster OCR untuk gambar (versi 4.0) Dioptimalkan untuk gambar umum non-dokumen dengan API sinkron yang ditingkatkan performanya yang memudahkan penyematan OCR dalam skenario pengalaman pengguna Anda.
Dokumen: Digital dan dipindai, termasuk gambar buku, artikel, dan laporan Model baca Kecerdasan Dokumen Dioptimalkan untuk dokumen teks-berat yang dipindai dan digital dengan API asinkron untuk membantu mengotomatiskan pemrosesan dokumen cerdas dalam skala besar.

Tentang Azure AI Vision v3.2 GA Read

Mencari Azure AI Vision v3.2 GA Read terbaru? Semua penyempurnaan Read OCR di masa mendatang adalah bagian dari dua layanan yang tercantum sebelumnya. Tidak ada pembaruan lebih lanjut untuk Azure AI Vision v3.2. Untuk informasi selengkapnya, lihat Memanggil AZURE AI Vision 3.2 GA Read API dan Quickstart: Azure AI Vision v3.2 GA Read.

Mulai menggunakan Azure AI Vision Read REST API atau pustaka klien. API Baca memberi Anda algoritma AI untuk mengekstrak teks dari gambar serta mengembalikannya sebagai string terstruktur. Ikuti langkah-langkah ini untuk menginstal paket ke aplikasi Anda dan cobalah kode sampel untuk tugas dasar.

Gunakan pustaka klien pengenalan karakter optik (OCR) untuk membaca teks cetak dan tulisan tangan dari gambar. Layanan OCR dapat membaca teks yang terlihat dalam gambar dan mengonversinya menjadi aliran karakter. Untuk informasi selengkapnya tentang pengenalan teks, lihat gambaran umum OCR. Kode di bagian ini menggunakan paket Azure AI Vision terbaru.

Tip

Anda juga dapat mengekstrak teks dari gambar lokal. Lihat metode ComputerVisionClient, seperti ReadInStreamAsync. Atau, lihat sampel kode pada GitHub untuk skenario yang melibatkan gambar lokal.

Dokumentasi referensi | Kode sumber pustaka | Paket (NuGet) | Sampel

Prasyarat

  • Langganan Azure - Buat langganan gratis.

  • IDE Visual Studio atau versi .NET Core saat ini.

  • Sumber daya Azure AI Vision. Anda dapat menggunakan tingkat harga gratis (F0) untuk percobaan, lalu meningkatkannya ke tingkat berbayar untuk produksi.

  • Kunci dan titik akhir dari sumber daya yang Anda buat untuk menyambungkan aplikasi Anda ke layanan Azure AI Vision.

    1. Setelah sumber daya Azure Vision Anda disebarkan, pilih Buka sumber daya.
    2. Di menu navigasi kiri, pilih Kunci dan Titik Akhir.
    3. Salin salah satu kunci dan Titik Akhir untuk digunakan nanti di mulai cepat.

Membuat variabel lingkungan

Dalam contoh ini, tulis kredensial Anda ke variabel lingkungan di komputer lokal yang menjalankan aplikasi.

Buka portal Microsoft Azure. Jika sumber daya yang Anda buat di bagian Prasyarat berhasil disebarkan, pilih Buka sumber daya di bawah Langkah Berikutnya. Anda dapat menemukan kunci dan titik akhir Anda di bawah Manajemen Sumber Daya di halaman Kunci dan Titik Akhir. Kunci sumber daya Anda tidak sama dengan ID langganan Azure Anda.

Tip

Jangan sertakan kunci langsung dalam kode Anda, dan jangan pernah mempostingnya secara publik. Lihat artikel keamanan layanan Azure AI untuk opsi autentikasi lainnya seperti Azure Key Vault.

Untuk mengatur variabel lingkungan untuk kunci dan titik akhir Anda, buka jendela konsol dan ikuti instruksi untuk sistem operasi dan lingkungan pengembangan Anda.

  1. Untuk mengatur VISION_KEY variabel lingkungan, ganti your-key dengan salah satu kunci untuk sumber daya Anda.
  2. Untuk mengatur VISION_ENDPOINT variabel lingkungan, ganti your-endpoint dengan titik akhir untuk sumber daya Anda.
setx VISION_KEY your-key
setx VISION_ENDPOINT your-endpoint

Setelah menambahkan variabel lingkungan, Anda mungkin perlu memulai ulang program yang sedang berjalan yang akan membaca variabel lingkungan, termasuk jendela konsol.

Baca teks tulisan tangan dan yang dicetak

  1. Buat aplikasi C# baru.

    Menggunakan Visual Studio, buat proyek Aplikasi Konsol (.NET Framework) untuk C#, Windows, Console.

    Setelah Anda membuat proyek baru, instal pustaka klien:

    1. Klik kanan pada solusi proyek di Penjelajah Solusi dan pilih Kelola Paket NuGet untuk Solusi.
    2. Di manajer paket yang terbuka, pilih Telusuri. Pilih Sertakan prarilis.
    3. Cari dan pilih Microsoft.Azure.CognitiveServices.Vision.ComputerVision.
    4. Dalam kotak dialog detail, pilih proyek Anda dan pilih versi stabil terbaru. Lalu pilih Pasang.
  2. Dari direktori proyek, buka file Program.cs di editor atau IDE pilihan Anda. Ganti konten Program.cs dengan kode berikut.

    using System;
    using System.Collections.Generic;
    using Microsoft.Azure.CognitiveServices.Vision.ComputerVision;
    using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models;
    using System.Threading.Tasks;
    using System.IO;
    using Newtonsoft.Json;
    using Newtonsoft.Json.Linq;
    using System.Threading;
    using System.Linq;
    
    namespace ComputerVisionQuickstart
    {
        class Program
        {
            // Add your Computer Vision key and endpoint
            static string key = Environment.GetEnvironmentVariable("VISION_KEY");
            static string endpoint = Environment.GetEnvironmentVariable("VISION_ENDPOINT");
    
            private const string READ_TEXT_URL_IMAGE = "https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg";
    
            static void Main(string[] args)
            {
                Console.WriteLine("Azure Cognitive Services Computer Vision - .NET quickstart example");
                Console.WriteLine();
    
                ComputerVisionClient client = Authenticate(endpoint, key);
    
                // Extract text (OCR) from a URL image using the Read API
                ReadFileUrl(client, READ_TEXT_URL_IMAGE).Wait();
            }
    
            public static ComputerVisionClient Authenticate(string endpoint, string key)
            {
                ComputerVisionClient client =
                  new ComputerVisionClient(new ApiKeyServiceClientCredentials(key))
                  { Endpoint = endpoint };
                return client;
            }
    
            public static async Task ReadFileUrl(ComputerVisionClient client, string urlFile)
            {
                Console.WriteLine("----------------------------------------------------------");
                Console.WriteLine("READ FILE FROM URL");
                Console.WriteLine();
    
                // Read text from URL
                var textHeaders = await client.ReadAsync(urlFile);
                // After the request, get the operation location (operation ID)
                string operationLocation = textHeaders.OperationLocation;
                Thread.Sleep(2000);
    
                // Retrieve the URI where the extracted text will be stored from the Operation-Location header.
                // We only need the ID and not the full URL
                const int numberOfCharsInOperationId = 36;
                string operationId = operationLocation.Substring(operationLocation.Length - numberOfCharsInOperationId);
    
                // Extract the text
                ReadOperationResult results;
                Console.WriteLine($"Extracting text from URL file {Path.GetFileName(urlFile)}...");
                Console.WriteLine();
                do
                {
                    results = await client.GetReadResultAsync(Guid.Parse(operationId));
                }
                while ((results.Status == OperationStatusCodes.Running ||
                    results.Status == OperationStatusCodes.NotStarted));
    
                // Display the found text.
                Console.WriteLine();
                var textUrlFileResults = results.AnalyzeResult.ReadResults;
                foreach (ReadResult page in textUrlFileResults)
                {
                    foreach (Line line in page.Lines)
                    {
                        Console.WriteLine(line.Text);
                    }
                }
                Console.WriteLine();
            }
    
        }
    }
    
  3. Sebagai langkah opsional, lihat Menentukan cara memproses data. Misalnya, untuk secara eksplisit menentukan model GA terbaru, edit panggilan ReadAsync seperti yang telah ditunjukkan. Lewati parameter atau gunakan "latest" untuk menggunakan model GA terbaru.

      // Read text from URL with a specific model version
      var textHeaders = await client.ReadAsync(urlFile,null,null,"2022-04-30");
    
  4. Jalankan aplikasi lagi.

    • Dari menu Debug , pilih Mulai Penelusuran Kesalahan.

Hasil

Azure AI Vision - .NET quickstart example

----------------------------------------------------------
READ FILE FROM URL

Extracting text from URL file printed_text.jpg...


Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.

Membersihkan sumber daya

Jika Anda ingin membersihkan dan menghapus langganan layanan Azure AI, Anda dapat menghapus sumber daya atau grup sumber daya. Menghapus grup sumber daya juga menghapus sumber daya apa pun yang terkait dengannya.

Langkah berikutnya

Dalam mulai cepat ini, Anda belajar cara memasang pustaka klien OCR dan menggunakan Read API. Selanjutnya, pelajari lebih lanjut fitur Read API.

Gunakan pustaka klien pengenalan karakter optik (OCR) untuk membaca teks cetak dan tulisan tangan dari gambar jarak jauh. Layanan OCR dapat membaca teks yang terlihat dalam gambar dan mengonversinya menjadi aliran karakter. Untuk informasi selengkapnya tentang pengenalan teks, lihat gambaran umum OCR.

Tip

Anda juga dapat membaca teks dari gambar lokal. Lihat metode ComputerVisionClientOperationsMixin, seperti read_in_stream. Atau, lihat sampel kode pada GitHub untuk skenario yang melibatkan gambar lokal.

Dokumentasi referensi | Kode sumber pustaka | Paket (PiPy) | Sampel

Prasyarat

  • Langganan Azure - Buat langganan gratis.

  • Python 3.x.

  • Penginstalan Python Anda harus menyertakan pip. Anda dapat memeriksa apakah Anda telah menginstal pip, berjalan pip --version pada baris perintah. Dapatkan pip dengan menginstal versi terbaru Python.

  • Sumber daya Azure AI Vision. Anda dapat menggunakan tingkat harga gratis (F0) untuk percobaan, lalu meningkatkannya ke tingkat berbayar untuk produksi.

  • Kunci dan titik akhir dari sumber daya yang Anda buat untuk menyambungkan aplikasi Anda ke layanan Azure AI Vision.

    1. Setelah sumber daya Azure Vision Anda disebarkan, pilih Buka sumber daya.
    2. Di menu navigasi kiri, pilih Kunci dan Titik Akhir.
    3. Salin salah satu kunci dan Titik Akhir untuk digunakan nanti di mulai cepat.

Membuat variabel lingkungan

Dalam contoh ini, tulis kredensial Anda ke variabel lingkungan di komputer lokal yang menjalankan aplikasi.

Buka portal Microsoft Azure. Jika sumber daya yang Anda buat di bagian Prasyarat berhasil disebarkan, pilih Buka sumber daya di bawah Langkah Berikutnya. Anda dapat menemukan kunci dan titik akhir Anda di bawah Manajemen Sumber Daya di halaman Kunci dan Titik Akhir. Kunci sumber daya Anda tidak sama dengan ID langganan Azure Anda.

Tip

Jangan sertakan kunci langsung dalam kode Anda, dan jangan pernah mempostingnya secara publik. Lihat artikel keamanan layanan Azure AI untuk opsi autentikasi lainnya seperti Azure Key Vault.

Untuk mengatur variabel lingkungan untuk kunci dan titik akhir Anda, buka jendela konsol dan ikuti instruksi untuk sistem operasi dan lingkungan pengembangan Anda.

  1. Untuk mengatur VISION_KEY variabel lingkungan, ganti your-key dengan salah satu kunci untuk sumber daya Anda.
  2. Untuk mengatur VISION_ENDPOINT variabel lingkungan, ganti your-endpoint dengan titik akhir untuk sumber daya Anda.
setx VISION_KEY your-key
setx VISION_ENDPOINT your-endpoint

Setelah menambahkan variabel lingkungan, Anda mungkin perlu memulai ulang program yang sedang berjalan yang akan membaca variabel lingkungan, termasuk jendela konsol.

Baca teks tulisan tangan dan yang dicetak

  1. Menginstal pustaka klien.

    Di jendela konsol, jalankan perintah berikut:

    pip install --upgrade azure-cognitiveservices-vision-computervision
    
  2. Pasang pustaka Bantal.

    pip install pillow
    
  3. Buat file aplikasi Python baru, quickstart-file.py. Lalu buka file di editor atau IDE pilihan Anda.

  4. Ganti konten quickstart-file.py dengan kode berikut.

    from azure.cognitiveservices.vision.computervision import ComputerVisionClient
    from azure.cognitiveservices.vision.computervision.models import OperationStatusCodes
    from azure.cognitiveservices.vision.computervision.models import VisualFeatureTypes
    from msrest.authentication import CognitiveServicesCredentials
    
    from array import array
    import os
    from PIL import Image
    import sys
    import time
    
    '''
    Authenticate
    Authenticates your credentials and creates a client.
    '''
    subscription_key = os.environ["VISION_KEY"]
    endpoint = os.environ["VISION_ENDPOINT"]
    
    computervision_client = ComputerVisionClient(endpoint, CognitiveServicesCredentials(subscription_key))
    '''
    END - Authenticate
    '''
    
    '''
    OCR: Read File using the Read API, extract text - remote
    This example will extract text in an image, then print results, line by line.
    This API call can also extract handwriting style text (not shown).
    '''
    print("===== Read File - remote =====")
    # Get an image with text
    read_image_url = "https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png"
    
    # Call API with URL and raw response (allows you to get the operation location)
    read_response = computervision_client.read(read_image_url,  raw=True)
    
    # Get the operation location (URL with an ID at the end) from the response
    read_operation_location = read_response.headers["Operation-Location"]
    # Grab the ID from the URL
    operation_id = read_operation_location.split("/")[-1]
    
    # Call the "GET" API and wait for it to retrieve the results 
    while True:
        read_result = computervision_client.get_read_result(operation_id)
        if read_result.status not in ['notStarted', 'running']:
            break
        time.sleep(1)
    
    # Print the detected text, line by line
    if read_result.status == OperationStatusCodes.succeeded:
        for text_result in read_result.analyze_result.read_results:
            for line in text_result.lines:
                print(line.text)
                print(line.bounding_box)
    print()
    '''
    END - Read File - remote
    '''
    
    print("End of Computer Vision quickstart.")
    
    
  5. Sebagai langkah opsional, lihat Menentukan cara memproses data. Misalnya, untuk secara eksplisit menentukan model GA terbaru, edit pernyataan read seperti yang telah ditunjukkan. Melompati parameter atau menggunakan "latest" secara otomatis menggunakan model GA terbaru.

       # Call API with URL and raw response (allows you to get the operation location)
       read_response = computervision_client.read(read_image_url,  raw=True, model_version="2022-04-30")
    
  6. Jalankan aplikasi dengan perintah python pada file mulai cepat Anda.

    python quickstart-file.py
    

Hasil

===== Read File - remote =====
The quick brown fox jumps
[38.0, 650.0, 2572.0, 699.0, 2570.0, 854.0, 37.0, 815.0]
Over
[184.0, 1053.0, 508.0, 1044.0, 510.0, 1123.0, 184.0, 1128.0]
the lazy dog!
[639.0, 1011.0, 1976.0, 1026.0, 1974.0, 1158.0, 637.0, 1141.0]

End of Azure AI Vision quickstart.

Membersihkan sumber daya

Jika Anda ingin membersihkan dan menghapus langganan layanan Azure AI, Anda dapat menghapus sumber daya atau grup sumber daya. Menghapus grup sumber daya juga menghapus sumber daya apa pun yang terkait dengannya.

Langkah berikutnya

Dalam mulai cepat ini, Anda belajar cara memasang pustaka klien OCR dan menggunakan Read API. Selanjutnya, pelajari lebih lanjut fitur Read API.

Gunakan pustaka klien pengenalan karakter optik (OCR) untuk membaca teks cetak dan tulisan tangan dengan API Baca. Layanan OCR dapat membaca teks yang terlihat dalam gambar dan mengonversinya menjadi aliran karakter. Untuk informasi selengkapnya tentang pengenalan teks, lihat gambaran umum OCR.

Tip

Anda juga dapat membaca teks dari gambar lokal. Lihat metode ComputerVisionClient, seperti readInStream. Atau, lihat sampel kode pada GitHub untuk skenario yang melibatkan gambar lokal.

Dokumentasi referensi | Kode sumber pustaka | Paket (npm) | Sampel

Prasyarat

  • Langganan Azure - Buat langganan gratis.

  • Versi terbaru Node.js.

  • Sumber daya Azure AI Vision. Anda dapat menggunakan tingkat harga gratis (F0) untuk percobaan, lalu meningkatkannya ke tingkat berbayar untuk produksi.

  • Kunci dan titik akhir dari sumber daya yang Anda buat untuk menyambungkan aplikasi Anda ke layanan Azure AI Vision.

    1. Setelah sumber daya Azure Vision Anda disebarkan, pilih Buka sumber daya.
    2. Di menu navigasi kiri, pilih Kunci dan Titik Akhir.
    3. Salin salah satu kunci dan Titik Akhir untuk digunakan nanti di mulai cepat.

Membuat variabel lingkungan

Dalam contoh ini, tulis kredensial Anda ke variabel lingkungan di komputer lokal yang menjalankan aplikasi.

Buka portal Microsoft Azure. Jika sumber daya yang Anda buat di bagian Prasyarat berhasil disebarkan, pilih Buka sumber daya di bawah Langkah Berikutnya. Anda dapat menemukan kunci dan titik akhir Anda di bawah Manajemen Sumber Daya di halaman Kunci dan Titik Akhir. Kunci sumber daya Anda tidak sama dengan ID langganan Azure Anda.

Tip

Jangan sertakan kunci langsung dalam kode Anda, dan jangan pernah mempostingnya secara publik. Lihat artikel keamanan layanan Azure AI untuk opsi autentikasi lainnya seperti Azure Key Vault.

Untuk mengatur variabel lingkungan untuk kunci dan titik akhir Anda, buka jendela konsol dan ikuti instruksi untuk sistem operasi dan lingkungan pengembangan Anda.

  1. Untuk mengatur VISION_KEY variabel lingkungan, ganti your-key dengan salah satu kunci untuk sumber daya Anda.
  2. Untuk mengatur VISION_ENDPOINT variabel lingkungan, ganti your-endpoint dengan titik akhir untuk sumber daya Anda.
setx VISION_KEY your-key
setx VISION_ENDPOINT your-endpoint

Setelah menambahkan variabel lingkungan, Anda mungkin perlu memulai ulang program yang sedang berjalan yang akan membaca variabel lingkungan, termasuk jendela konsol.

Baca teks tulisan tangan dan yang dicetak

Buat aplikasi Node.js baru.

  1. Di jendela konsol, buat direktori baru untuk aplikasi Anda, dan navigasikan ke dalamnya.

    mkdir myapp
    cd myapp
    
  2. Jalankan perintah npm init untuk membuat aplikasi node dengan file package.json. Pilih Enter untuk perintah apa pun.

    npm init
    
  3. Untuk menginstal pustaka klien, instal ms-rest-azure paket npm dan @azure/cognitiveservices-computervision :

    npm install ms-rest-azure
    npm install @azure/cognitiveservices-computervision
    
  4. Instal modul asinkron:

    npm install async
    

    File aplikasi package.json Anda diperbarui dengan dependensi.

  5. Buat file baru, index.js, dan buka di editor teks.

  6. Tempelkan kode berikut ke dalam file index.js.

    'use strict';
    
    const async = require('async');
    const fs = require('fs');
    const https = require('https');
    const path = require("path");
    const createReadStream = require('fs').createReadStream
    const sleep = require('util').promisify(setTimeout);
    const ComputerVisionClient = require('@azure/cognitiveservices-computervision').ComputerVisionClient;
    const ApiKeyCredentials = require('@azure/ms-rest-js').ApiKeyCredentials;
    /**
     * AUTHENTICATE
     * This single client is used for all examples.
     */
    const key = process.env.VISION_KEY;
    const endpoint = process.env.VISION_ENDPOINT;
    
    const computerVisionClient = new ComputerVisionClient(
      new ApiKeyCredentials({ inHeader: { 'Ocp-Apim-Subscription-Key': key } }), endpoint);
    /**
     * END - Authenticate
     */
    
    function computerVision() {
      async.series([
        async function () {
    
          /**
           * OCR: READ PRINTED & HANDWRITTEN TEXT WITH THE READ API
           * Extracts text from images using OCR (optical character recognition).
           */
          console.log('-------------------------------------------------');
          console.log('READ PRINTED, HANDWRITTEN TEXT AND PDF');
          console.log();
    
          // URL images containing printed and/or handwritten text. 
          // The URL can point to image files (.jpg/.png/.bmp) or multi-page files (.pdf, .tiff).
          const printedTextSampleURL = 'https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg';
    
          // Recognize text in printed image from a URL
          console.log('Read printed text from URL...', printedTextSampleURL.split('/').pop());
          const printedResult = await readTextFromURL(computerVisionClient, printedTextSampleURL);
          printRecText(printedResult);
    
          // Perform read and await the result from URL
          async function readTextFromURL(client, url) {
            // To recognize text in a local image, replace client.read() with readTextInStream() as shown:
            let result = await client.read(url);
            // Operation ID is last path segment of operationLocation (a URL)
            let operation = result.operationLocation.split('/').slice(-1)[0];
    
            // Wait for read recognition to complete
            // result.status is initially undefined, since it's the result of read
            while (result.status !== "succeeded") { await sleep(1000); result = await client.getReadResult(operation); }
            return result.analyzeResult.readResults; // Return the first page of result. Replace [0] with the desired page if this is a multi-page file such as .pdf or .tiff.
          }
    
          // Prints all text from Read result
          function printRecText(readResults) {
            console.log('Recognized text:');
            for (const page in readResults) {
              if (readResults.length > 1) {
                console.log(`==== Page: ${page}`);
              }
              const result = readResults[page];
              if (result.lines.length) {
                for (const line of result.lines) {
                  console.log(line.words.map(w => w.text).join(' '));
                }
              }
              else { console.log('No recognized text.'); }
            }
          }
    
          /**
           * 
           * Download the specified file in the URL to the current local folder
           * 
           */
          function downloadFilesToLocal(url, localFileName) {
            return new Promise((resolve, reject) => {
              console.log('--- Downloading file to local directory from: ' + url);
              const request = https.request(url, (res) => {
                if (res.statusCode !== 200) {
                  console.log(`Download sample file failed. Status code: ${res.statusCode}, Message: ${res.statusMessage}`);
                  reject();
                }
                var data = [];
                res.on('data', (chunk) => {
                  data.push(chunk);
                });
                res.on('end', () => {
                  console.log('   ... Downloaded successfully');
                  fs.writeFileSync(localFileName, Buffer.concat(data));
                  resolve();
                });
              });
              request.on('error', function (e) {
                console.log(e.message);
                reject();
              });
              request.end();
            });
          }
    
          /**
           * END - Recognize Printed & Handwritten Text
           */
          console.log();
          console.log('-------------------------------------------------');
          console.log('End of quickstart.');
    
        },
        function () {
          return new Promise((resolve) => {
            resolve();
          })
        }
      ], (err) => {
        throw (err);
      });
    }
    
    computerVision();
    
  7. Sebagai langkah opsional, lihat Menentukan cara memproses data. Misalnya, untuk secara eksplisit menentukan model GA terbaru, edit pernyataan read seperti yang telah ditunjukkan. Melompati parameter atau menggunakan "latest" secara otomatis menggunakan model GA terbaru.

      let result = await client.read(url,{modelVersion:"2022-04-30"});
    
  8. Jalankan aplikasi dengan perintah node pada file mulai cepat Anda.

    node index.js
    

Hasil

-------------------------------------------------
READ PRINTED, HANDWRITTEN TEXT AND PDF

Read printed text from URL... printed_text.jpg
Recognized text:
Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.

-------------------------------------------------
End of quickstart.

Membersihkan sumber daya

Jika Anda ingin membersihkan dan menghapus langganan layanan Azure AI, Anda dapat menghapus sumber daya atau grup sumber daya. Menghapus grup sumber daya juga menghapus sumber daya apa pun yang terkait dengannya.

Langkah berikutnya

Dalam mulai cepat ini, Anda belajar cara memasang pustaka klien OCR dan menggunakan Read API. Selanjutnya, pelajari lebih lanjut fitur Read API.

Gunakan REST API pengenalan karakter optik (OCR) untuk membaca teks cetak dan tulisan tangan.

Catatan

Mulai cepat ini menggunakan perintah cURL untuk memanggil REST API. Anda juga dapat memanggil REST API menggunakan bahasa pemrograman. Lihat sampel GitHub misalnya di C#, Python, Java, dan JavaScript.

Prasyarat

  • Langganan Azure - Buat langganan gratis.

  • cURL diinstal.

  • Sumber daya Azure AI Vision. Anda dapat menggunakan tingkat harga gratis (F0) untuk percobaan, lalu meningkatkannya ke tingkat berbayar untuk produksi.

  • Kunci dan titik akhir dari sumber daya yang Anda buat untuk menyambungkan aplikasi Anda ke layanan Azure AI Vision.

    1. Setelah sumber daya Azure Vision Anda disebarkan, pilih Buka sumber daya.
    2. Di menu navigasi kiri, pilih Kunci dan Titik Akhir.
    3. Salin salah satu kunci dan Titik Akhir untuk digunakan nanti di mulai cepat.

Baca teks tulisan tangan dan yang dicetak

Layanan pengenalan karakter optik (OCR) dapat mengekstrak teks yang terlihat dalam gambar atau dokumen dan mengonversinya menjadi aliran karakter. Untuk informasi selengkapnya tentang ekstraksi teks, lihat gambaran umum OCR.

Hubungi Read API

Untuk membuat dan menjalankan sampel, lakukan langkah-langkah berikut:

  1. Salin perintah berikut ke editor teks.

  2. JIka diperlukan, buat perubahan berikut dalam perintah:

    1. Ganti nilai dengan <key> kunci Anda.
    2. Ganti bagian pertama URL permintaan (https://westcentralus.api.cognitive.microsoft.com/) dengan teks di URL titik akhir Anda sendiri.

      Catatan

      Sumber daya baru yang dibuat setelah 1 Juli 2019, akan menggunakan nama subdomain kustom. Untuk informasi selengkapnya dan daftar lengkap titik akhir regional, lihat Nama subdomain kustom untuk layanan Azure AI.

    3. Secara opsional, ubah URL gambar dalam isi permintaan (https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png) ke URL gambar yang berbeda untuk dianalisis.
  3. Buka jendela wantian perintah.

  4. Tempelkan perintah dari editor teks ke jendela perintah, lalu jalankan perintah.

curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"

Respons menyertakan Operation-Location header, yang nilainya adalah URL unik. Anda menggunakan URL ini untuk mengkueri hasil operasi Baca. URL kedaluwarsa dalam 48 jam.

Secara opsional, tentukan versi model

Sebagai langkah opsional, lihat Menentukan cara memproses data. Misalnya, untuk secara eksplisit menentukan model GA terbaru, gunakan model-version=2022-04-30 sebagai parameter. Melompati parameter atau menggunakan model-version=latest secara otomatis menggunakan model GA terbaru.

curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze?model-version=2022-04-30" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"

Dapatkan hasil Baca

  1. Salin perintah berikut ke editor teks.

  2. Ganti URL dengan nilai yang Operation-Location Anda salin di prosedur sebelumnya.

  3. Ganti nilai dengan <key> kunci Anda.

  4. Buka jendela konsol.

  5. Tempelkan perintah dari editor teks ke jendela konsol, lalu jalankan perintah .

    curl -v -X GET "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyzeResults/{operationId}" -H "Ocp-Apim-Subscription-Key: {key}" --data-ascii "{body}" 
    

Periksa responsnya

Respons sukses dikembalikan dalam JSON. Aplikasi sampel mengurai dan menampilkan respons yang berhasil di jendela konsol, mirip dengan contoh berikut:

{
  "status": "succeeded",
  "createdDateTime": "2021-04-08T21:56:17.6819115+00:00",
  "lastUpdatedDateTime": "2021-04-08T21:56:18.4161316+00:00",
  "analyzeResult": {
    "version": "3.2",
    "readResults": [
      {
        "page": 1,
        "angle": 0,
        "width": 338,
        "height": 479,
        "unit": "pixel",
        "lines": [
          {
            "boundingBox": [
              25,
              14,
              318,
              14,
              318,
              59,
              25,
              59
            ],
            "text": "NOTHING",
            "appearance": {
              "style": {
                "name": "other",
                "confidence": 0.971
              }
            },
            "words": [
              {
                "boundingBox": [
                  27,
                  15,
                  294,
                  15,
                  294,
                  60,
                  27,
                  60
                ],
                "text": "NOTHING",
                "confidence": 0.994
              }
            ]
          }
        ]
      }
    ]
  }
}

Membersihkan sumber daya

Jika Anda ingin membersihkan dan menghapus langganan layanan Azure AI, Anda dapat menghapus sumber daya atau grup sumber daya. Menghapus grup sumber daya juga menghapus sumber daya apa pun yang terkait dengannya.

Langkah berikutnya

Dalam mulai cepat ini, Anda belajar cara memanggil Read REST API. Selanjutnya, pelajari lebih lanjut fitur Read API.

Prasyarat

  • Langganan Azure - Buat langganan gratis.

  • Sumber daya Azure AI Vision. Anda dapat menggunakan tingkat harga gratis (F0) untuk percobaan, lalu meningkatkannya ke tingkat berbayar untuk produksi.

  • Koneksi ke Studio Visi.

    • Anda mungkin perlu masuk.
    • Setelah Masuk, pilih Tampilkan semua sumber daya. Jika perlu, pilih Refresh. Verifikasi bahwa sumber daya Anda tersedia.

    Untuk informasi selengkapnya, lihat Mulai menggunakan Vision Studio.

Baca teks tulisan tangan dan yang dicetak

  1. Di bawah Pengenalan karakter optik, pilih Ekstrak teks dari gambar.

  2. Di bawah Cobalah, akui bahwa demo ini menimbulkan penggunaan ke akun Azure Anda. Untuk informasi selengkapnya, lihat Harga Azure AI Vision.

  3. Pilih gambar dari set yang tersedia atau unggah gambar Anda sendiri.

  4. Jika perlu, pilih Pilih sumber daya untuk memilih sumber daya Anda.

    Setelah Anda memilih gambar, teks yang diekstrak muncul di jendela output. Anda juga dapat memilih tab JSON untuk melihat output JSON yang dikembalikan oleh panggilan API.

Di bawah pengalaman uji coba adalah langkah berikutnya untuk mulai menggunakan kemampuan ini di aplikasi Anda sendiri.

Langkah berikutnya

Dalam mulai cepat ini, Anda menggunakan Vision Studio untuk mengakses READ API. Selanjutnya, pelajari lebih lanjut fitur Read API.