Optik karakter tanıma nedir?

Optik karakter tanıma (OCR), yazdırılan veya belgelerin fotoğraflarından, faturalar, senetler, finansal raporlar, makaleler ve daha fazlası gibi görüntülerden yazılı veya el yazısı metinleri ayıklamanızı sağlar. Microsoft 'un OCR teknolojileri, yazdırılmış metinlerin birkaç dildeayıklanmasından sonra desteklenir. Başlamak için hızlı başlangıcı izleyin.

OCR demos

Bu belge aşağıdaki makale türlerini içerir:

  • Hızlı başlangıç , hizmete çağrı yapmanızı ve sonuçların kısa bir süre içinde elde etmenize olanak tanıyan adım adım yönergelerdir.
  • Nasıl yapılır kılavuzlarında , hizmeti daha belirli veya özelleştirilmiş yollarla kullanmaya yönelik yönergeler bulunur.

API 'YI oku

Görüntü İşleme okuma API 'Si, Azure 'un en son OCR teknolojisidir(bazı dillerde),yazılı metin (birkaç dilde), rakamlar ve görüntü ve çok sayfalı PDF belgelerinden gelen para birimi sembolleri ayıklar. Metin açısından kalın görüntülerden ve çok sayfalı PDF belgelerinden karışık dillerle metin ayıklamak en iyi duruma getirilmiştir. Aynı görüntüde veya belgede hem yazdırılmış hem de el yazısı metnin algılanmasının aynısını destekler.

How OCR converts images and documents into structured output with extracted text

Giriş gereksinimleri

Okuma çağrısı görüntüleri ve belgeleri giriş olarak alır. Bunlar aşağıdaki gereksinimlere sahiptir:

  • Desteklenen dosya biçimleri: JPEG, PNG, BMP, PDF ve TIFF
  • PDF ve TIFF dosyaları için en fazla 2000 sayfa (ücretsiz katman için yalnızca ilk iki sayfa) işlenir.
  • Dosya boyutu 50 MB 'tan az (ücretsiz katman için 6 MB) ve en az 50 x 50 piksel ve en fazla 10000 x 10000 piksel boyutunda olmalıdır.

Desteklenen diller

Okuma API 'SI, önizleme dilleri ve özellikleri de dahil olmak üzere el yazısı metin için baskı metni ve 7 dil için 122 dilleri destekler.

Baskı metni için OCR; Ingilizce, Fransızca, Almanca, Italyanca, Portekizce, Ispanyolca, Çince, Japonca, Korece ve Rusça (Önizleme) ile birlikte en son önizleme güncelleştirmesiyle birlikte Latin ve Kiril dilleri için destek içerir.

El yazısı metin için OCR, Fransızca, Almanca, Italyanca, Portekizce, Ispanyolca ve Çince dil desteğinin Ingilizce ve önizlemesi için destek içerir.

Önizleme dillerini ve özelliklerini kullanmak için model sürümünü belirtme bölümüne bakın. OCR tarafından desteklenen dillerintam listesine bakın. Önizleme modeli, şu anda GA sürümüne yönelik geliştirmeleri içerir.

Önemli özellikler

Okuma API 'SI aşağıdaki özellikleri içerir.

  • 122 dilde yazdırma metin ayıklama
  • Yedi dilde el ile metin ayıklama
  • Konum ve güvenirlik puanlarını içeren metin satırları ve sözcükler
  • Dil kimliği gerekli değil
  • Karışık diller için destek, karma mod (yazdırma ve el yazısı)
  • Büyük, çok sayfalı belgelerden sayfaları ve sayfa aralıklarını seçin
  • Metin satırı çıkışı için doğal okuma sırası seçeneği (yalnızca Latin)
  • Metin çizgileri için el yazısı sınıflandırması (yalnızca Latin)
  • Şirket içi dağıtım için Distrodaha az Docker kapsayıcısı olarak kullanılabilir

OCR özelliklerini kullanmayıöğrenin.

Bulut API 'sini kullanma veya şirket içinde dağıtma

3. x bulut API 'Leri, çoğu müşteri için tercih edilen seçenektir ve bu, çok sayıda tümleştirme ve bu kutudan hızlı verimlilik açısından tercih edilir. Müşterilerinizin gereksinimlerine odaklanmanız durumunda Azure ve Görüntü İşleme Hizmeti tanıtıcı ölçeği, performansı, veri güvenliği ve uyumluluk gereksinimlerini karşılamanız gerekir.

Şirket içi dağıtım için, okuma Docker kapsayıcısı (Önizleme) , yeni OCR özelliklerini kendi yerel ortamınızda dağıtmanıza olanak sağlar. Kapsayıcılar, belirli güvenlik ve veri idare gereksinimleri için çok kullanışlıdır.

Uyarı

Görüntü İşleme 2,0 RecognizeText işlemleri, bu makalede ele alınan yeni okuma API 'sinde kullanım dışı bırakılıyor sürecinde. Mevcut müşteriler okuma işlemlerini kullanarak geçişyapması gerekir.

Veri gizliliği ve güvenliği

Tüm bilişsel hizmetlerde olduğu gibi, Görüntü İşleme hizmetini kullanan geliştiriciler Microsoft 'un müşteri verileri ilkelerine göre farkında olmalıdır. Daha fazla bilgi edinmek için Microsoft Güven Merkezi ' nde bilişsel Hizmetler sayfasına bakın.

Sonraki adımlar