Form Tanıma ve birleştirilebilir modeller oluşturma

Form Tanıma, belge görüntülerinden bilgileri algılamak ve ayıklamak ve ayıklanan verileri yapılandırılmış bir JSON çıkışına geri almak için gelişmiş makine öğrenmesi teknolojisini kullanır. Bu Form Tanıma, tek başına özel modelleri eğitip özel modelleri birleştirip birleştirilmiş modeller oluşturabilirsiniz.

  • Özel modeller. Form Tanıma modelleri kullanarak işletmenize özgü form ve belgelerden verileri analiz edip ayıklar. Özel modeller, ayrı verileriniz ve kullanım örnekleriniz için eğitilmiş olur.

  • Oluşan modeller. Oluşturulan model, özel modellerden oluşan bir koleksiyon alıp form türlerinizi kapsayan tek bir modele atanarak oluşturulur. Bir belge bir oluşturma modeline gönder geldiğinde, hizmet hangi özel modelin analiz için sunulan formu doğru şekilde temsil ettiğine karar vermek için bir sınıflandırma adımı gerçekleştirir.

Ekran görüntüsü: Form Tanıma aracı analyze-a-custom-form penceresi.

Özel model nedir?

Özel model, ayrı içeriğinizin içindeki form alanlarını tanıyacak ve anahtar-değer çiftlerini ve tablo verilerini ayıklayacak şekilde eğitilmiş bir makine öğrenmesi programıdır. Başlamanız için yalnızca aynı form türüne sahip beş örnek gerekir ve özel modeliniz etiketlenmiş veri kümeleriyle veya etiketsiz olarak eğitilebilirsiniz.

Birlenmiş model nedir?

Oluşan modeller ile, tek model kimliğiyle adlı bir oluşturma modeline birden çok özel model atabilirsiniz. Çeşitli modelleri eğitmiş ve benzer form türlerini analiz etmek için bunları gruplayabilirsiniz. Örneğin, oluşan modeliniz tedarik, ekipman ve sipariş satın alma siparişlerinizi analiz etmek için eğitilmiş özel modeller içerebilir. Uygun modeli el ile seçmeye çalışma yerine, her analiz ve ayıklama için uygun özel modeli belirlemek üzere bir composed modeli kullanabilirsiniz.

Dağıtım seçenekleri

Aşağıdaki kaynaklar v2.1 Form Tanıma tarafından de destekler:

Özellik Kaynaklar
Özel model

Aşağıdaki kaynaklar v3.0 Form Tanıma tarafından de destekler:

Özellik Kaynaklar
Özel model

Deneme Form Tanıma

Özel modeller kullanılarak verilerin belirli veya benzersiz belgelerinize nasıl ayıklandıklarını görme. Aşağıdakiler gerekir:

  • Azure aboneliği: Ücretsiz bir abonelik oluşturabilirsiniz

  • Form Tanıma bir örnek Azure portal. Hizmeti denemek için ücretsiz fiyatlandırma katmanını ( F0 ) kullanabilirsiniz. Kaynağınız dağıt edildikten sonra API anahtarınızı ve uç noktanızı almak için Kaynağa git'i seçin.

Ekran görüntüsü: Anahtarlar ve uç nokta konumu Azure portal.

Form Tanıma Studio (önizleme)

Not

Form Tanıma Studio önizleme (v3.0) API'si ile kullanılabilir.

  1. Form Tanıma Studio giriş sayfasında Özel form'ı seçin.

  2. Projelerim altında + Proje oluştur'a seçin.

  3. Proje ayrıntıları alanlarını doldurun.

  4. Hizmet kaynağını yapılandırma.

  5. Eğitim Depolama veri kaynağınıza Bağlan blob kapsayıcınızı ekleyin.

  6. Projenizi gözden geçirme ve oluşturma.

  7. Özel modelinizi derlemeniz ve test etmek için bir dizi örnek belge sağlanmıştır.

Örnek Etiketleme aracı

Aynı türde en az altı formdan oluşur. Modeli eğitmek ve bir formu test etmek için bu verileri kullanabilirsiniz. Örnek veri kümemizi kullanabilirsiniz. sample_data.zip indirip ayıklar, ardından içeriği Azure Blob depolama alanı kapsayıcınıza Depolama yükleyin.

Form Tanıma kullanıcı arabiriminde:

  1. Örnek Etiketleme aracı giriş sayfasında Özel Kullan'ı seçerek bir modeli etiketlerle eğitin ve anahtar değer çiftleri alın.

    Ekran görüntüsü: FOTTtool özel seçeneğinin seçimi.

  2. Sonraki pencerede Yeni proje'yi seçin:

    Ekran görüntüsü: FOTTtools select new project.

    Daha ayrıntılı yönergeler için Örnek Etiketleme aracı hızlı başlangıç sayfamıza bakın.

Giriş gereksinimleri

  • En iyi sonuçları elde etmek için belge başına bir net fotoğraf veya yüksek kaliteli tarama sekleyebilirsiniz.

  • Desteklenen dosya biçimleri: JPEG, PNG, BMP, TIFF ve PDF (metin eklenmiş veya taranmış). Metin eklenmiş PDF'ler, karakter ayıklama ve konum hata olasılığını ortadan kaldırmak için en iyisidir.

  • PDF ve TIFF için en fazla 2000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Dosya boyutu 50 MB'ın altında olmalıdır.

  • Görüntü boyutları 50 x 50 piksel ile 10000 x 10000 piksel arasında olmalıdır.

  • PDF boyutları En fazla 17 x 17 inçtir; Yasal veya A3 kağıt boyutuna karşılık gelen veya daha küçüktür.

  • Eğitim verilerinin toplam boyutu 500 sayfa veya daha azdır.

  • PDF'ler parolayla kilitliyse, göndermeden önce kilidi kaldırmanız gerekir.

  • Kontrolsiz öğrenme için (etiketli veriler olmadan):

    • Veriler anahtarlar ve değerler içermeli.
    • Anahtarların değerlerin üzerinde veya sollarında görünmesi gerekir; bunlar aşağıda veya sağda görünemektedir.

    İpucu

    Eğitim verileri

    • Mümkünse, görüntü tabanlı belgeler yerine metin tabanlı PDF belgeleri kullanın. Taranan PDF'ler görüntü olarak işlendi.
    • Doldurulmuş formlar için tüm alanlarının doldurulmuş olduğu örnekleri kullanın.
    • Her alanda farklı değerlere sahip olan formlar kullanın.
    • Form görüntüleriniz daha düşük kaliteli ise daha büyük bir veri kümesi (örneğin 10-15 görüntü) kullanın.

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, aracın Form Tanıma sınırlamasıdır.

Desteklenen diller ve yerel diller

Form Tanıma sürümü, özel modeller için ek dil desteği sağlar. Desteklenen el yazısı ve yazdırılan metinlerin tam listesi için Dil Desteğimize bakın.

Form Tanıma önizleme v3.0

Form Tanıma v3.0 (önizleme) sürümü birkaç yeni özellik ve özellik sunar:

  • Özel model API'si (v3.0), özel formlar için imza algılamayı destekler. Özel modelleri eğiterek belirli alanları imza olarak belirtebilirsiniz. Bir belge özel modeliniz ile analiz edildiğinde, bir imzanın algılandı mı yoksa algılanmadı mı olduğunu gösterir.

  • Uygulamalarınız Form Tanıma önizleme sürümünü kullanmayı öğrenmek için Form Tanıma v3.0 geçiş kılavuzumuza bakın.

  • Önizleme sürümü REST API yeni özellikler hakkında daha fazla bilgi edinmek için REST API (önizleme) sayfamızı keşfedin.

İmza algılamayı deneyin

  1. Eğitim veri kümenizi oluşturma.

  2. Form tanıyıcı Studio 'ya gidin ve özel modeller altında özel form ' u seçin:

    Ekran görüntüsü: form tanıyıcı Studio özel bir form sayfası seçin.

  3. Yeni bir proje oluşturmak için iş akışını izleyin:

  4. Özel model giriş gereksinimlerini izleyin.

  5. Belgelerinizi etiketlendirin. İmza alanları için bölge etiketlemenin kullanılması daha iyi doğruluk için önerilir.

  6. Belgelerinizi etiketlendirin. İmza alanları için bölge etiketlemenin kullanılması daha iyi doğruluk için önerilir.

    Ekran görüntüsü: etiket imza alanı.

Eğitim kümesi etiketlendikten sonra özel modelinizi eğitebilir ve belgeleri analiz etmek için kullanabilirsiniz. İmza alanları, bir imzanın algılanıp algılanmadığını belirtir.

Sonraki adımlar