Görüntüler için OCR (sürüm 4.0)

Dekont

PDF, Office ve HTML belgelerinden ve belge görüntülerinden metin ayıklamak için akıllı belge işleme senaryolarınızı desteklemeyi kolaylaştıran zaman uyumsuz bir API ile metin ağırlıklı dijital ve taranmış belgeler için iyileştirilmiş Belge Zekası Okuma OCR modelini kullanın.

OCR geleneksel olarak ürün etiketleri, kullanıcı tarafından oluşturulan görüntüler, ekran görüntüleri, sokak işaretleri ve posterler gibi vahşi ve belge dışı görüntülerden metin ayıklamaya yönelik makine öğrenmesi tabanlı bir teknik olarak başlamıştır. Metin açısından yoğun olmayan tek görüntüler gibi çeşitli senaryolar için hızlı, zaman uyumlu bir API'ye veya hizmete ihtiyacınız vardır. Bu, hızlı dönüş süreleriyle içerik anlama ve izleme kullanıcı eylemlerini zenginleştirmek için OCR'nin neredeyse gerçek zamanlı kullanıcı deneyimlerine katıştırılmasını sağlar.

Görüntü İşleme v4.0 Okuma OCR nedir?

Yeni Görüntü İşleme Görüntü Analizi 4.0 REST API'si, OCR sonuçları da dahil olmak üzere tüm görüntü içgörülerini tek bir API işleminde almayı kolaylaştıran birleşik bir performans artırılmış zaman uyumlu API'deki görüntülerden yazdırılmış veya el yazısı metin ayıklama olanağı sunar. Read OCR altyapısı, genel dil desteği için evrensel betik tabanlı modeller tarafından desteklenen birden çok derin öğrenme modeli üzerine kurulmuştur.

Bahşiş

Azure OpenAI hizmeti aracılığıyla OCR özelliğini kullanabilirsiniz. GpT-4 Görüntü İşlemeli Turbo modeli, paylaştığınız görüntüleri analiz eden bir yapay zeka yardımcısı ile sohbet etmenizi sağlar ve Görüntü geliştirme seçeneği görüntü hakkında daha fazla ayrıntı (okunabilir metin ve nesne konumları) yapay zeka yardımı sağlamak için Görüntü Analizi'ni kullanır. Daha fazla bilgi için bkz . GPT-4 Turbo with Vision hızlı başlangıcı.

Metin ayıklama örneği

Aşağıdaki JSON yanıtı, verilen görüntüden metin ayıklanırken Görüntü Analizi 4.0 API'sinin ne döndürdüğü gösterilir.

Photo of a sticky note with writing on it.

{
    "modelVersion": "2024-02-01",
    "metadata":
    {
        "width": 1000,
        "height": 945
    },
    "readResult":
    {
        "blocks":
        [
            {
                "lines":
                [
                    {
                        "text": "You must be the change you",
                        "boundingPolygon":
                        [
                            {"x":251,"y":265},
                            {"x":673,"y":260},
                            {"x":674,"y":308},
                            {"x":252,"y":318}
                        ],
                        "words":
                        [
                            {"text":"You","boundingPolygon":[{"x":252,"y":267},{"x":307,"y":265},{"x":307,"y":318},{"x":253,"y":318}],"confidence":0.996},
                            {"text":"must","boundingPolygon":[{"x":318,"y":264},{"x":386,"y":263},{"x":387,"y":316},{"x":319,"y":318}],"confidence":0.99},
                            {"text":"be","boundingPolygon":[{"x":396,"y":262},{"x":432,"y":262},{"x":432,"y":315},{"x":396,"y":316}],"confidence":0.891},
                            {"text":"the","boundingPolygon":[{"x":441,"y":262},{"x":503,"y":261},{"x":503,"y":312},{"x":442,"y":314}],"confidence":0.994},
                            {"text":"change","boundingPolygon":[{"x":513,"y":261},{"x":613,"y":262},{"x":613,"y":306},{"x":513,"y":311}],"confidence":0.99},
                            {"text":"you","boundingPolygon":[{"x":623,"y":262},{"x":673,"y":263},{"x":673,"y":302},{"x":622,"y":305}],"confidence":0.994}
                        ]
                    },
                    {
                        "text": "wish to see in the world !",
                        "boundingPolygon":
                        [
                            {"x":325,"y":338},
                            {"x":695,"y":328},
                            {"x":696,"y":370},
                            {"x":325,"y":381}
                        ],
                        "words":
                        [
                            {"text":"wish","boundingPolygon":[{"x":325,"y":339},{"x":390,"y":337},{"x":391,"y":380},{"x":326,"y":381}],"confidence":0.992},
                            {"text":"to","boundingPolygon":[{"x":406,"y":337},{"x":443,"y":335},{"x":443,"y":379},{"x":407,"y":380}],"confidence":0.995},
                            {"text":"see","boundingPolygon":[{"x":451,"y":335},{"x":494,"y":334},{"x":494,"y":377},{"x":452,"y":379}],"confidence":0.996},
                            {"text":"in","boundingPolygon":[{"x":502,"y":333},{"x":533,"y":332},{"x":534,"y":376},{"x":503,"y":377}],"confidence":0.996},
                            {"text":"the","boundingPolygon":[{"x":542,"y":332},{"x":590,"y":331},{"x":590,"y":375},{"x":542,"y":376}],"confidence":0.995},
                            {"text":"world","boundingPolygon":[{"x":599,"y":331},{"x":664,"y":329},{"x":664,"y":372},{"x":599,"y":374}],"confidence":0.995},
                            {"text":"!","boundingPolygon":[{"x":672,"y":329},{"x":694,"y":328},{"x":694,"y":371},{"x":672,"y":372}],"confidence":0.957}
                        ]
                    },
                    {
                        "text": "Everything has its beauty , but",
                        "boundingPolygon":
                        [
                            {"x":254,"y":439},
                            {"x":644,"y":433},
                            {"x":645,"y":484},
                            {"x":255,"y":488}
                        ],
                        "words":
                        [
                            {"text":"Everything","boundingPolygon":[{"x":254,"y":442},{"x":379,"y":440},{"x":380,"y":486},{"x":257,"y":488}],"confidence":0.97},
                            {"text":"has","boundingPolygon":[{"x":388,"y":440},{"x":435,"y":438},{"x":436,"y":485},{"x":389,"y":486}],"confidence":0.965},
                            {"text":"its","boundingPolygon":[{"x":445,"y":438},{"x":485,"y":437},{"x":486,"y":485},{"x":446,"y":485}],"confidence":0.99},
                            {"text":"beauty","boundingPolygon":[{"x":495,"y":437},{"x":567,"y":435},{"x":568,"y":485},{"x":496,"y":485}],"confidence":0.685},
                            {"text":",","boundingPolygon":[{"x":577,"y":435},{"x":583,"y":435},{"x":583,"y":485},{"x":577,"y":485}],"confidence":0.939},
                            {"text":"but","boundingPolygon":[{"x":589,"y":435},{"x":644,"y":434},{"x":644,"y":485},{"x":589,"y":485}],"confidence":0.628}
                        ]
                    },
                    {
                        "text": "not everyone sees it !",
                        "boundingPolygon":
                        [
                            {"x":363,"y":508},
                            {"x":658,"y":493},
                            {"x":659,"y":539},
                            {"x":364,"y":552}
                        ],
                        "words":
                        [
                            {"text":"not","boundingPolygon":[{"x":363,"y":510},{"x":412,"y":508},{"x":413,"y":548},{"x":365,"y":552}],"confidence":0.989},
                            {"text":"everyone","boundingPolygon":[{"x":420,"y":507},{"x":521,"y":501},{"x":522,"y":542},{"x":421,"y":548}],"confidence":0.924},
                            {"text":"sees","boundingPolygon":[{"x":536,"y":501},{"x":588,"y":498},{"x":589,"y":540},{"x":537,"y":542}],"confidence":0.987},
                            {"text":"it","boundingPolygon":[{"x":597,"y":497},{"x":627,"y":495},{"x":628,"y":540},{"x":598,"y":540}],"confidence":0.995},
                            {"text":"!","boundingPolygon":[{"x":635,"y":495},{"x":656,"y":494},{"x":657,"y":540},{"x":636,"y":540}],"confidence":0.952}
                        ]
                    }
                ]
            }
        ]
    }
}

API’yi kullanma

Metin ayıklama özelliği, Görüntü Analizi API'sinin bir parçasıdır. Özellikler sorgu parametresine ekleyinRead. Ardından, tam JSON yanıtını aldığınızda, bölümün içeriği için dizeyi ayrıştırın "readResult" .

Sonraki adımlar

Görüntü Analizi 4.0 API'sini kullanarak görüntüden metin ayıklamak için Görüntü Analizi hızlı başlangıcını izleyin.