Wat is optische tekenherkenning?
Met optische tekenherkenning (OCR) kunt u gedrukte of handgeschreven tekst extraheren uit afbeeldingen, zoals foto's van straatborden en producten, evenals uit facturen, facturen, financiële rapporten, artikelen en — meer. De OCR-technologieën van Microsoft ondersteunen het extraheren van gedrukte tekst in verschillende talen. Volg een snelstart om aan de slag te gaan.

Deze documentatie bevat de volgende typen artikelen:
- De quickstarts zijn stapsgewijs instructies voor het aanroepen van de service en het in korte tijd krijgen van resultaten.
- De instructiegidsen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.
API lezen
De Computer Vision Read-API is de nieuwste OCR-technologie van Azure (learnwhat's new)die gedrukte tekst extraheert (in verschillende talen), handgeschreven tekst (in verschillende talen), cijfers en valutasymbolen uit afbeeldingen en PDF-documenten met meerdere pagina's. Het is geoptimaliseerd om tekst te extraheren uit tekstzware afbeeldingen en PDF-documenten met meerdere pagina's met gemengde talen. Het ondersteunt het detecteren van zowel gedrukte als handgeschreven tekst in dezelfde afbeelding of hetzelfde document.
Vereisten voor invoer
De aanroep Lezen gebruikt afbeeldingen en documenten als invoer. Ze hebben de volgende vereisten:
- Ondersteunde bestandsindelingen: JPEG, PNG, BMP, PDF en TIFF
- Voor PDF- en TIFF-bestanden worden maximaal 2000 pagina's (alleen de eerste twee pagina's voor de gratis laag) verwerkt.
- De bestandsgrootte moet kleiner zijn dan 50 MB (6 MB voor de gratis laag) en de afmetingen moeten ten minste 50 x 50 pixels en ten hoogste 10000 x 10000 pixels zijn.
Ondersteunde talen
De Read-API ondersteunt 122 talen voor afdruktekst en 7 talen voor handgeschreven tekst, waaronder previewtalen en functies.
OCR voor afdruktekst biedt ondersteuning voor Engels, Frans, Duits, Italiaans, Portugees, Spaans, Chinees, Japans, Koreaans en Russisch (preview), samen met Latijnse en Cyrillische talen met de nieuwste preview-update.
OCR voor handgeschreven tekst biedt ondersteuning voor Engels en een preview van ondersteuning voor de Franse, Duitse, Italiaans-, Portugees-, Spaans- en Chinese taal.
Zie How to specify the model version to use the preview languages and features (De modelversie opgeven voor het gebruik van de preview-talen en -functies). Raadpleeg de volledige lijst met door OCR ondersteunde talen. Het preview-model bevat eventuele verbeteringen van de huidige ga-versie.
Belangrijke functies
De Read-API bevat de volgende functies.
- Tekstextractie afdrukken in 122 talen
- Handgeschreven tekstextractie in zeven talen
- Tekstregels en woorden met locatie- en betrouwbaarheidsscores
- Er is geen taalidentificatie vereist
- Ondersteuning voor gemengde talen, gemengde modus (afdrukken en handgeschreven)
- Pagina's en paginabereiken selecteren uit grote documenten met meerdere pagina's
- Optie voor natuurlijke leesorder voor tekstregeluitvoer (alleen Latijns)
- Handschriftclassificatie voor tekstregels (alleen Latijns)
- Beschikbaar als Distroless Docker-container voor on-premises implementatie
Meer informatie over het gebruik van de OCR-functies.
De cloud-API gebruiken of on-premises implementeren
De Read 3.x-cloud-API's zijn de voorkeursoptie voor de meeste klanten vanwege de eenvoudige integratie en snelle productiviteit. Azure en de Computer Vision verwerken de behoeften op het gebied van schaal, prestaties, gegevensbeveiliging en naleving, terwijl u zich richt op het voldoen aan de behoeften van uw klanten.
Voor on-premises implementatie kunt u met de Read Docker-container (preview) de nieuwe OCR-mogelijkheden implementeren in uw eigen lokale omgeving. Containers zijn ideaal voor specifieke vereisten voor beveiliging en gegevensbeheer.
Waarschuwing
De Computer Vision 2.0 RecognizeText-bewerkingen worden afgeschaft in plaats van de nieuwe Read-API die in dit artikel wordt behandeld. Bestaande klanten moeten overstappen op het gebruik van leesbewerkingen.
Gegevensprivacy en -beveiliging
Zoals geldt voor alle Cognitive Services, dienen ontwikkelaars die de Computer Vision-service gebruiken op de hoogte te zijn van het beleid van Microsoft inzake klantgegevens. Zie de pagina Cognitive Services (Engelstalig) in het Microsoft Trust Center voor meer informatie.
Volgende stappen
- Ga aan de slag met de snelstart voor OCR (Lezen) REST API of clientbibliotheek.
- Meer informatie over de Read 3.2-REST API.