Vad är optisk teckenläsning?
Med optisk teckenläsning (OCR) kan du extrahera tryckt eller handskriven text från bilder, till exempel foton av gatuskyltar och produkter, samt från dokumentfakturor, fakturor, ekonomiska — rapporter, artiklar med mera. Microsofts OCR-tekniker stöder extrahering av tryckt text på flera språk. Följ en snabbstart för att komma igång.

Den här dokumentationen innehåller följande typer av artiklar:
- Snabbstarterna är stegvisa instruktioner som gör att du kan göra anrop till tjänsten och få resultat på kort tid.
- Instruktionsguiderna innehåller instruktioner för att använda tjänsten på mer specifika eller anpassade sätt.
Api för läsning
API:et Visuellt innehåll Read är Azures senaste OCR-teknik(lärdig vad är nytt) som extraherar tryckt text (på flera språk), handskriven text (på flera språk), siffror och valutasymboler från bilder och PDF-dokument med flera sidor. Den är optimerad för att extrahera text från texttunga bilder och PDF-dokument med flera sidor med blandade språk. Den stöder identifiering av både tryckt och handskriven text i samma bild eller dokument.
Indatakrav
Anropet Läsa tar bilder och dokument som indata. De har följande krav:
- Filformat som stöds: JPEG, PNG, BMP, PDF och TIFF
- För PDF- och TIFF-filer bearbetas upp till 2 000 sidor (endast de första två sidorna för den kostnadsfria nivån).
- Filstorleken måste vara mindre än 50 MB (6 MB för den kostnadsfria nivån) och dimensioner minst 50 x 50 bildpunkter och högst 1 0 0000 x 1 0000 bildpunkter.
Språk som stöds
API:et Read stöder 122 språk för utskriftstext och 7 språk för handskriven text, inklusive förhandsgranskningsspråk och funktioner.
OCR för utskriftstext har stöd för engelska, franska, tyska, italienska, portugisiska, spanska, kinesiska, japanska, koreanska och ryska (förhandsversion), tillsammans med latinska och kyrilliska språk med den senaste förhandsversionsuppdateringen.
OCR för handskriven text har stöd för engelska och förhandsversion av franska, tyska, italienska, portugisiska, spanska och kinesiska.
Se Så här anger du vilken modellversion som ska använda förhandsversionens språk och funktioner. Se den fullständiga listan över OCR-språk som stöds. Förhandsversionsmodellen innehåller eventuella förbättringar av den aktuella GA-versionen.
Huvudfunktioner
API:et Read innehåller följande funktioner.
- Extrahering av text på 122 språk
- Handskriven textuttrahering på sju språk
- Textrader och ord med plats- och förtroendepoäng
- Ingen språkidentifiering krävs
- Stöd för blandade språk, blandat läge (skriv ut och handskriven)
- Välja sidor och sidintervall från stora dokument med flera sidor
- Alternativ för naturlig läsordning för textradsutdata (endast latinsk)
- Handskriftsklassificering för textrader (endast latinsk)
- Tillgänglig som distrolös Docker-container för lokal distribution
Lär dig hur du använder OCR-funktionerna.
Använda moln-API:et eller distribuera lokalt
Read 3.x-moln-API:er är det bästa alternativet för de flesta kunder på grund av enkel integrering och snabb produktivitet. Azure och Visuellt innehåll-tjänsten hanterar skalning, prestanda, datasäkerhet och efterlevnadsbehov samtidigt som du fokuserar på att uppfylla dina kunders behov.
För lokal distribution gör Read Docker-containern (förhandsversion) att du kan distribuera de nya OCR-funktionerna i din egen lokala miljö. Containrar är bra för specifika säkerhets- och datastyrningskrav.
Varning
De Visuellt innehåll 2.0 RecognizeText-åtgärderna håller på att bli inaktuella för det nya Läs-API som beskrivs i den här artikeln. Befintliga kunder bör övergå till att använda läsåtgärder.
Datasekretess och säkerhet
Som med alla Cognitive Services bör utvecklare som använder tjänsten Visuellt innehåll känna till Microsofts policyer gällande kunddata. Läs mer på Cognitive Services-sidan på Microsoft Trust Center.
Nästa steg
- Kom igång med snabbstarterna OCR (REST API eller klientbibliotek).
- Läs mer om Read 3.2 REST API.