Vad är nytt i Azure Formigenkänning
Formigenkänning-tjänsten uppdateras kontinuerligt. Bokmärk den här sidan för att hålla dig uppdaterad med viktig information, funktionsförbättringar och dokumentationsuppdateringar.
Oktober 2021
Formigenkänning ny förhandsversion
Formigenkänning nya förhandsversionen introducerar flera nya funktioner:
Allmän dokumentmodell är ett nytt API som använder en förtränad modell för att extrahera text, tabeller, struktur, nyckel/värde-par och namngivna entiteter från formulär och dokument.
Hotellkvittomodellen har lagts till i den fördefinierade kvittobearbetningen.
Utökade fält för ID-dokument ID-modellen stöder godkännanden, begränsningar och extrahering av fordonsklassificering från amerikanska förarlicenser.
Signaturfältet är en ny fälttyp i anpassade formulär för att identifiera förekomsten av en signatur i ett formulärfält.
Språkexpansion Stöd för 122 språk (print) och 7 språk (handskrivna). Formigenkänning layout och anpassat formulär utökar språk som stöds till 122 med den senaste förhandsversionen. Detta inkluderar extrahering av text för utskrift av text på 49 nya språk, inklusive ryska, rumänska och andra kyrilliska och fler latinska språk. Utöver extrahering av handskriven text har nu stöd för 7 språk som inkluderar engelska och nya förhandsversioner av förenklad kinesiska, franska, tyska, italienska, portugisiska och spanska.
Förbättringar av tabeller och textutökning Layouten stöder nu extrahering av tabeller med en rad som även kallas nyckel/värde-tabeller. Förbättringar av text extrahering ger bättre bearbetning av digitala PDF-filer och MRZ-text (Machine Readable Zone) i identitetsdokument, tillsammans med allmänna prestanda.
Formigenkänning Studio För att förenkla användningen av tjänsten kan du nu komma åt Formigenkänning Studio för att testa olika fördefinierade modeller eller etiketter och träna en anpassad modell
Bli nöjd med den nya REST API, Python eller .NET SDK för api:et för förhandsversionen av v3.0.
Formigenkänning extrahering av modelldata
| Modell | Extrahering av text | Nyckel/värde-par | Markeringsmarkeringar | Tabeller | Entiteter |
|---|---|---|---|---|---|
| 🆕Allmänt dokument | ✓ | ✓ | ✓ | ✓ | ✓ |
| Layout | ✓ | ✓ | ✓ | ||
| Faktura | ✓ | ✓ | ✓ | ✓ | |
| Mottagandet | ✓ | ✓ | |||
| ID-dokument | ✓ | ✓ | |||
| Visitkort | ✓ | ✓ | |||
| Anpassat | ✓ | ✓ | ✓ | ✓ | ✓ |
September 2021
Avancerade funktioner för Azure Metrics Explorer finns på Formigenkänning resursöversiktssidan i Azure Portal.
Menyn Övervakning
Diagram
Uppdatering av ID-dokumentmodell: förnamn, inklusive ett suffix, med eller utan punkt (fullständigt stopp), process:
Indatatext Resultat med uppdatering Smith Isak Kirby Smith. FirstName: Williams IsakLastName: Kirby Smith. Hare Caleb Caleb Sr FirstName: Caleb LastName: Posten Sr
Juli 2021
Stöd för system tilldelad hanterad identitet
Du kan nu aktivera en system tilldelad hanterad identitet för att ge Formigenkänning begränsad åtkomst till privata lagringskonton, inklusive konton som skyddas av ett Virtual Network (VNet) eller en brandvägg eller har aktiverat BYOS (Bring Your Own Storage). Mer information finns i Skapa och använda hanterad identitet Formigenkänning din resurs.
Juni 2021
Formigenkänning containrar v2.1 släpps i en gated preview
Formigenkänning funktioner stöds nu av sex funktionscontainrar:Layout, **Visitkort,**ID-dokument, Kvitto, Faktura och Anpassad. Om du vill använda dem måste du skicka en onlinebegäranoch ta emot godkännande.
Se Installera och köra Docker-containrar för Formigenkänning och Konfigurera Formigenkänning containrar
Formigenkänning-anslutningsappen släpptes i förhandsversion
Anslutningsappen Formigenkänning integreras med Azure Logic Apps, Microsoft Power Automateoch Microsoft Power Apps. Anslutningsappen stöder arbetsflödesåtgärder och utlösare för att extrahera och analysera dokumentdata och struktur från anpassade och fördefinierade formulär, fakturor, kvitton, visitkort och ID-dokument.
Formigenkänning SDK v3.1.0 korrigerat till v3.1.1 för C#, Java och Python
Korrigeringen adresserar fakturor som inte har fält för underradsobjekt identifierade, till exempel FormField med men inte eller Text BoundingBox Page information.
Maj 2021
Formigenkänning 2.1 API-version (allmänt tillgänglig)
Formigenkänning 2.1 är allmänt tillgänglig. Den här allmänt tillgängliga versionen (GA) markerar stabiliteten för de ändringar som introducerades i tidigare versioner av förhandsversionen av 2.1. Med den här versionen kan du identifiera och extrahera information och data från följande:
Kom igång
Gå till Formigenkänning exempelverktyget och följ snabbstarten
Layout lägger till tabellrubriker
Den uppdaterade layout-API-tabellfunktionen lägger till rubrikigenkänning med kolumnrubriker som kan sträcka sig över flera rader. Varje tabellcell har ett attribut som anger om den är en del av en rubrik eller inte. Detta kan användas för att identifiera vilka rader som utgör tabellrubriken.
SDK-uppdateringar
| Referensdokumentation | NuGet-paketversion 3.0.1 |
Icke-icke-icke-större ändringar
- FormRecognizerModelFactory-klassen stöder nu uppdateringar av TextAppearance och ReadingOrder och borttagning av TextStyle-modeller. Se Större ändringar
Större ändringar (maj)
Klienten använder som standard den senaste versionen av tjänsten som stöds, för närvarande v2.1. Du kan ange version 2.0 i FormRecognizerClientOptions-objektets versionsegenskap.
StartRecognizeIdentityDocuments. Metoder och metodparametrar har bytt namn med Identity för att ersätta id-nyckelordet för alla relaterade API-funktioner för identitetsdokumentidentifiering.
FormReadingOrder. ReadingOrder har bytt namn till FormReadingOrder.
AsCountryRegion. AsCountryCode har bytt namn till AsCountryRegion.
TextAppearance innehåller nu egenskaperna StyleName och StyleConfidence (tidigare en del av TextStyle-objektet).
FieldValueType. Värdet Kön har tagits bort från modellen.
TextStyle-modellen har tagits bort.
FieldValueGender-typen har tagits bort.
April 2021
SDK-förhandsgranskningsuppdateringar för API-version 2.1-preview.3
NuGet-paketversion 3.1.0-beta.4
Nya metoder för att analysera data från identitetsdokument:
StartRecognizeIdDocumentsFromUriAsync
StartRecognizeIdDocumentsAsync
En lista över fältvärden finns i Fält som extraherats i vår Formigenkänning dokumentation.
Utökade uppsättningen dokumentspråk som kan anges för metoden StartRecognizeContent.
Ny egenskap
Pagessom stöds av följande klasser:RecognizeBusinessCardsOptions RecognizeCustomFormsOptions RecognizeInvoicesOptions RecognizeReceiptsOptions
Med
Pagesegenskapen kan du välja enskilda sidor eller ett sidintervall för PDF- och TIFF-dokument med flera sidor. För enskilda sidor anger du sidnumret, till exempel3. För ett sidintervall (till exempel sida 2 och sidor 5–7) anger du p-åldersnumren och intervallen avgränsade med kommatecken:2, 5-7.Ny egenskap
ReadingOrdersom stöds för följande klass:Egenskapen är en valfri parameter som gör att du kan ange vilken läsordningsalgoritm– eller – som ska användas för
ReadingOrderbasicatt ordnanaturalextrahering av textelement. Om inget värde anges är standardvärdetbasic.
Större ändringar (april)
Klienten använder som standard den senaste versionen av tjänsten som stöds, som för närvarande är 2.1-preview.3.
StartRecognizeCustomForms-metoden kastar nu en
RequestFailedException()när en ogiltig fil skickas.
Mars 2021
Formigenkänning den offentliga förhandsversionen av v2.1 3 är nu tillgänglig. v2.1-preview.3 har släppts, inklusive följande funktioner:
Ny förbyggd ID-modell Med den nya fördefinierade ID-modellen kan kunderna ta ID:n och returnera strukturerade data för att automatisera bearbetningen. Den kombinerar våra kraftfulla OCR-funktioner (optisk teckenläsning) med ID Understanding-modeller för att extrahera viktig information från pass och amerikanska drivrutinslicenser, till exempel namn, födelsedatum, utfärdandedatum, förfallodatum med mera.
Extrahering av radobjekt för fakturamodell – Den fördefinierade fakturamodellen stöder nu extrahering av radobjekt. Den extraherar nu fullständiga objekt och deras delar – beskrivning, mängd, kvantitet, produkt-ID, datum med mera. Med ett enkelt API/SDK-anrop kan du extrahera användbara data från dina fakturor – text, tabell, nyckel/värde-par och radobjekt.
Övervakad tabelletiketter och träning, märkning med tomma värden – Förutom Formigenkänning:s senaste funktioner för automatisk extrahering av tabeller för djupinlärning kan kunder nu märka och träna i tabeller. Den här nya versionen innehåller möjligheten att märka och träna på radobjekt/tabeller (dynamiska och fasta) och träna en anpassad modell för att extrahera nyckel/värde-par och radobjekt. När en modell har tränats extraherar modellen radobjekt som en del av JSON-utdata i avsnittet documentResults.
Förutom att märka tabeller kan du nu märka tomma värden och regioner. Om vissa dokument i träningsuppsättningen inte har värden för vissa fält kan du märka dem så att din modell kan extrahera värden korrekt från analyserade dokument.
Stöd för 66 nya språk – Layout-API:et och anpassade modeller för Formigenkänning stöder nu 73 språk.
Naturlig läsordning, handskriftsklassificering och sidval – Med den här uppdateringen kan du välja att hämta textradsutdata i naturlig läsordning i stället för standardordningen från vänster till höger och uppifrån och ned. Använd den nya frågeparametern readingOrder och ställ in den på "naturligt" värde för mer användarvänliga läsordningsutdata. För latinska språk klassificerar Formigenkänning textrader som handskriven stil eller inte och ger en förtroendepoäng.
Kvalitetsförbättringar för fördefinierade kvittomodeller Den här uppdateringen innehåller många kvalitetsförbättringar för den fördefinierade kvittomodellen, särskilt kring extrahering av radobjekt.
November 2020
Nya funktioner
Formigenkänning v2.1 offentlig förhandsversion 2 är nu tillgänglig. v2.1-preview.2 har släppts, inklusive följande funktioner:
Ny förbyggd fakturamodell – Med den nya fördefinierade fakturamodellen kan kunderna ta fakturor i olika format och returnera strukturerade data för att automatisera fakturabearbetningen. Den kombinerar våra kraftfulla OCR-funktioner (optisk teckenläsning) med modeller för fakturaförståelse för djupinlärning för att extrahera viktig information från fakturor på engelska. Den extraherar nyckeltext, tabeller och information som kund, leverantör, faktura-ID, förfallodatum för faktura, summa, förfallobelopp, skattebelopp, frakt till och faktura till.
Förbättrad tabelluttrahering – Formigenkänning har nu förbättrad tabell extrahering, som kombinerar våra kraftfulla OCR-funktioner (optisk teckenläsning) med en modell för extrahering av djupinlärningstabeller. Formigenkänning kan extrahera data från tabeller, inklusive komplexa tabeller med sammanfogade kolumner, rader, inga kantlinjer med mera.
Uppdatering av klientbibliotek – De senaste versionerna av klientbiblioteken för .NET, Python, Java och JavaScript stöder Formigenkänning 2.1 API.
Nytt språk som stöds: Japanska – Följande nya språk stöds nu: för
AnalyzeLayoutoch : Japanska (AnalyzeCustomFormja). Stöd för språkStilindikator för textrad (handskriven/annan) (endast latinska språk) – Formigenkänning matar nu ut ett objekt som klassificerar om varje textrad är handskriven eller inte, tillsammans med en
appearanceförtroendepoäng. Den här funktionen stöds endast för latinska språk.Kvalitetsförbättringar – Extraheringsförbättringar inklusive förbättringar av ensiffrig extrahering.
Ny try-it-out-funktion i Formigenkänning Sample and Labeling Tool – Möjlighet att prova fördefinierade modeller för faktura, kvitto och visitkort och layout-API:et med hjälp av Formigenkänning-exempeletikettverktyget. Se hur dina data extraheras utan att du behöver skriva någon kod.
Prova Formigenkänning exempeletikettverktyget

Feedbackloop – När du analyserar filer via exempeletikettverktyget kan du nu även lägga till den i träningsuppsättningen och justera etiketterna om det behövs och träna för att förbättra modellen.
Automatisk etikett för dokument – Etiketterar automatiskt ytterligare dokument baserat på tidigare märkta dokument i projektet.
Augusti 2020
Nya funktioner
Formigenkänning den offentliga förhandsversionen av v2.1 är nu tillgänglig. V2.1-preview.1 har släppts, inklusive följande funktioner:
- REST API finns tillgänglig – Visa referensen v2.1-preview.1
- Nya språk som stöds Utöver engelska stöds nu följande språk: för och : Engelska ( ), kinesiska
LayoutTrain Custom Modelen(förenklad) (zh-Hans), nederländska ( ), franska (nl), tyska ( ), italienska ( ), portugisiska ( ) och spanska (frdeitptes). - Kryssruta/markeringsmarkering – Formigenkänning stöder identifiering och extrahering av markeringsmarkeringar, till exempel kryssrutor och alternativknappar. Markeringsmarkeringar extraheras i och du kan nu även märka och träna i Träna med etiketter för
LayoutTrain Custom Model- att extrahera nyckelvärdepar för markeringsmarkeringar. - Model Compose – gör att flera modeller kan bestå och anropas med ett enda modell-ID. När du skickar ett dokument som ska analyseras med ett sammansatt modell-ID utförs först ett klassificeringssteg för att dirigera det till rätt anpassad modell. Model Compose är tillgängligt för
Train Custom Model- Train with labels (Träna med etiketter). - Modellnamn – lägg till ett eget namn i dina anpassade modeller för enklare hantering och spårning.
- Ny förbyggd modell för visitkort för extrahering av vanliga fält på engelska, språk visitkort.
- Nya språk för färdiga kvitton utöver EN-US, stöd är nu tillgängligt för EN-AU, EN-CA, EN-GB, EN-IN
- Kvalitetsförbättringar för
Layout, Träna utan etiketterTrain Custom Model- och Träna med etiketter.
v2.0 innehåller följande uppdatering:
- Klientbiblioteken för NET, Python, Java och JavaScript har blivit allmänt tillgängliga.
Det finns nya exempel på GitHub.
- Spelboken Knowledge Extraction Recipes – Forms samlar in metodtips från verkliga Formigenkänning-kundengagemang och tillhandahåller användbara kodexempel, checklistor och exempelpipelines som används för att utveckla dessa projekt.
- Exempeletikettverktyget har uppdaterats för att stödja de nya v2.1-funktionerna. Se den här snabbstarten för att komma igång med verktyget.
- Exemplet intelligent kiosk Formigenkänning visar hur du integrerar och tränar utan
Analyze ReceiptTrain Custom Model- etiketter.
Juli 2020
Nya funktioner
v2.0-referens tillgänglig – Visa v2.0 API-referensen och de uppdaterade API:erna för .NET, Python, Javaoch JavaScript.
Förbättringar av tabell och extrahering – innehåller noggrannhetsförbättringar och förbättringar av tabellutökningar, särskilt möjligheten att lära sig tabellers rubriker och strukturer i anpassat träna utan etiketter.
Valutastöd – Identifiering och extrahering av globala valutasymboler.
Azure Gov – Formigenkänning är nu också tillgängligt i Azure Gov.
Förbättrade säkerhetsfunktioner:
- Bring Your Own Key – Formigenkänning krypterar automatiskt dina data när de sparas i molnet för att skydda dem och för att hjälpa dig att uppfylla organisationens säkerhets- och efterlevnadsåtaganden. Som standard använder din prenumeration krypteringsnycklar som hanteras av Microsoft. Nu kan du också hantera din prenumeration med dina egna krypteringsnycklar. Kund hanterade nycklar, även kallade BYOK (Bring Your Own Key),ger större flexibilitet för att skapa, rotera, inaktivera och återkalla åtkomstkontroller. Du kan också granska krypteringsnycklarna som används för att skydda dina data.
- Privata slutpunkter – Gör att du i ett virtuellt nätverk på ett säkert sätt kan komma åt data via en Private Link.
Juni 2020
Nya funktioner
- CopyModel-API har lagts till i klient-API:er – Nu kan du använda klient-API:erna för att kopiera modeller från en prenumeration till en annan. Allmän information om den här funktionen finns i Back up and recover models ( Back up and recover models) om du vill ha allmän information om den här funktionen.
- Azure Active Directory integrering – Nu kan du använda dina Autentiseringsuppgifter för Azure AD för att autentisera Formigenkänning klientobjekt i KLIENT-ID:erna.
- SDK-specifika ändringar – Den här ändringen omfattar både mindre funktions utöver och icke-mindre ändringar. Mer information finns i SDK-ändringsloggar.
April 2020
Nya funktioner
SDK-stöd för Formigenkänning API v2.0 – Den här månaden utökade vi vårt tjänststöd med en förhandsversion av SDK för Formigenkänning v2.0 (förhandsversion). Använd länkarna nedan för att komma igång med val av språk:
Den nya SDK:n stöder alla funktioner i v2.0 REST API för Formigenkänning. Du kan till exempel träna en modell med eller utan etiketter och extrahera text, nyckelvärdepar och tabeller från dina formulär, extrahera data från kvitton med den färdiga kvittotjänsten och extrahera text och tabeller med layouttjänsten från dina dokument. Du kan dela din feedback om SDK:erna via SDK-feedbackformuläret.
Kopiera anpassad modell Nu kan du kopiera modeller mellan regioner och prenumerationer med hjälp av den nya funktionen Kopiera anpassad modell. Innan du anropar API:et Kopiera anpassad modell måste du först få behörighet att kopiera till målresursen genom att anropa kopieringsauktoriseringsåtgärden mot målresursens slutpunkt.
- Generera en kopieringsauktorisering REST API
- Kopiera en anpassad modell REST API
Förbättringar av säkerhet
- Customer-Managed-nycklar är nu tillgängliga för FormRecognizer. Mer information finns i Datakryptering i vila för Formigenkänning.
- Använd hanterade identiteter för åtkomst till Azure-resurser med Azure Active Directory. Mer information finns i Auktorisera åtkomst till hanterade identiteter.
Mars 2020
Nya funktioner
Värdetyper för etikettering Nu kan du ange de typer av värden som du etiketterar med Formigenkänning exempeletikettverktyget. Följande värdetyper och varianter stöds för närvarande:
string- standard,
no-whitespaces,alphanumeric
- standard,
number- Standard
currency
- Standard
date- standard,
dmy,mdy,ymd
- standard,
timeinteger
Se guiden exempeletiketteringsverktyg för att lära dig hur du använder den här funktionen.
Tabellvisualisering Exempeletikettverktyget visar nu tabeller som identifierades i dokumentet. Med den här funktionen kan du visa de tabeller som har identifierats och extraherats från dokumentet, innan du etiketterar och analyserar. Den här funktionen kan vara på/av med hjälp av alternativet Skikt.
Följande bild är ett exempel på hur tabeller identifieras och extraheras:

De extraherade tabellerna är tillgängliga i JSON-utdata under
"pageResults".Viktigt
Etiketteringstabeller stöds inte. Om tabeller inte känns igen och extrateras automatiskt kan du bara märka dem som nyckel/värde-par. När du etiketterar tabeller som nyckel/värde-par ska du märka varje cell som ett unikt värde.
Extraheringsförbättringar
Den här versionen innehåller extraheringsförbättringar och noggrannhetsförbättringar, särskilt möjligheten att märka och extrahera flera nyckel/värde-par i samma textrad.
Exempel på märkningsverktyg har nu öppen källkod
Verktyget Formigenkänning Exempeletikettering är nu tillgängligt som ett projekt med öppen källkod. Du kan integrera den i dina lösningar och göra kundspecifika ändringar som uppfyller dina behov.
Mer information om Formigenkänning exempeletikettverktyget finns i dokumentationen som finns på GitHub.
Tvingande TLS 1.2
TLS 1.2 tillämpas nu för alla HTTP-begäranden till den här tjänsten. Mer information finns i Azure Cognitive Services säkerhet.
Januari 2020
Den här versionen introducerar Formigenkänning 2.0 (förhandsversion). I avsnitten nedan hittar du mer information om nya funktioner, förbättringar och ändringar.
Nya funktioner
Anpassad modell
- Träna med etiketter Nu kan du träna en anpassad modell med manuellt märkta data. Den här metoden resulterar i bättre modeller och kan skapa modeller som fungerar med komplexa formulär eller formulär som innehåller värden utan nycklar.
- Asynkront API Du kan använda asynkrona API-anrop för att träna med och analysera stora datamängder och filer.
- Stöd för TIFF-filer Nu kan du träna med och extrahera data från TIFF-dokument.
- Noggrannhetsförbättringar för extrahering
Förbyggd kvittomodell
- Tipsbelopp Nu kan du extrahera tipsbelopp och andra handskrivna värden.
- Extrahering av radobjekt Du kan extrahera radobjektsvärden från kvitton.
- Konfidensvärden Du kan visa modellens konfidens för varje extraherat värde.
- Noggrannhetsförbättringar för extrahering
Layout-extrahering Nu kan du använda layout-API:et för att extrahera textdata och tabelldata från dina formulär.
API-ändringar för anpassad modell
Alla API:er för träning och användning av anpassade modeller har bytt namn och vissa synkrona metoder är nu asynkrona. Följande är större ändringar:
- Processen för att träna en modell är nu asynkron. Du initierar träning via API-anropet /custom/models. Det här anropet returnerar ett åtgärds-ID som du kan skicka till custom/models/{modelID} för att returnera träningsresultatet.
- Extrahering av nycklar/värden initieras nu av API-anropet /custom/models/{modelID}/analyze. Det här anropet returnerar ett åtgärds-ID som du kan skicka till custom/models/{modelID}/analyzeResults/{resultID} för att returnera extraheringsresultatet.
- Åtgärds-ID:erna för åtgärden Train finns nu i location-huvudet för HTTP-svar, inte i rubriken Operation-Location.
API-kvittoändringar
API:erna för att läsa försäljningskvitton har bytt namn.
- Extrahering av kvittodata initieras nu av API-anropet /prebuilt/receipt/analyze. Det här anropet returnerar ett åtgärds-ID som du kan skicka till /prebuilt/receipt/analyzeResults/{resultID} för att returnera extraheringsresultatet.
Ändringar i utdataformat
JSON-svaren för alla API-anrop har nya format. Vissa nycklar och värden har lagts till, tagits bort eller bytt namn. Se snabbstarter för exempel på aktuella JSON-format.
Nästa steg
Slutför en snabbstart för att komma igång med att skriva en formulärbearbetningsapp Formigenkänning med valfri utvecklingsspråk.