Vad är nytt i Azure Formigenkänning

Formigenkänning-tjänsten uppdateras kontinuerligt. Bokmärk den här sidan för att hålla dig uppdaterad med viktig information, funktionsförbättringar och dokumentationsuppdateringar.

Oktober 2021

Formigenkänning ny förhandsversion

Formigenkänning nya förhandsversionen introducerar flera nya funktioner:

  • Allmän dokumentmodell är ett nytt API som använder en förtränad modell för att extrahera text, tabeller, struktur, nyckel/värde-par och namngivna entiteter från formulär och dokument.

  • Hotellkvittomodellen har lagts till i den fördefinierade kvittobearbetningen.

  • Utökade fält för ID-dokument ID-modellen stöder godkännanden, begränsningar och extrahering av fordonsklassificering från amerikanska förarlicenser.

  • Signaturfältet är en ny fälttyp i anpassade formulär för att identifiera förekomsten av en signatur i ett formulärfält.

  • Språkexpansion Stöd för 122 språk (print) och 7 språk (handskrivna). Formigenkänning layout och anpassat formulär utökar språk som stöds till 122 med den senaste förhandsversionen. Detta inkluderar extrahering av text för utskrift av text på 49 nya språk, inklusive ryska, rumänska och andra kyrilliska och fler latinska språk. Utöver extrahering av handskriven text har nu stöd för 7 språk som inkluderar engelska och nya förhandsversioner av förenklad kinesiska, franska, tyska, italienska, portugisiska och spanska.

  • Förbättringar av tabeller och textutökning Layouten stöder nu extrahering av tabeller med en rad som även kallas nyckel/värde-tabeller. Förbättringar av text extrahering ger bättre bearbetning av digitala PDF-filer och MRZ-text (Machine Readable Zone) i identitetsdokument, tillsammans med allmänna prestanda.

  • Formigenkänning Studio För att förenkla användningen av tjänsten kan du nu komma åt Formigenkänning Studio för att testa olika fördefinierade modeller eller etiketter och träna en anpassad modell

Bli nöjd med den nya REST API, Python eller .NET SDK för api:et för förhandsversionen av v3.0.

Formigenkänning extrahering av modelldata

Modell Extrahering av text Nyckel/värde-par Markeringsmarkeringar Tabeller Entiteter
🆕Allmänt dokument
Layout
Faktura
Mottagandet
ID-dokument
Visitkort
Anpassat

September 2021

  • Avancerade funktioner för Azure Metrics Explorer finns på Formigenkänning resursöversiktssidan i Azure Portal.

    Menyn Övervakning

    Skärmbild som visar övervakningsmenyn i Azure Portal

    Diagram

    Skärmbild som visar ett exempelmåttdiagram i Azure Portal.

  • Uppdatering av ID-dokumentmodell: förnamn, inklusive ett suffix, med eller utan punkt (fullständigt stopp), process:

    Indatatext Resultat med uppdatering
    Smith Isak Kirby Smith. FirstName: Williams Isak

    LastName: Kirby Smith.
    Hare Caleb Caleb Sr FirstName: Caleb

    LastName: Posten Sr

Juli 2021

Stöd för system tilldelad hanterad identitet

Du kan nu aktivera en system tilldelad hanterad identitet för att ge Formigenkänning begränsad åtkomst till privata lagringskonton, inklusive konton som skyddas av ett Virtual Network (VNet) eller en brandvägg eller har aktiverat BYOS (Bring Your Own Storage). Mer information finns i Skapa och använda hanterad identitet Formigenkänning din resurs.

Juni 2021

Formigenkänning containrar v2.1 släpps i en gated preview

Formigenkänning funktioner stöds nu av sex funktionscontainrar:Layout, **Visitkort,**ID-dokument, Kvitto, Faktura och Anpassad. Om du vill använda dem måste du skicka en onlinebegäranoch ta emot godkännande.

Se Installera och köra Docker-containrar för Formigenkänning och Konfigurera Formigenkänning containrar

Formigenkänning-anslutningsappen släpptes i förhandsversion

Anslutningsappen Formigenkänning integreras med Azure Logic Apps, Microsoft Power Automateoch Microsoft Power Apps. Anslutningsappen stöder arbetsflödesåtgärder och utlösare för att extrahera och analysera dokumentdata och struktur från anpassade och fördefinierade formulär, fakturor, kvitton, visitkort och ID-dokument.

Formigenkänning SDK v3.1.0 korrigerat till v3.1.1 för C#, Java och Python

Korrigeringen adresserar fakturor som inte har fält för underradsobjekt identifierade, till exempel FormField med men inte eller Text BoundingBox Page information.

Maj 2021

Formigenkänning 2.1 API-version (allmänt tillgänglig)

  • Formigenkänning 2.1 är allmänt tillgänglig. Den här allmänt tillgängliga versionen (GA) markerar stabiliteten för de ändringar som introducerades i tidigare versioner av förhandsversionen av 2.1. Med den här versionen kan du identifiera och extrahera information och data från följande:

  • Dokument

  • Kvitton

  • Visitkort

  • Fakturor

  • Identitetsdokument

  • Anpassade formulär

Kom igång

Gå till Formigenkänning exempelverktyget och följ snabbstarten

Layout lägger till tabellrubriker

Den uppdaterade layout-API-tabellfunktionen lägger till rubrikigenkänning med kolumnrubriker som kan sträcka sig över flera rader. Varje tabellcell har ett attribut som anger om den är en del av en rubrik eller inte. Detta kan användas för att identifiera vilka rader som utgör tabellrubriken.

SDK-uppdateringar

| Referensdokumentation | NuGet-paketversion 3.0.1 |

Icke-icke-icke-större ändringar

  • FormRecognizerModelFactory-klassen stöder nu uppdateringar av TextAppearance och ReadingOrder och borttagning av TextStyle-modeller. Se Större ändringar

Större ändringar (maj)

  • Klienten använder som standard den senaste versionen av tjänsten som stöds, för närvarande v2.1. Du kan ange version 2.0 i FormRecognizerClientOptions-objektets versionsegenskap.

  • StartRecognizeIdentityDocuments. Metoder och metodparametrar har bytt namn med Identity för att ersätta id-nyckelordet för alla relaterade API-funktioner för identitetsdokumentidentifiering.

  • FormReadingOrder. ReadingOrder har bytt namn till FormReadingOrder.

  • AsCountryRegion. AsCountryCode har bytt namn till AsCountryRegion.

  • TextAppearance innehåller nu egenskaperna StyleName och StyleConfidence (tidigare en del av TextStyle-objektet).

  • FieldValueType. Värdet Kön har tagits bort från modellen.

  • TextStyle-modellen har tagits bort.

  • FieldValueGender-typen har tagits bort.

April 2021

SDK-förhandsgranskningsuppdateringar för API-version 2.1-preview.3

NuGet-paketversion 3.1.0-beta.4

  • Nya metoder för att analysera data från identitetsdokument:

    StartRecognizeIdDocumentsFromUriAsync

    StartRecognizeIdDocumentsAsync

    En lista över fältvärden finns i Fält som extraherats i vår Formigenkänning dokumentation.

  • Utökade uppsättningen dokumentspråk som kan anges för metoden StartRecognizeContent.

  • Ny egenskap Pages som stöds av följande klasser:

    RecognizeBusinessCardsOptions
    RecognizeCustomFormsOptions
    RecognizeInvoicesOptions
    RecognizeReceiptsOptions

    Med Pages egenskapen kan du välja enskilda sidor eller ett sidintervall för PDF- och TIFF-dokument med flera sidor. För enskilda sidor anger du sidnumret, till exempel 3 . För ett sidintervall (till exempel sida 2 och sidor 5–7) anger du p-åldersnumren och intervallen avgränsade med kommatecken: 2, 5-7 .

  • Ny egenskap ReadingOrder som stöds för följande klass:

    RecognizeContentOptions

    Egenskapen är en valfri parameter som gör att du kan ange vilken läsordningsalgoritm– eller – som ska användas för ReadingOrder basic att ordna natural extrahering av textelement. Om inget värde anges är standardvärdet basic .

Större ändringar (april)

  • Klienten använder som standard den senaste versionen av tjänsten som stöds, som för närvarande är 2.1-preview.3.

  • StartRecognizeCustomForms-metoden kastar nu en RequestFailedException() när en ogiltig fil skickas.

Mars 2021

Formigenkänning den offentliga förhandsversionen av v2.1 3 är nu tillgänglig. v2.1-preview.3 har släppts, inklusive följande funktioner:

  • Ny förbyggd ID-modell Med den nya fördefinierade ID-modellen kan kunderna ta ID:n och returnera strukturerade data för att automatisera bearbetningen. Den kombinerar våra kraftfulla OCR-funktioner (optisk teckenläsning) med ID Understanding-modeller för att extrahera viktig information från pass och amerikanska drivrutinslicenser, till exempel namn, födelsedatum, utfärdandedatum, förfallodatum med mera.

    Läs mer om den fördefinierade ID-modellen

    passport-exempel

  • Extrahering av radobjekt för fakturamodell – Den fördefinierade fakturamodellen stöder nu extrahering av radobjekt. Den extraherar nu fullständiga objekt och deras delar – beskrivning, mängd, kvantitet, produkt-ID, datum med mera. Med ett enkelt API/SDK-anrop kan du extrahera användbara data från dina fakturor – text, tabell, nyckel/värde-par och radobjekt.

    Läs mer om fakturamodellen

  • Övervakad tabelletiketter och träning, märkning med tomma värden – Förutom Formigenkänning:s senaste funktioner för automatisk extrahering av tabeller för djupinlärning kan kunder nu märka och träna i tabeller. Den här nya versionen innehåller möjligheten att märka och träna på radobjekt/tabeller (dynamiska och fasta) och träna en anpassad modell för att extrahera nyckel/värde-par och radobjekt. När en modell har tränats extraherar modellen radobjekt som en del av JSON-utdata i avsnittet documentResults.

    Tabelletiketter

    Förutom att märka tabeller kan du nu märka tomma värden och regioner. Om vissa dokument i träningsuppsättningen inte har värden för vissa fält kan du märka dem så att din modell kan extrahera värden korrekt från analyserade dokument.

  • Stöd för 66 nya språk – Layout-API:et och anpassade modeller för Formigenkänning stöder nu 73 språk.

    Läs mer Formigenkänning om språkstöd

  • Naturlig läsordning, handskriftsklassificering och sidval – Med den här uppdateringen kan du välja att hämta textradsutdata i naturlig läsordning i stället för standardordningen från vänster till höger och uppifrån och ned. Använd den nya frågeparametern readingOrder och ställ in den på "naturligt" värde för mer användarvänliga läsordningsutdata. För latinska språk klassificerar Formigenkänning textrader som handskriven stil eller inte och ger en förtroendepoäng.

  • Kvalitetsförbättringar för fördefinierade kvittomodeller Den här uppdateringen innehåller många kvalitetsförbättringar för den fördefinierade kvittomodellen, särskilt kring extrahering av radobjekt.

November 2020

Nya funktioner

Formigenkänning v2.1 offentlig förhandsversion 2 är nu tillgänglig. v2.1-preview.2 har släppts, inklusive följande funktioner:

  • Ny förbyggd fakturamodell – Med den nya fördefinierade fakturamodellen kan kunderna ta fakturor i olika format och returnera strukturerade data för att automatisera fakturabearbetningen. Den kombinerar våra kraftfulla OCR-funktioner (optisk teckenläsning) med modeller för fakturaförståelse för djupinlärning för att extrahera viktig information från fakturor på engelska. Den extraherar nyckeltext, tabeller och information som kund, leverantör, faktura-ID, förfallodatum för faktura, summa, förfallobelopp, skattebelopp, frakt till och faktura till.

    Läs mer om den fördefinierade fakturamodellen

    fakturaexempel

  • Förbättrad tabelluttrahering – Formigenkänning har nu förbättrad tabell extrahering, som kombinerar våra kraftfulla OCR-funktioner (optisk teckenläsning) med en modell för extrahering av djupinlärningstabeller. Formigenkänning kan extrahera data från tabeller, inklusive komplexa tabeller med sammanfogade kolumner, rader, inga kantlinjer med mera.

    tabellexempel

    Läs mer om extrahering av layout

  • Uppdatering av klientbibliotek De senaste versionerna av klientbiblioteken för .NET, Python, Java och JavaScript stöder Formigenkänning 2.1 API.

  • Nytt språk som stöds: Japanska – Följande nya språk stöds nu: för AnalyzeLayout och : Japanska ( AnalyzeCustomForm ja ). Stöd för språk

  • Stilindikator för textrad (handskriven/annan) (endast latinska språk) – Formigenkänning matar nu ut ett objekt som klassificerar om varje textrad är handskriven eller inte, tillsammans med en appearance förtroendepoäng. Den här funktionen stöds endast för latinska språk.

  • Kvalitetsförbättringar – Extraheringsförbättringar inklusive förbättringar av ensiffrig extrahering.

  • Ny try-it-out-funktion i Formigenkänning Sample and Labeling Tool – Möjlighet att prova fördefinierade modeller för faktura, kvitto och visitkort och layout-API:et med hjälp av Formigenkänning-exempeletikettverktyget. Se hur dina data extraheras utan att du behöver skriva någon kod.

    Prova Formigenkänning exempeletikettverktyget

    Skärmbild: Exempel på etikettverktyg.

  • Feedbackloop – När du analyserar filer via exempeletikettverktyget kan du nu även lägga till den i träningsuppsättningen och justera etiketterna om det behövs och träna för att förbättra modellen.

  • Automatisk etikett för dokument – Etiketterar automatiskt ytterligare dokument baserat på tidigare märkta dokument i projektet.

Augusti 2020

Nya funktioner

Formigenkänning den offentliga förhandsversionen av v2.1 är nu tillgänglig. V2.1-preview.1 har släppts, inklusive följande funktioner:

  • REST API finns tillgänglig – Visa referensen v2.1-preview.1
  • Nya språk som stöds Utöver engelska stöds nu följande språk: för och : Engelska ( ), kinesiska Layout Train Custom Model en (förenklad) ( zh-Hans ), nederländska ( ), franska ( nl ), tyska ( ), italienska ( ), portugisiska ( ) och spanska ( fr de it pt es ).
  • Kryssruta/markeringsmarkering – Formigenkänning stöder identifiering och extrahering av markeringsmarkeringar, till exempel kryssrutor och alternativknappar. Markeringsmarkeringar extraheras i och du kan nu även märka och träna i Träna med etiketter för Layout Train Custom Model - att extrahera nyckelvärdepar för markeringsmarkeringar.
  • Model Compose – gör att flera modeller kan bestå och anropas med ett enda modell-ID. När du skickar ett dokument som ska analyseras med ett sammansatt modell-ID utförs först ett klassificeringssteg för att dirigera det till rätt anpassad modell. Model Compose är tillgängligt för Train Custom Model - Train with labels (Träna med etiketter).
  • Modellnamn – lägg till ett eget namn i dina anpassade modeller för enklare hantering och spårning.
  • Ny förbyggd modell för visitkort för extrahering av vanliga fält på engelska, språk visitkort.
  • Nya språk för färdiga kvitton utöver EN-US, stöd är nu tillgängligt för EN-AU, EN-CA, EN-GB, EN-IN
  • Kvalitetsförbättringar för Layout , Träna utan etiketter Train Custom Model - och Träna med etiketter.

v2.0 innehåller följande uppdatering:

  • Klientbiblioteken för NET, Python, Java och JavaScript har blivit allmänt tillgängliga.

Det finns nya exempel på GitHub.

Juli 2020

Nya funktioner

  • v2.0-referens tillgänglig – Visa v2.0 API-referensen och de uppdaterade API:erna för .NET, Python, Javaoch JavaScript.

  • Förbättringar av tabell och extrahering – innehåller noggrannhetsförbättringar och förbättringar av tabellutökningar, särskilt möjligheten att lära sig tabellers rubriker och strukturer i anpassat träna utan etiketter.

  • Valutastöd – Identifiering och extrahering av globala valutasymboler.

  • Azure Gov – Formigenkänning är nu också tillgängligt i Azure Gov.

  • Förbättrade säkerhetsfunktioner:

    • Bring Your Own Key – Formigenkänning krypterar automatiskt dina data när de sparas i molnet för att skydda dem och för att hjälpa dig att uppfylla organisationens säkerhets- och efterlevnadsåtaganden. Som standard använder din prenumeration krypteringsnycklar som hanteras av Microsoft. Nu kan du också hantera din prenumeration med dina egna krypteringsnycklar. Kund hanterade nycklar, även kallade BYOK (Bring Your Own Key),ger större flexibilitet för att skapa, rotera, inaktivera och återkalla åtkomstkontroller. Du kan också granska krypteringsnycklarna som används för att skydda dina data.
    • Privata slutpunkter – Gör att du i ett virtuellt nätverk på ett säkert sätt kan komma åt data via en Private Link.

Juni 2020

Nya funktioner

April 2020

Nya funktioner

  • SDK-stöd för Formigenkänning API v2.0 – Den här månaden utökade vi vårt tjänststöd med en förhandsversion av SDK för Formigenkänning v2.0 (förhandsversion). Använd länkarna nedan för att komma igång med val av språk:

    Den nya SDK:n stöder alla funktioner i v2.0 REST API för Formigenkänning. Du kan till exempel träna en modell med eller utan etiketter och extrahera text, nyckelvärdepar och tabeller från dina formulär, extrahera data från kvitton med den färdiga kvittotjänsten och extrahera text och tabeller med layouttjänsten från dina dokument. Du kan dela din feedback om SDK:erna via SDK-feedbackformuläret.

  • Kopiera anpassad modell Nu kan du kopiera modeller mellan regioner och prenumerationer med hjälp av den nya funktionen Kopiera anpassad modell. Innan du anropar API:et Kopiera anpassad modell måste du först få behörighet att kopiera till målresursen genom att anropa kopieringsauktoriseringsåtgärden mot målresursens slutpunkt.

Förbättringar av säkerhet

Mars 2020

Nya funktioner

  • Värdetyper för etikettering Nu kan du ange de typer av värden som du etiketterar med Formigenkänning exempeletikettverktyget. Följande värdetyper och varianter stöds för närvarande:

    • string
      • standard, no-whitespaces , alphanumeric
    • number
      • Standard currency
    • date
      • standard, dmy , mdy , ymd
    • time
    • integer

    Se guiden exempeletiketteringsverktyg för att lära dig hur du använder den här funktionen.

  • Tabellvisualisering Exempeletikettverktyget visar nu tabeller som identifierades i dokumentet. Med den här funktionen kan du visa de tabeller som har identifierats och extraherats från dokumentet, innan du etiketterar och analyserar. Den här funktionen kan vara på/av med hjälp av alternativet Skikt.

    Följande bild är ett exempel på hur tabeller identifieras och extraheras:

    Tabellvisualisering med hjälp av exempeletikettverktyget

    De extraherade tabellerna är tillgängliga i JSON-utdata under "pageResults" .

    Viktigt

    Etiketteringstabeller stöds inte. Om tabeller inte känns igen och extrateras automatiskt kan du bara märka dem som nyckel/värde-par. När du etiketterar tabeller som nyckel/värde-par ska du märka varje cell som ett unikt värde.

Extraheringsförbättringar

Den här versionen innehåller extraheringsförbättringar och noggrannhetsförbättringar, särskilt möjligheten att märka och extrahera flera nyckel/värde-par i samma textrad.

Exempel på märkningsverktyg har nu öppen källkod

Verktyget Formigenkänning Exempeletikettering är nu tillgängligt som ett projekt med öppen källkod. Du kan integrera den i dina lösningar och göra kundspecifika ändringar som uppfyller dina behov.

Mer information om Formigenkänning exempeletikettverktyget finns i dokumentationen som finns på GitHub.

Tvingande TLS 1.2

TLS 1.2 tillämpas nu för alla HTTP-begäranden till den här tjänsten. Mer information finns i Azure Cognitive Services säkerhet.

Januari 2020

Den här versionen introducerar Formigenkänning 2.0 (förhandsversion). I avsnitten nedan hittar du mer information om nya funktioner, förbättringar och ändringar.

Nya funktioner

  • Anpassad modell

    • Träna med etiketter Nu kan du träna en anpassad modell med manuellt märkta data. Den här metoden resulterar i bättre modeller och kan skapa modeller som fungerar med komplexa formulär eller formulär som innehåller värden utan nycklar.
    • Asynkront API Du kan använda asynkrona API-anrop för att träna med och analysera stora datamängder och filer.
    • Stöd för TIFF-filer Nu kan du träna med och extrahera data från TIFF-dokument.
    • Noggrannhetsförbättringar för extrahering
  • Förbyggd kvittomodell

    • Tipsbelopp Nu kan du extrahera tipsbelopp och andra handskrivna värden.
    • Extrahering av radobjekt Du kan extrahera radobjektsvärden från kvitton.
    • Konfidensvärden Du kan visa modellens konfidens för varje extraherat värde.
    • Noggrannhetsförbättringar för extrahering
  • Layout-extrahering Nu kan du använda layout-API:et för att extrahera textdata och tabelldata från dina formulär.

API-ändringar för anpassad modell

Alla API:er för träning och användning av anpassade modeller har bytt namn och vissa synkrona metoder är nu asynkrona. Följande är större ändringar:

  • Processen för att träna en modell är nu asynkron. Du initierar träning via API-anropet /custom/models. Det här anropet returnerar ett åtgärds-ID som du kan skicka till custom/models/{modelID} för att returnera träningsresultatet.
  • Extrahering av nycklar/värden initieras nu av API-anropet /custom/models/{modelID}/analyze. Det här anropet returnerar ett åtgärds-ID som du kan skicka till custom/models/{modelID}/analyzeResults/{resultID} för att returnera extraheringsresultatet.
  • Åtgärds-ID:erna för åtgärden Train finns nu i location-huvudet för HTTP-svar, inte i rubriken Operation-Location.

API-kvittoändringar

API:erna för att läsa försäljningskvitton har bytt namn.

  • Extrahering av kvittodata initieras nu av API-anropet /prebuilt/receipt/analyze. Det här anropet returnerar ett åtgärds-ID som du kan skicka till /prebuilt/receipt/analyzeResults/{resultID} för att returnera extraheringsresultatet.

Ändringar i utdataformat

JSON-svaren för alla API-anrop har nya format. Vissa nycklar och värden har lagts till, tagits bort eller bytt namn. Se snabbstarter för exempel på aktuella JSON-format.

Nästa steg

Slutför en snabbstart för att komma igång med att skriva en formulärbearbetningsapp Formigenkänning med valfri utvecklingsspråk.

Se även