Mi a Form Recognizer?What is Form Recognizer?

Fontos

A TLS 1,2 mostantól a szolgáltatáshoz tartozó összes HTTP-kérelem esetében érvénybe lép.TLS 1.2 is now enforced for all HTTP requests to this service. További információ: Azure Cognitive Services Security.For more information, see Azure Cognitive Services security.

Az Azure Form felismerő egy olyan kognitív szolgáltatás, amely gépi tanulási technológiával azonosítja és Kinyeri a szöveges, kulcs/érték párokat és a táblák adatait az űrlap dokumentumaiból.Azure Form Recognizer is a cognitive service that uses machine learning technology to identify and extract text, key/value pairs and table data from form documents. Betölti a szöveget az űrlapokból, és olyan strukturált adatokat ad eredményül, amelyek tartalmazzák az eredeti fájl kapcsolatait.It ingests text from forms and outputs structured data that includes the relationships in the original file. Az adott tartalomra szabott pontos eredményeket gyorsan, nehéz manuális beavatkozás vagy kiterjedt adatelemzési szakértelem nélkül érheti el.You quickly get accurate results that are tailored to your specific content without heavy manual intervention or extensive data science expertise. Az űrlap-felismerő egyéni modellből, az előre elkészített beérkezési modellből és az elrendezési API-ból áll.Form Recognizer is comprised of custom models, the prebuilt receipt model, and the layout API. Az űrlap-felismerő modelleket egy REST API használatával hívhatja meg, hogy csökkentse a bonyolultságot, és integrálja azt a munkafolyamatba vagy alkalmazásba.You can call Form Recognizer models by using a REST API to reduce complexity and integrate it into your workflow or application.

Az űrlap-felismerő a következő szolgáltatásokból áll:Form Recognizer is made up of the following services:

  • Egyéni modellek – a kulcs/érték párok és a táblák adatainak kinyerése az űrlapokból.Custom models - Extract key/value pairs and table data from forms. Ezek a modellek a saját adataival vannak betanítva, így az űrlapokra vannak szabva.These models are trained with your own data, so they're tailored to your forms.
  • Előre összevont beérkezési modell – az USA értékesítési bevételeiből származó adatok kinyerése egy előre elkészített modell használatával.Prebuilt receipt model - Extract data from USA sales receipts using a prebuilt model.
  • Elrendezési API – szöveg-és táblázatos struktúrák kinyerése a dokumentumokból a határolókeret koordinátáival együtt.Layout API - Extract text and table structures, along with their bounding box coordinates, from documents.

Egyéni modellekCustom models

Az űrlap-felismerő egyéni modelljeinek a saját adataihoz kell betanítania, és a kezdéshez csak öt minta bemeneti űrlapra van szükség.Form Recognizer custom models train to your own data, and you only need five sample input forms to start. A betanított modell olyan strukturált adatokat tud kialakítani, amelyek tartalmazzák az eredeti dokumentum kapcsolatait.A trained model can output structured data that includes the relationships in the original form document. A modell betanítása után tesztelheti és áttaníthatja, és végül a használatával megbízhatóan kinyerheti az adatokból az igényeknek megfelelő további formákat.After you train the model, you can test and retrain it and eventually use it to reliably extract data from more forms according to your needs.

Az egyéni modellek betanításakor a következő lehetőségek állnak rendelkezésére: képzés címkézett és címkézett adatbevitel nélkül.You have the following options when you train custom models: training with labeled data and without labeled data.

Betanítás címkék nélkülTrain without labels

Alapértelmezés szerint az űrlap-felismerő nem felügyelt tanulást használ az űrlapok mezőinek és bejegyzéseinek elrendezésére és kapcsolatainak megismerésére.By default, Form Recognizer uses unsupervised learning to understand the layout and relationships between fields and entries in your forms. Ha beküldi a bemeneti űrlapokat, az algoritmus a következő típus szerint állítja be az űrlapokat, felfedi a kulcsokat és táblákat, és értékeket társít a kulcsokhoz és bejegyzésekhez a táblákhoz.When you submit your input forms, the algorithm clusters the forms by type, discovers what keys and tables are present, and associates values to keys and entries to tables. Ehhez nincs szükség kézi adatcímkézésre vagy intenzív kódolásra és karbantartásra, és azt javasoljuk, hogy először próbálja meg ezt a módszert.This doesn't require manual data labeling or intensive coding and maintenance, and we recommend you try this method first.

Tanítás címkékkelTrain with labels

Ha címkével ellátott adatokkal látja el a képzést, a modell felügyeli a tanulást, hogy az Ön által megadott címkézett űrlapok használatával kinyerje a kívánt értékeket.When you train with labeled data, the model does supervised learning to extract values of interest, using the labeled forms you provide. Ez jobb teljesítményű modelleket eredményez, és olyan modelleket hozhat létre, amelyek olyan összetett űrlapokkal vagy űrlapokkal működnek, amelyek kulcsok nélkül tartalmaznak értékeket.This results in better-performing models and can produce models that work with complex forms or forms containing values without keys.

Az űrlap-felismerő az elrendezési API segítségével tanulja meg a nyomtatott és a kézírásos szöveges elemek várt méretét és pozícióit.Form Recognizer uses the Layout API to learn the expected sizes and positions of printed and handwritten text elements. Ezután a felhasználó által megadott címkéket használja a dokumentumok kulcs/érték társításának megismeréséhez.Then it uses user-specified labels to learn the key/value associations in the documents. Azt javasoljuk, hogy az új modell betanítása és a modell pontosságának javítása érdekében a típus öt kézzel címkézett formáját használja az első lépésekhez.We recommend that you use five manually labeled forms of the same type to get started when training a new model and add more labeled data as needed to improve the model accuracy.

Előre elkészített bevételezési modellPrebuilt receipt model

Az űrlap-felismerő olyan modellt is tartalmaz, amely a Egyesült Államok — az éttermek, a benzinkutak, a kiskereskedelmi és így tovább (minta) által használt típusokból olvassa be az angol nyelvű értékesítési nyugtákat.Form Recognizer also includes a model for reading English sales receipts from the United States—the type used by restaurants, gas stations, retail, and so on (sample receipt). Ez a modell kigyűjti a legfontosabb adatokat, például a tranzakció dátumát és időpontját, a kereskedelmi adatokat, az adókat és az összegeket, valamint egyebeket.This model extracts key information such as the time and date of the transaction, merchant information, amounts of taxes and totals and more. Emellett az előre elkészített beérkezési modell a nyugtán lévő összes szöveg felismerésére és visszaadására van betanítva.In addition, the prebuilt receipt model is trained to recognize and return all of the text on a receipt.

Elrendezési APILayout API

Az űrlap-felismerő a szöveg és a tábla szerkezetét is kinyerheti (a szöveghez társított sorok és oszlopok száma) a nagy felbontású optikai karakterfelismerés (OCR) használatával.Form Recognizer can also extract text and table structure (the row and column numbers associated with the text) using high-definition optical character recognition (OCR).

BevezetésGet started

Egy rövid útmutató segítségével megkezdheti az űrlapok adatainak kinyerését.Follow a quickstart to get started extracting data from your forms. Javasoljuk, hogy az ingyenes szolgáltatást használja a technológia megismerése során.We recommend that you use the free service when you're learning the technology. Ne feledje, hogy a szabad lapok száma legfeljebb 500 havonta.Remember that the number of free pages is limited to 500 per month.

A REST API-k áttekintéseReview the REST APIs

A következő API-kat fogja használni a modellek betanításához és a strukturált adatok űrlapokból való kinyeréséhez.You'll use the following APIs to train models and extract structured data from forms.

NévName LeírásDescription
Egyéni modell betanításaTrain Custom Model Egy új modell betanításával elemezheti az űrlapokat öt azonos típusú űrlap használatával.Train a new model to analyze your forms by using five forms of the same type. A useLabelFile paramétert beállíthatja úgy, hogy a true manuálisan címkézett adatként legyen betanítva.Set the useLabelFile parameter to true to train with manually labeled data.
Űrlap elemzéseAnalyze Form Egyetlen dokumentum elemzése, amely streamként lett átadva szöveg-, kulcs/érték párok és táblák kinyeréséhez az űrlapról az egyéni modellel.Analyze a single document passed in as a stream to extract text, key/value pairs and tables from the form with your custom model.
Visszaigazolás elemzéseAnalyze Receipt Egyetlen bevételezési dokumentum elemzése a legfontosabb információk és a többi bevételezési szöveg kinyeréséhez.Analyze a single receipt document to extract key information and other receipt text.
Elrendezés elemzéseAnalyze Layout Egy űrlap elrendezésének elemzése szöveg és tábla szerkezetének kinyeréséhez.Analyze the layout of a form to extract text and table structure.

További információért olvassa el a REST API dokumentációját .Explore the REST API reference documentation to learn more. Ha már ismeri az API korábbi verzióját, tekintse meg a újdonságokról szóló cikket a legutóbbi változások megismeréséhez.If you're familiar with a previous version of the API, see the What's new article to learn about recent changes.

Bemeneti követelményekInput requirements

Egyéni modellCustom model

Az űrlap-felismerő a következő követelményeknek megfelelő bemeneti dokumentumokon működik:Form Recognizer works on input documents that meet these requirements:

  • A formátumnak JPG, PNG, PDF (Text vagy beolvasott) vagy TIFF formátumúnak kell lennie.Format must be JPG, PNG, PDF (text or scanned), or TIFF. A Text-Embedded PDF-fájlok a legjobbak, mert nem lehetséges a hibák kinyerése és helye.Text-embedded PDFs are best because there's no possibility of error in character extraction and location.
  • Ha a PDF-fájlok jelszóval vannak zárolva, a küldés előtt el kell távolítania a zárolást.If your PDFs are password-locked, you must remove the lock before submitting them.
  • A PDF-és a TIFF-dokumentumnak 200 vagy annál kisebbnek kell lennie, és a betanítási adatkészlet teljes méretének 500 vagy annál kisebbnek kell lennie.PDF and TIFF documents must be 200 pages or less, and the total size of the training data set must be 500 pages or less.
  • Képek esetén a méretek 600 x 100 képpont és 4200 x 4200 képpont közé kell, hogy legyenek.For images, dimensions must be between 600 x 100 pixels and 4200 x 4200 pixels.
  • Ha papíralapú dokumentumokból olvas be dokumentumokat, az űrlapoknak kiváló minőségű vizsgálatokat kell ellátniuk.If scanned from paper documents, forms should be high-quality scans.
  • A szövegnek a latin ábécét (angol karakter) kell használnia.Text must use the Latin alphabet (English characters).
  • A nem felügyelt tanulás (címkézett adatok nélkül) esetében az adatoknak kulcsokat és értékeket kell tartalmazniuk.For unsupervised learning (without labeled data), data must contain keys and values.
  • A nem felügyelt tanulás (címkézett adatok nélkül) esetében a kulcsoknak az értékek felett vagy balra kell megjelenniük; nem jelennek meg a jobb oldalon.For unsupervised learning (without labeled data), keys must appear above or to the left of the values; they can't appear below or to the right.

Az űrlap-felismerő jelenleg nem támogatja az ilyen típusú bemeneti adatokat:Form Recognizer doesn't currently support these types of input data:

  • Összetett táblák (beágyazott táblák, egyesített fejlécek vagy cellák stb.).Complex tables (nested tables, merged headers or cells, and so on).
  • Jelölőnégyzetek és választógombok.Checkboxes or radio buttons.

Előre elkészített bevételezési modellPrebuilt receipt model

A beérkezési modellhez tartozó bemeneti követelmények némileg eltérőek.The input requirements for the receipt model are slightly different.

  • A formátumnak JPEG, PNG, PDF (Text vagy beszkennelt) vagy TIFF formátumúnak kell lennie.Format must be JPEG, PNG, PDF (text or scanned) or TIFF.
  • A fájlméretnek 20 MB-nál kisebbnek kell lennie.File size must be less than 20 MB.
  • A képdimenziónak 50 x 50 képpont és 10000 x 10000 képpont közé kell esnie.Image dimensions must be between 50 x 50 pixels and 10000 x 10000 pixels.
  • A PDF-dimenzióknak legfeljebb 17 x 17 hüvelyknek kell lenniük, amely a jogi vagy az A3-as papírméretnek felel meg, és kisebb.PDF dimensions must be at most 17 x 17 inches, corresponding to Legal or A3 paper sizes and smaller.
  • A PDF és a TIFF esetében csak az első 200 oldal lesz feldolgozva (ingyenes rétegbeli előfizetéssel csak az első két oldal feldolgozása történik).For PDF and TIFF, only the first 200 pages are processed (with a free tier subscription, only the first two pages are processed).

Adatvédelem és biztonságData privacy and security

Akárcsak az összes kognitív szolgáltatás esetében, az űrlap-felismerő szolgáltatást használó fejlesztőknek ismerniük kell a Microsoft-szabályzatokat az ügyféladatok alapján.As with all the cognitive services, developers using the Form Recognizer service should be aware of Microsoft policies on customer data. További információért tekintse meg a Microsoft adatvédelmi központjának Cognitive Services lapját .See the Cognitive Services page on the Microsoft Trust Center to learn more.

Következő lépésekNext steps

Fejezze be a gyors üzembe helyezési útmutatót az űrlap-felismerő API-k használatának megkezdéséhez.Complete a quickstart to get started with the Form Recognizer APIs.