Q: Vad är noggrannhetspoängen och hur beräknas den?

Utdata från en build anpassad modellåtgärd (v3.0 och senare versioner) eller train (v2.1) innehåller den uppskattade noggrannhetspoängen. Den här poängen representerar modellens möjlighet att korrekt förutsäga det märkta värdet i ett visuellt liknande dokument. Noggrannhet mäts inom ett procentvärdesintervall från 0 % (låg) till 100 % (hög). Mer information finns i Noggrannhets- och konfidenspoäng .

Question 1

Vad är Azure AI Document Intelligence och vad hände med Azure AI Formigenkänning?

Accepted Answer

Azure AI Document Intelligence är en molnbaserad tjänst som använder maskininlärningsmodeller för att extrahera nyckel/värde-par, text och tabeller från dina dokument. Det returnerade resultatet är en strukturerad JSON-utdata. Användningsfall för dokumentinformation omfattar automatiserad databehandling, förbättrade datadrivna strategier och utökade funktioner för dokumentsökning.

Dokumentinformation är en del av Azure AI-tjänster. Azure AI-tjänster omfattar allt som tidigare kallades Azure Cognitive Services och Azure Applied AI Services.

Det tidigare namnet på Document Intelligence var Azure AI Formigenkänning. Formigenkänning blev officiellt Dokumentinformation i juli 2023.

Det finns inga ändringar i prissättningen. Namnen Cognitive Services och Applied AI Services fortsätter att användas i Azure-fakturering, kostnadsanalys, prislistor och pris-API:er.

Det finns inga icke-bakåtkompatibla ändringar i API:er eller klientbibliotek (SDK:er). REST API:er och SDK-versioner 2024-02-29-preview, 2023-10-31-preview och senare byter document intelligencenamn på .

Vissa plattformar väntar fortfarande på uppdatering av namnbytet. I Microsoft-dokumentationen refererar alla omnämnanden av Formigenkänning och Dokumentinformation till samma Azure-tjänst.

Question 2

Hur är dokumentinformation relaterad till dokumentgenerativ AI?

Accepted Answer

Du kan använda en dokumentgenererande AI-lösning för att chatta med dina dokument, generera fängslande innehåll från dessa dokument och få åtkomst till Azure OpenAI-tjänstmodeller på dina data. Med Azure AI Document Intelligence och Azure OpenAI kombinerat kan du skapa ett företagsprogram för att smidigt interagera med dina dokument med hjälp av naturliga språk, enkelt hitta svar och få värdefulla insikter och generera nytt och engagerande innehåll från dina befintliga dokument. Mer information finns i den tekniska communitybloggen.

Question 3

Hur är dokumentinformation relaterad till hämtningsförhöjd generering?

Accepted Answer

Semantisk segmentering är ett viktigt steg i hämtningsförhöjd generering (RAG) för att säkerställa effektiv lagring och hämtning. Layoutmodellen för dokumentinformation erbjuder en omfattande lösning för funktionerna för avancerad innehållsextrahering och dokumentstrukturanalys.

Med layoutmodellen kan du enkelt extrahera text och strukturella element för att dela upp stora textkroppar i mindre, meningsfulla segment baserat på semantiskt innehåll i stället för godtyckliga delningar. Du kan sedan enkelt mata ut den extraherade informationen till Markdown-format så att du kan definiera din semantiska segmenteringsstrategi baserat på angivna byggstenar. Mer information finns i översikten över RAG i Dokumentinformation.

Question 4

Vilka användningsfall för dokumentinformation kräver särskild hänsyn?

Accepted Answer

Tänk noga på dokumentbearbetningsprojekt som omfattar finansiella data, skyddade hälsodata, personuppgifter eller mycket känsliga data.

Se till att uppfylla alla nationella/regionala och branschspecifika krav.

Question 5

Vilka språk stöder Document Intelligence?

Accepted Answer

De djupinlärningsbaserade universella modellerna i Dokumentinformation stöder många språk som kan extrahera flerspråkig text från dina bilder och dokument, inklusive textrader med blandade språk.

Språkstöd varierar beroende på funktionerna i Document Intelligence-tjänsten. En fullständig lista över den handskrivna och tryckta text som stöds av Dokumentinformation finns i Språkstöd.

Question 6

Är Dokumentinformation tillgängligt i min Azure-region?

Accepted Answer

Dokumentinformation är allmänt tillgänglig i många av de 60+ globala infrastrukturregionerna i Azure.

Välj den region som passar bäst för dig och dina kunder.

Question 7

Integrerar Dokumentinformation med andra Microsoft-tjänster?

Accepted Answer

Ja, Dokumentinformation integreras med följande tjänster:

AI Builder-arbetsflöden
Azure AI Search
Azure Functions
Azure Logic App-appar

Question 8

Hur är dokumentinformation relaterad till optisk teckenigenkänning?

Accepted Answer

Document Intelligence är en molnbaserad tjänst som innehåller optisk teckenigenkänning (OCR), textanalys och anpassad textklassificering från Azure AI-tjänster.

Dokumentinformation använder OCR för att identifiera och extrahera information från typsnitt och handskrivna textdokument som stöds av AI för att ge mer struktur och information till textextraheringen.

Question 9

Hur länge är min anpassade modell tillgänglig för användning?

Accepted Answer

En modell har samma livscykel som den API-version som du använder för att träna den. Anpassade modeller som tränats med en allmän tillgänglighetsversion av API:et har samma livscykel som API-versionen. När API-versionen är inaktuell är modellen inte längre tillgänglig för slutsatsdragning. Modeller som tränats med en förhandsversion av API:et har också samma livscykel som förhandsversions-API:et.

Förvänta dig förhandsgransknings-API-utfasning inom tre månader efter en uppdaterad förhandsversion av API-versionen eller nyare GA API-version.

Question 10

Vad är noggrannhetspoängen och hur beräknas den?

Accepted Answer

Utdata från en build anpassad modellåtgärd (v3.0 och senare versioner) eller train (v2.1) innehåller den uppskattade noggrannhetspoängen. Den här poängen representerar modellens möjlighet att korrekt förutsäga det märkta värdet i ett visuellt liknande dokument.

Noggrannhet mäts inom ett procentvärdesintervall från 0 % (låg) till 100 % (hög).

Mer information finns i Noggrannhets- och konfidenspoäng.

Noggrannhet mäts inom ett procentvärdesintervall från 0 % (låg) till 100 % (hög).

Mer information finns i Noggrannhets- och konfidenspoäng.

Question 11

Hur kan jag förbättra noggrannhetspoängen?

Accepted Answer

Avvikelser i den visuella strukturen i dina dokument kan påverka en modells noggrannhet. Här följer några tips:

Inkludera alla varianter av ett dokument i träningsdatauppsättningen. Varianter inkluderar olika format; till exempel digitala jämfört med skannade PDF-filer.
Separera visuellt distinkta dokumenttyper och träna olika modeller.
Kontrollera att du inte har överflödiga etiketter.
För signatur- och regionsetiketter ska du inte inkludera den omgivande texten.

Mer information finns i Noggrannhets- och konfidenspoäng.

Question 12

Vad är konfidenspoängen och hur beräknas den?

Accepted Answer

En konfidenspoäng anger sannolikheten genom att mäta graden av statistisk säkerhet att det extraherade resultatet identifieras korrekt.

Konfidensvärdeintervallet är en procentandel från 0 % (låg) till 100 % (hög). Det är bäst att rikta in sig på en poäng på 80 % eller högre. För känsligare fall, till exempel finansiella eller medicinska journaler, rekommenderar vi en poäng på nära 100 %. Du kan också kräva mänsklig granskning.

Mer information finns i Noggrannhets- och konfidenspoäng.

Question 13

Hur kan jag förbättra konfidenspoängen?

Accepted Answer

Efter en analysåtgärd granskar du JSON-utdata. confidence Granska värdena för varje nyckel/värde-resultat under pageResults noden. Du bör också titta på konfidenspoängen readResults i noden, vilket motsvarar textläsningsåtgärden. Läsresultatens förtroende påverkar inte konfidensen för resultatet av extrahering av nyckel/värde, så du bör kontrollera båda. Här följer några tips:

Om konfidenspoängen readResults för objektet är låg kan du förbättra kvaliteten på dina indatadokument.
Om konfidenspoängen pageResults för objektet är låg kontrollerar du att dokumenten du analyserar är av samma typ.
Överväg att införliva mänsklig granskning i dina arbetsflöden.
Använd formulär som har olika värden i varje fält.
För anpassade modeller använder du en större uppsättning träningsdokument. Om du taggar fler dokument lär du din modell att identifiera fält med större noggrannhet.

Mer information finns i Noggrannhets- och konfidenspoäng.

Question 14

Vad är en avgränsningsruta?

Accepted Answer

En avgränsningsruta (polygon i v3.0 och senare versioner) är en abstrakt rektangel som omger textelement i ett dokument eller formulär. Den används som referenspunkt för objektidentifiering.

Avgränsningsrutan anger position med hjälp av ett x- och y-koordinatplan som visas i en matris med fyra numeriska par. Varje par representerar ett hörn av rutan i följande ordning: övre vänstra, övre högra, nedre högra, nedre vänstra.

För en bild finns koordinater i bildpunkter. För en PDF är koordinaterna i tum.

Question 15

Kan dokumentinformation hjälpa mig att klassificera dokument?

Accepted Answer

Dokumentinformation tillhandahåller anpassade klassificeringsmodeller som kan analysera dokument med en fil eller flera filer för att identifiera om en indatafil innehåller någon av de tränade dokumenttyperna. Tjänsten stöder följande scenarier:

En enda fil som innehåller en dokumenttyp, till exempel ett låneformulär.
En enda fil som innehåller flera dokument. Ett exempel är ett låneprogrampaket som innehåller ett låneformulär, ett lönebesked och ett bankutdrag.
En enda fil som innehåller flera instanser av samma dokument. Ett exempel är en samling skannade fakturor.

Mer information finns i översikten över anpassade klassificeringsmodeller.

Question 16

Vilka är utvecklingsalternativen för Dokumentinformation?

Accepted Answer

Document Intelligence erbjuder de senaste utvecklingsalternativen på följande plattformar:

Question 17

Var hittar jag den API-version som stöds för de senaste SDK:erna för programmeringsspråk?

Accepted Answer

Den här tabellen innehåller länkar till de senaste SDK-versionerna och visar relationen mellan Document Intelligence SDK och API-versioner som stöds:

Språkreferens för Azure SDK som stöds	API-versioner som stöds
• C#/.NET: 4.0.0 • Java: 4.0.0 • JavaScript: 4.0.0 • Python 3.2.0	2023-10-31-preview v3.0 v2.1 v2.0

Mer information finns i Klienter som stöds för v4.0 och klienter som stöds för v3.1.

Question 18

Vad är skillnaden mellan Document Intelligence v3.0 och v2.1 och hur migrerar jag till den senaste versionen?

Accepted Answer

För bättre användbarhet introducerar Document Intelligence v3.0 ett fullständigt omdesignat klientbibliotek. Om du vill använda de senaste funktionerna i API:et för dokumentinformation behöver du den senaste SDK:n och programkoden måste uppdateras för att kunna använda de nya klienterna.

Den här tabellen innehåller länkar till detaljerade instruktioner för migrering till den senaste versionen av Dokumentinformation:

Språk/API	Migreringsguide
REST-API	v3
C#/.NET	4.0.0
Java	4.0.0
JavaScript	4.0.0
Python	3.2.0

Question 19

Vilka filformat stöder Document Intelligence? Finns det storleksbegränsningar för indatadokument?

Accepted Answer

Information om hur du får bästa resultat finns i indatakraven.

Question 20

Hur kan jag ange ett intervall med sidor som ska analyseras i ett dokument?

Accepted Answer

Använd parametern pages (stöds i v2.1, v3.0 och senare versioner av REST-API:et) för att ange sidor för PDF- och TIFF-dokument med flera sidor. Godkända indata innehåller följande intervall:

Enkla sidor. Om du till exempel anger 1, 2bearbetas sidorna 1 och 2.
Ändliga intervall. Om du till exempel anger 2-5bearbetas sidorna 2 till 5.
Intervall med öppen slutpunkt. Om du till exempel anger 5-bearbetas alla sidor från sidan 5. Om du anger -10bearbetas sidorna 1 till 10.

Du kan blanda dessa parametrar och intervall kan överlappa varandra. Om du till exempel anger -5, 1, 3, 5-10bearbetas sidorna 1 till 10.

Tjänsten godkänner begäran om den kan bearbeta minst en sida i dokumentet. Att till exempel använda 5-100 på ett femsidigt dokument är en giltig indata som innebär att sidan 5 bearbetas.

Om du inte anger något sidintervall bearbetas hela dokumentet.

Question 21

Både Document Intelligence Studio och FOTT Sample Labeling-verktyget är tillgängliga. Vilken ska jag använda?

Accepted Answer

För det mesta rekommenderar vi Document Intelligence Studio eftersom det kan minska din tid för att konfigurera dokumentinformationsresurser och lagringstjänster.

Överväg att använda FOTT (Form OCR Testing Tool) för följande scenarier:

Dina data måste finnas kvar på en enda dator. Använd FOTT-exempeletikettverktyget och en dokumentinformationscontainer.
Ditt projekt är starkt beroende av Document Intelligence v2.1 och du vill fortsätta använda v2.1-API:erna.

Question 22

Hur beräknar Azure priset för att använda Dokumentinformation?

Accepted Answer

Fakturering av dokumentinformation beräknas varje månad baserat på modelltypen och antalet sidor som analyseras. Här följer några detaljer:

När du skickar ett dokument för analys analyserar tjänsten alla sidor såvida du inte anger ett sidintervall med hjälp av parametern pages i din begäran. När tjänsten analyserar Microsoft Excel- och PowerPoint-dokument via läs-, OCR- eller layoutmodellen räknas varje Excel-kalkylblad och PowerPoint-bild som en sida.
När tjänsten analyserar PDF- och TIFF-filer räknas varje sida i PDF-filen eller varje bild i TIFF-filen som en sida utan maximala teckengränser.
När tjänsten analyserar Microsoft Word- och HTML-filer som läs- och layoutmodellerna stöder räknar den sidor i block med 3 000 tecken vardera. Om dokumentet till exempel innehåller 7 000 tecken blir de två sidorna med 3 000 tecken vardera och en sida med 1 000 tecken upp till totalt tre sidor.
När du använder läs- eller layoutmodellen för att analysera Microsoft Word-, Excel-, PowerPoint- och HTML-filer stöds inte inbäddade eller länkade bilder. Så tjänsten räknar dem inte som tillagda bilder.
Det är alltid kostnadsfritt att träna en anpassad modell med Dokumentinformation. Du debiteras bara när tjänsten använder en modell för att analysera ett dokument.
Containerpriser är desamma som prissättningen för molntjänster.
Document Intelligence erbjuder en kostnadsfri nivå (F0) där du kan testa alla funktioner för dokumentinformation.
Document Intelligence har en åtagandebaserad prismodell för stora arbetsbelastningar.

Läs mer om prisalternativ för Azure AI Document Intelligence.

Question 23

Hur kan jag kontrollera min användning av dokumentinformation och beräkna priset?

Accepted Answer

Du hittar användningsstatistik på instrumentpanelen för mått i Azure-portalen. Instrumentpanelen visar antalet sidor som Azure AI Document Intelligence bearbetar. Du kan kontrollera den uppskattade kostnaden för resursen med hjälp av Priskalkylatorn för Azure. Detaljerade anvisningar finns i Kontrollera användning och beräkna kostnader.

Question 24

Vilka är metodtipsen för att minska begränsningen?

Accepted Answer

Dokumentinformation använder automatisk skalning för att tillhandahålla nödvändiga beräkningsresurser på begäran, samtidigt som kundkostnaderna hålls låga. För att minska begränsningen under autoskalning rekommenderar vi följande metod:

Implementera logik för omprövning i ditt program.
Om du upptäcker att du begränsas av antalet POST begäranden kan du överväga att lägga till en fördröjning mellan begäranden.
Öka arbetsbelastningen gradvis. Undvik skarpa ändringar.
Skapa en supportbegäran för att öka gränsen för transaktioner per sekund (TPS).

Läs mer om kvoter och gränser för Document Intelligence-tjänsten.

Question 25

Hur lång tid tar det att analysera ett dokument?

Accepted Answer

Tiden för att analysera ett dokument beror på storleken (till exempel antalet sidor) och associerat innehåll på varje sida.

Dokumentinformation är en tjänst med flera klientorganisationer där svarstiden för liknande dokument är jämförbar men inte alltid identisk. Svarstiden är den tid det tar för en API-server att hantera och bearbeta en inkommande begäran och leverera det utgående svaret till klienten. Enstaka variationer i svarstid och prestanda är en naturlig del av alla mikrotjänstbaserade, tillståndslösa, asynkrona tjänster som bearbetar bilder och stora dokument i stor skala.

Även om vi kontinuerligt skalar upp maskinvaru- och kapacitets- och skalningsfunktionerna kan du fortfarande ha problem med svarstiden vid körning.

Question 26

Hur gör jag för att sammanställa de bästa träningsdata?

Accepted Answer

När du använder den anpassade modellen För dokumentinformation anger du dina egna träningsdata. Här följer några tips som hjälper dig att träna dina modeller effektivt:

Använd textbaserade i stället för bildbaserade PDF-filer när det är möjligt. Ett sätt att identifiera en bildbaserad PDF är att prova att välja specifik text i dokumentet. Om du bara kan välja hela bilden av texten är dokumentet bildbaserat, inte textbaserat.
Organisera dina träningsdokument med hjälp av en undermapp för varje format (JPEG/JPG, PNG, BMP, PDF eller TIFF).
Använd formulär som har alla tillgängliga fält slutförda.
Använd formulär med olika värden i varje fält.
Om dina bilder är av låg kvalitet använder du en större datamängd (mer än fem träningsdokument).

Läs mer om att skapa en träningsdatauppsättning.

Question 27

Vilka är metodtipsen för att träna en mycket exakt anpassad modell?

Accepted Answer

Noggrannhetsnivån för din modell beror på kvaliteten på ditt träningsmaterial. Här följer några tips:

Kontrollera om du behöver använda en enskild modell eller flera modeller som består av en enda modell.
Modellens noggrannhet kan minska när du har olika format som analyserats med en enda modell. Planera segmenteringen av datamängden i mappar, där varje mapp är en unik mall. Träna en modell per mapp och skriv de resulterande modellerna till en enda slutpunkt.
Anpassade formulär förlitar sig på en konsekvent visuell mall. Om formuläret har variationer med format och sidbrytningar bör du överväga att segmentera datamängden för att träna flera modeller.
Se till att du har en balanserad datauppsättning genom att redovisa format, dokumenttyper och struktur.

Läs mer om sammansatta modeller.

Question 28

Kan jag träna om en anpassad modell?

Accepted Answer

Dokumentinformation har ingen explicit omträningsåtgärd. Varje tågåtgärd genererar en ny modell.

Om du upptäcker att din modell behöver tränas om lägger du till fler exempel i din träningsdatauppsättning och tränar en ny modell.

Question 29

Hur många anpassade modeller kan jag skapa i en enda anpassad modell?

Accepted Answer

Med åtgärden Model Compose kan du tilldela upp till 200 modeller till ett enda modell-ID. När du gör Analyze Document begäran med ett sammansatt modell-ID klassificerar Dokumentinformation det inskickade formuläret, väljer den bästa modellen och returnerar resultatet. Model Compose är för närvarande endast tillgängligt för anpassade modeller som tränats med etiketter.

Att analysera ett dokument med hjälp av sammansatta modeller är identiskt med att analysera ett dokument med hjälp av en enda modell. Resultatet Analyze Document returnerar en docType egenskap som anger vilken av de komponentmodeller som du valde för att analysera dokumentet. Det finns ingen ändring i prissättningen för att analysera ett dokument med hjälp av en enskild anpassad modell eller en sammansatt anpassad modell.

Läs mer om sammansatta modeller.

Question 30

Om antalet modeller som jag vill skapa överskrider den övre gränsen för en sammansatt modell, vilka är alternativen?

Accepted Answer

Du kan använda något av följande alternativ:

Klassificera dokumenten innan du anropar den anpassade modellen. Du kan använda läsmodellen och skapa en klassificering baserat på den extraherade texten från dokumenten och vissa fraser med hjälp av källor som kod, reguljära uttryck eller sökning.
Om du vill extrahera samma fält från olika strukturerade, halvstrukturerade och ostrukturerade dokument bör du överväga att använda den anpassade neurala modellen för djupinlärning. Läs mer om skillnaderna mellan den anpassade mallmodellen och den anpassade neurala modellen.

Question 31

Hur gör jag för att förfina en modell utöver den inledande träningen?

Accepted Answer

Varje träningsåtgärd genererar en ny modell.

Skapa en datauppsättning för den nya mallen.
Märk och träna en ny modell.
Kontrollera att den nya modellen fungerar bra för dina specifika dokumenttyper.
Skapa din nya modell med den befintliga modellen till en enda slutpunkt. Dokumentinformation kan sedan fastställa den bästa modellen för varje dokument som ska analyseras.

Läs mer om sammansatta modeller.

Question 32

Jag skapar en anpassad modell. Vad returnerar signaturidentifieringsetiketten?

Accepted Answer

Signaturidentifiering söker efter förekomsten av en signatur, inte identiteten för den person som signerar dokumentet.

Om modellen returnerar osignerad för signaturidentifiering hittade modellen ingen signatur i det definierade fältet.

Question 33

Vad bör jag tänka på och vilka är de bästa metoderna för att extrahera tabeller från dokument?

Accepted Answer

Du kan börja med layoutmodellen dokumentinformation för att extrahera texter, tabeller, urvalsmarkeringar och strukturinformation från dokument och bilder. Du kan också tänka på följande faktorer:

Är de data som du vill extrahera presenterade som en tabell och är tabellstrukturen meningsfull?
Kan data få plats i ett tvådimensionellt rutnät om data inte är i tabellformat?
Sträcker sig tabellerna över flera sidor? Om så är fallet, för att undvika att behöva märka alla sidor, delar du upp PDF-filen i sidor innan du skickar den till Dokumentinformation. Efter analysen bearbetar du sidorna till en enda tabell.
Om du skapar anpassade modeller kan du läsa Etikettering som tabeller. Dynamiska tabeller har ett variabelt antal rader för varje kolumn. Fasta tabeller har ett konstant antal rader för varje kolumn.

Question 34

Hur kan jag flytta mina tränade modeller från en miljö (till exempel beta) till en annan (till exempel produktion)?

Accepted Answer

Du kan använda API:et Kopiera för att kopiera anpassade modeller från ett dokumentinformationskonto till andra som finns i valfri geografisk region som stöds. Detaljerade instruktioner finns i Haveriberedskap.

Kopieringsåtgärden är begränsad till att kopiera modeller i den specifika molnmiljö där du har tränat modellen. Till exempel stöds inte kopiering av modeller från det offentliga molnet till Azure Government-molnet.

Question 35

Varför debiterades jag för layout när jag körde anpassad utbildning?

Accepted Answer

Layout krävs för att generera etiketter för din datauppsättning. Om den datauppsättning som du använder för anpassad träning inte har etikettfiler tillgängliga genererar tjänsten dem åt dig.

Question 36

Jag kunde komma åt mitt lagringskonto för några dagar sedan. Varför har jag nu problem med att återansluta?

Accepted Answer

När du skapar en signatur för delad åtkomst är standardvaraktigheten 48 timmar. Efter 48 timmar måste du skapa en ny token.

Överväg att ange en längre varaktighetsperiod för den tid som du använder ditt lagringskonto med Dokumentinformation.

Question 37

Hur ger jag dokumentinformation åtkomst till data om mitt lagringskonto finns bakom ett virtuellt nätverk eller en brandvägg?

Accepted Answer

Om du har ett Azure Storage-konto som skyddas av ett virtuellt nätverk eller en brandvägg kan dokumentinformation inte komma åt ditt lagringskonto direkt. Åtkomst och autentisering för privata Azure Storage-konton stöder dock hanterade identiteter för Azure-resurser. När du använder en hanterad identitet kan document intelligence-tjänsten komma åt ditt lagringskonto med hjälp av en tilldelad autentiseringsuppgift.

Om du tänker analysera dina privata lagringskontodata med hjälp av FOTT måste du distribuera verktyget bakom det virtuella nätverket eller brandväggen.

Lär dig hur du skapar och använder en hanterad identitet för din dokumentinformationsresurs.

Om du tänker analysera dina privata lagringskontodata med hjälp av FOTT måste du distribuera verktyget bakom det virtuella nätverket eller brandväggen.

Lär dig hur du skapar och använder en hanterad identitet för din dokumentinformationsresurs.

Question 38

Vilka behörigheter behöver jag för att få åtkomst till Document Intelligence Studio?

Accepted Answer

Du behöver ett aktivt Azure-konto och en prenumeration med minst en läsarroll för att få åtkomst till Document Intelligence Studio.

Här är rollkraven för användarscenarier för dokumentanalys och fördefinierade modeller:

Grundläggande
- Cognitive Services-användare: Du behöver den här rollen för en dokumentintelligens eller azure cognitive services-resurs med flera tjänster för att kunna använda Document Intelligence Studio.
Avancerad
- Deltagare: Du behöver den här rollen för att skapa en resursgrupp eller en dokumentinformationsresurs. Deltagarrollen tillåter inte att du listar nycklar för Cognitive Services. Om du vill använda Document Intelligence Studio behöver du fortfarande rollen Cognitive Services-användare.

Här är rollkraven för användarscenarier för anpassade modellprojekt:

Grundläggande
- Cognitive Services-användare: Du behöver den här rollen för en dokumentintelligens eller cognitive services-resurs med flera tjänster för att träna en anpassad modell eller analysera med tränade modeller.
- Storage Blob Data-deltagare: Du behöver den här rollen för ett lagringskonto för att skapa projekt- och etikettdata.
Avancerad
- Lagringskontodeltagare: Du behöver den här rollen för lagringskontot för att konfigurera CORS-inställningar (cross-origin resource sharing). Det är en engångsinsats om du återanvänder samma lagringskonto.
  
  Deltagarrollen tillåter inte åtkomst till data i din blob. Om du vill använda Document Intelligence Studio behöver du fortfarande rollen Storage Blob Data-deltagare.
- Deltagare: Du behöver den här rollen för att skapa en resursgrupp och resurser. Deltagarrollen ger dig inte åtkomst till att använda de skapade resurserna eller lagringen. Om du vill använda Document Intelligence Studio behöver du fortfarande grundläggande roller.

Mer information finns i Inbyggda Microsoft Entra-roller och avsnitten om Azure-rolltilldelningar i snabbstarten för Document Intelligence Studio.

Question 39

Jag har flera sidor i ett dokument. Varför analyseras bara två sidor i Document Intelligence Studio?

Accepted Answer

För resurser på den kostnadsfria nivån (F0) analyseras endast de två första sidorna oavsett om du använder Document Intelligence Studio, REST API eller SDK:er.

I Document Intelligence Studio väljer du knappen Inställningar (kugghjul), väljer fliken Resurser och kontrollerar prisnivån som du använder för att analysera dokumenten. Om du vill analysera alla sidor i ett dokument ändrar du till en betald resurs (S0).

Question 40

Hur kan jag ändra kataloger eller prenumerationer i Document Intelligence Studio?

Accepted Answer

Om du vill ändra en katalog i Document Intelligence Studio väljer du knappen Inställningar (kugghjul). Under Katalog väljer du katalogen i listan och väljer sedan Växla katalog. Du uppmanas att logga in igen när du har bytt katalog.

Om du vill ändra en prenumeration eller resurs går du till fliken Resurs under Inställningar.

Question 41

Varför får jag ett lagringsfel för en projektdelning, automatisk etikettering eller OCR-uppgradering när min lagringskontoresurs har konfigurerats med en brandvägg eller ett virtuellt nätverk?

Accepted Answer

Se Hanterade identiteter för Dokumentinformation för att konfigurera dina Azure-resurser.

Question 42

Varför får jag felet "Åtkomst nekad på grund av regler för virtuellt nätverk/brandvägg" på en automatisk etiketterings- eller OCR-uppgraderingsåtgärd när min Document Intelligence-resurs har konfigurerats med en brandvägg eller ett virtuellt nätverk?

Accepted Answer

Du måste lägga till den dedikerade IP-adressen 20.3.165.95 i listan över tillåtna brandväggar för dokumentinformationsresursen.

Question 43

Kan jag återanvända eller anpassa etiketteringsupplevelsen från Document Intelligence Studio och bygga in den i mitt eget program?

Accepted Answer

Ja. Etiketteringsupplevelsen från Document Intelligence Studio öppen källkod d i Toolkit-lagringsplatsen.

Question 44

Varför får jag felet "Formigenkänning hittades inte" när jag öppnade mitt anpassade projekt?

Accepted Answer

Dokumentinformationsresursen som är bunden till det här anpassade projektet har tagits bort eller flyttats till en annan resursgrupp. Det finns två sätt att lösa det här problemet:

Återskapa dokumentinformationsresursen under samma prenumeration och resursgrupp med samma namn.
Återskapa ett anpassat projekt med den migrerade dokumentinformationsresursen och ange samma lagringskonto.

Question 45

Behöver jag en Internetanslutning för att använda Dokumentinformationscontainrar?

Accepted Answer

Ja. Dokumentinformationscontainrar kräver internetanslutning för att skicka faktureringsinformation till Azure. Läs mer om Azure-containersäkerhet.

Question 46

Vad är skillnaden mellan frånkopplade och anslutna containrar?

Accepted Answer

Anslut containrar skickar faktureringsinformation till Azure med hjälp av en dokumentinformationsresurs på ditt Azure-konto. Med anslutna containrar krävs internetanslutning för att skicka faktureringsinformation till Azure.

Med frånkopplade containrar kan du använda API:er som är frånkopplade från Internet. Faktureringsinformation skickas inte via Internet. I stället debiteras du baserat på en inköpt åtagandenivå. För närvarande är frånkopplad containeranvändning tillgänglig för anpassade dokumentinformations- och fakturamodeller.

Modellfunktionerna i anslutna och frånkopplade containrar är desamma och stöds av Document Intelligence v2.1.

Question 47

Vilka data skickar anslutna containrar till molnet?

Accepted Answer

Dokumentinformationsanslutna containrar skickar faktureringsinformation till Azure med hjälp av en dokumentinformationsresurs på ditt Azure-konto. Anslut containrar skickar inte kunddata, till exempel den bild eller text som analyseras, till Microsoft.

Ett exempel på den information som anslutna containrar skickar till Microsoft för fakturering finns i Vanliga frågor och svar om Azure AI-container.

Question 48

Varför får jag felet "Containern är inte i ett giltigt tillstånd. Prenumerationsverifieringen misslyckades med statusen "OutOfQuota"-API-nyckeln är slut på kvoten?

Accepted Answer

Dokumentinformationsanslutna containrar skickar faktureringsinformation till Azure med hjälp av en dokumentinformationsresurs på ditt Azure-konto. Du kan få det här meddelandet om containrarna inte kan kommunicera med faktureringsslutpunkten.

Question 49

Kan jag använda lokal lagring för FOTT-containern (Document Intelligence Sample Labeling Tool) ?

Accepted Answer

FOTT har en version som använder lokal lagring. Versionen måste installeras på en Windows-dator. Du kan installera den från den här platsen.

På projektsidan anger du etikettmappens URI som /shared eller /shared/sub-dir om etiketteringsfilerna finns i en underkatalog. Alla andra beteenden för exempeletiketteringsverktyget för dokumentinformation är samma som den värdbaserade tjänsten.

Question 50

Vad är den bästa metoden för att skala upp?

Accepted Answer

För asynkrona anrop kan du köra flera containrar med delad lagring. Containern som bearbetar analysanropet POST lagrar utdata i lagringen. Sedan kan alla andra containrar hämta resultatet från lagringen och hantera anropen GET . Begärande-ID:t är inte kopplat till en container.

För synkrona anrop kan du köra flera containrar, men bara en container hanterar en begäran. Eftersom det är ett blockerande anrop kan alla containrar från poolen hantera begäran och skicka svaret. Här är endast en container kopplad till en begäran i taget och ingen avsökning krävs.

Question 51

Hur konfigurerar jag containrar med delad lagring?

Accepted Answer

Containrarna använder Mounts:Shared egenskapen när de startas för att ange det delade lagringsutrymmet för att lagra bearbetningsfilerna. Information om hur du använder den här egenskapen finns i dokumentationen för containrar.

Question 52

Vilka är metoderna och kraven för att autentisera begäranden till Azure AI-tjänster?

Accepted Answer

Varje begäran till en Azure-tjänst måste innehålla ett autentiseringshuvud. Du kan autentisera en begäran med hjälp av flera metoder:

Question 53

Lagrar Dokumentinformation mina data?

Accepted Answer

För alla funktioner lagrar Document Intelligence tillfälligt data och resultat i Azure Storage i samma region som begäran. Dina data tas sedan bort inom 24 timmar från den tidpunkt då du skickar en analysbegäran.

Läs mer om data, sekretess och säkerhet för dokumentinformation.

Question 54

Hur lagras och används mina tränade anpassade modeller i Dokumentinformation?

Accepted Answer

Mellanliggande utdata efter analys och etikettering lagras på samma Azure Storage-plats där du lagrar dina träningsdata. De tränade anpassade modellerna lagras i Azure Storage i samma region och de är logiskt isolerade med din Azure-prenumeration och DINA API-autentiseringsuppgifter.

Question 55

Var hittar jag fler lösningar på mina Azure AI Document Intelligence-frågor?

Accepted Answer

Microsoft Q&A är hem för tekniska frågor och svar på Microsoft. Du kan filtrera frågor som är specifika för dokumentinformation.

Question 56

Vad ska jag göra om tjänsten inte känner igen specifik text eller identifierar den felaktigt när jag etiketterar dokument?

Accepted Answer

Vi uppdaterar och förbättrar kontinuerligt OCR-modellen för dokumentinformation. Du kan skicka ett e-postmeddelande till dokumentinformationsteamet. Om möjligt kan du dela ett exempeldokument med problemet markerat.

Vanliga frågor och svar om Azure AI Document Intelligence

Allmänna begrepp

Vad är Azure AI Document Intelligence och vad hände med Azure AI Formigenkänning?

Hur är dokumentinformation relaterad till dokumentgenerativ AI?

Hur är dokumentinformation relaterad till hämtningsförhöjd generering?

Vilka användningsfall för dokumentinformation kräver särskild hänsyn?

Vilka språk stöder Document Intelligence?

Är Dokumentinformation tillgängligt i min Azure-region?

Integrerar Dokumentinformation med andra Microsoft-tjänster?

Hur är dokumentinformation relaterad till optisk teckenigenkänning?

Hur länge är min anpassade modell tillgänglig för användning?

Vad är noggrannhetspoängen och hur beräknas den?

Hur kan jag förbättra noggrannhetspoängen?

Vad är konfidenspoängen och hur beräknas den?

Hur kan jag förbättra konfidenspoängen?

Vad är en avgränsningsruta?

Kan dokumentinformation hjälpa mig att klassificera dokument?

Apputveckling

Vilka är utvecklingsalternativen för Dokumentinformation?

Var hittar jag den API-version som stöds för de senaste SDK:erna för programmeringsspråk?

Vad är skillnaden mellan Document Intelligence v3.0 och v2.1 och hur migrerar jag till den senaste versionen?

Vilka filformat stöder Document Intelligence? Finns det storleksbegränsningar för indatadokument?

Hur kan jag ange ett intervall med sidor som ska analyseras i ett dokument?

Både Document Intelligence Studio och FOTT Sample Labeling-verktyget är tillgängliga. Vilken ska jag använda?

Tjänstbegränsningar och priser

Hur beräknar Azure priset för att använda Dokumentinformation?

Hur kan jag kontrollera min användning av dokumentinformation och beräkna priset?

Vilka är metodtipsen för att minska begränsningen?

Hur lång tid tar det att analysera ett dokument?

Anpassade modeller

Hur gör jag för att sammanställa de bästa träningsdata?

Vilka är metodtipsen för att träna en mycket exakt anpassad modell?

Kan jag träna om en anpassad modell?

Hur många anpassade modeller kan jag skapa i en enda anpassad modell?

Om antalet modeller som jag vill skapa överskrider den övre gränsen för en sammansatt modell, vilka är alternativen?

Hur gör jag för att förfina en modell utöver den inledande träningen?

Jag skapar en anpassad modell. Vad returnerar signaturidentifieringsetiketten?

Vad bör jag tänka på och vilka är de bästa metoderna för att extrahera tabeller från dokument?

Hur kan jag flytta mina tränade modeller från en miljö (till exempel beta) till en annan (till exempel produktion)?

Varför debiterades jag för layout när jag körde anpassad utbildning?

Lagringskonto

Jag kunde komma åt mitt lagringskonto för några dagar sedan. Varför har jag nu problem med att återansluta?

Hur ger jag dokumentinformation åtkomst till data om mitt lagringskonto finns bakom ett virtuellt nätverk eller en brandvägg?

Document Intelligence Studio

Vilka behörigheter behöver jag för att få åtkomst till Document Intelligence Studio?

Jag har flera sidor i ett dokument. Varför analyseras bara två sidor i Document Intelligence Studio?

Hur kan jag ändra kataloger eller prenumerationer i Document Intelligence Studio?

Varför får jag ett lagringsfel för en projektdelning, automatisk etikettering eller OCR-uppgradering när min lagringskontoresurs har konfigurerats med en brandvägg eller ett virtuellt nätverk?

Varför får jag felet "Åtkomst nekad på grund av regler för virtuellt nätverk/brandvägg" på en automatisk etiketterings- eller OCR-uppgraderingsåtgärd när min Document Intelligence-resurs har konfigurerats med en brandvägg eller ett virtuellt nätverk?

Kan jag återanvända eller anpassa etiketteringsupplevelsen från Document Intelligence Studio och bygga in den i mitt eget program?

Varför får jag felet "Formigenkänning hittades inte" när jag öppnade mitt anpassade projekt?

Containers

Behöver jag en Internetanslutning för att använda Dokumentinformationscontainrar?

Vad är skillnaden mellan frånkopplade och anslutna containrar?

Vilka data skickar anslutna containrar till molnet?

Varför får jag felet "Containern är inte i ett giltigt tillstånd. Prenumerationsverifieringen misslyckades med statusen "OutOfQuota"-API-nyckeln är slut på kvoten?

Kan jag använda lokal lagring för FOTT-containern (Document Intelligence Sample Labeling Tool) ?

Vad är den bästa metoden för att skala upp?

Hur konfigurerar jag containrar med delad lagring?

Säkerhet och sekretess

Vilka är metoderna och kraven för att autentisera begäranden till Azure AI-tjänster?

Lagrar Dokumentinformation mina data?

Hur lagras och används mina tränade anpassade modeller i Dokumentinformation?

Mer hjälp och support

Var hittar jag fler lösningar på mina Azure AI Document Intelligence-frågor?

Vad ska jag göra om tjänsten inte känner igen specifik text eller identifierar den felaktigt när jag etiketterar dokument?

Feedback

Ytterligare resurser