Vanliga frågor och svar om Azure AI Document Intelligence

Det här innehållet gäller för:Bockmarkeringv4.0 (förhandsversion)Bockmarkeringv3.1 (GA)Bockmarkeringv3.0 (GA)Bockmarkeringv2.1 (GA)

Allmänna begrepp

Vad är Azure AI Document Intelligence och vad hände med Azure AI Formigenkänning?

Azure AI Document Intelligence är en molnbaserad tjänst som använder maskininlärningsmodeller för att extrahera nyckel/värde-par, text och tabeller från dina dokument. Det returnerade resultatet är en strukturerad JSON-utdata. Användningsfall för dokumentinformation omfattar automatiserad databehandling, förbättrade datadrivna strategier och utökade funktioner för dokumentsökning.

Dokumentinformation är en del av Azure AI-tjänster. Azure AI-tjänster omfattar allt som tidigare kallades Azure Cognitive Services och Azure Applied AI Services.

Det tidigare namnet på Document Intelligence var Azure AI Formigenkänning. Formigenkänning blev officiellt Dokumentinformation i juli 2023.

Det finns inga ändringar i prissättningen. Namnen Cognitive Services och Applied AI Services fortsätter att användas i Azure-fakturering, kostnadsanalys, prislistor och pris-API:er.

Det finns inga icke-bakåtkompatibla ändringar i API:er eller klientbibliotek (SDK:er). REST API:er och SDK-versioner 2024-02-29-preview, 2023-10-31-preview och senare byter document intelligencenamn på .

Vissa plattformar väntar fortfarande på uppdatering av namnbytet. I Microsoft-dokumentationen refererar alla omnämnanden av Formigenkänning och Dokumentinformation till samma Azure-tjänst.

Hur är dokumentinformation relaterad till dokumentgenerativ AI?

Du kan använda en dokumentgenererande AI-lösning för att chatta med dina dokument, generera fängslande innehåll från dessa dokument och få åtkomst till Azure OpenAI-tjänstmodeller på dina data. Med Azure AI Document Intelligence och Azure OpenAI kombinerat kan du skapa ett företagsprogram för att smidigt interagera med dina dokument med hjälp av naturliga språk, enkelt hitta svar och få värdefulla insikter och generera nytt och engagerande innehåll från dina befintliga dokument. Mer information finns i den tekniska communitybloggen.

Hur är dokumentinformation relaterad till hämtningsförhöjd generering?

Semantisk segmentering är ett viktigt steg i hämtningsförhöjd generering (RAG) för att säkerställa effektiv lagring och hämtning. Layoutmodellen för dokumentinformation erbjuder en omfattande lösning för funktionerna för avancerad innehållsextrahering och dokumentstrukturanalys.

Med layoutmodellen kan du enkelt extrahera text och strukturella element för att dela upp stora textkroppar i mindre, meningsfulla segment baserat på semantiskt innehåll i stället för godtyckliga delningar. Du kan sedan enkelt mata ut den extraherade informationen till Markdown-format så att du kan definiera din semantiska segmenteringsstrategi baserat på angivna byggstenar. Mer information finns i översikten över RAG i Dokumentinformation.

Vilka användningsfall för dokumentinformation kräver särskild hänsyn?

Tänk noga på dokumentbearbetningsprojekt som omfattar finansiella data, skyddade hälsodata, personuppgifter eller mycket känsliga data.

Se till att uppfylla alla nationella/regionala och branschspecifika krav.

Vilka språk stöder Document Intelligence?

De djupinlärningsbaserade universella modellerna i Dokumentinformation stöder många språk som kan extrahera flerspråkig text från dina bilder och dokument, inklusive textrader med blandade språk.

Språkstöd varierar beroende på funktionerna i Document Intelligence-tjänsten. En fullständig lista över den handskrivna och tryckta text som stöds av Dokumentinformation finns i Språkstöd.

Är Dokumentinformation tillgängligt i min Azure-region?

Dokumentinformation är allmänt tillgänglig i många av de 60+ globala infrastrukturregionerna i Azure.

Välj den region som passar bäst för dig och dina kunder.

Integrerar Dokumentinformation med andra Microsoft-tjänster?

Ja, Dokumentinformation integreras med följande tjänster:

Hur är dokumentinformation relaterad till optisk teckenigenkänning?

Document Intelligence är en molnbaserad tjänst som innehåller optisk teckenigenkänning (OCR), textanalys och anpassad textklassificering från Azure AI-tjänster.

Dokumentinformation använder OCR för att identifiera och extrahera information från typsnitt och handskrivna textdokument som stöds av AI för att ge mer struktur och information till textextraheringen.

Hur länge är min anpassade modell tillgänglig för användning?

En modell har samma livscykel som den API-version som du använder för att träna den. Anpassade modeller som tränats med en allmän tillgänglighetsversion av API:et har samma livscykel som API-versionen. När API-versionen är inaktuell är modellen inte längre tillgänglig för slutsatsdragning. Modeller som tränats med en förhandsversion av API:et har också samma livscykel som förhandsversions-API:et.

Förvänta dig förhandsgransknings-API-utfasning inom tre månader efter en uppdaterad förhandsversion av API-versionen eller nyare GA API-version.

Vad är noggrannhetspoängen och hur beräknas den?

Utdata från en build anpassad modellåtgärd (v3.0 och senare versioner) eller train (v2.1) innehåller den uppskattade noggrannhetspoängen. Den här poängen representerar modellens möjlighet att korrekt förutsäga det märkta värdet i ett visuellt liknande dokument.

Noggrannhet mäts inom ett procentvärdesintervall från 0 % (låg) till 100 % (hög).

Mer information finns i Noggrannhets- och konfidenspoäng.

Hur kan jag förbättra noggrannhetspoängen?

Avvikelser i den visuella strukturen i dina dokument kan påverka en modells noggrannhet. Här följer några tips:

  • Inkludera alla varianter av ett dokument i träningsdatauppsättningen. Varianter inkluderar olika format; till exempel digitala jämfört med skannade PDF-filer.

  • Separera visuellt distinkta dokumenttyper och träna olika modeller.

  • Kontrollera att du inte har överflödiga etiketter.

  • För signatur- och regionsetiketter ska du inte inkludera den omgivande texten.

Mer information finns i Noggrannhets- och konfidenspoäng.

Vad är konfidenspoängen och hur beräknas den?

En konfidenspoäng anger sannolikheten genom att mäta graden av statistisk säkerhet att det extraherade resultatet identifieras korrekt.

Konfidensvärdeintervallet är en procentandel från 0 % (låg) till 100 % (hög). Det är bäst att rikta in sig på en poäng på 80 % eller högre. För känsligare fall, till exempel finansiella eller medicinska journaler, rekommenderar vi en poäng på nära 100 %. Du kan också kräva mänsklig granskning.

Mer information finns i Noggrannhets- och konfidenspoäng.

Hur kan jag förbättra konfidenspoängen?

Efter en analysåtgärd granskar du JSON-utdata. confidence Granska värdena för varje nyckel/värde-resultat under pageResults noden. Du bör också titta på konfidenspoängen readResults i noden, vilket motsvarar textläsningsåtgärden. Läsresultatens förtroende påverkar inte konfidensen för resultatet av extrahering av nyckel/värde, så du bör kontrollera båda. Här följer några tips:

  • Om konfidenspoängen readResults för objektet är låg kan du förbättra kvaliteten på dina indatadokument.

  • Om konfidenspoängen pageResults för objektet är låg kontrollerar du att dokumenten du analyserar är av samma typ.

  • Överväg att införliva mänsklig granskning i dina arbetsflöden.

  • Använd formulär som har olika värden i varje fält.

  • För anpassade modeller använder du en större uppsättning träningsdokument. Om du taggar fler dokument lär du din modell att identifiera fält med större noggrannhet.

Mer information finns i Noggrannhets- och konfidenspoäng.

Vad är en avgränsningsruta?

En avgränsningsruta (polygon i v3.0 och senare versioner) är en abstrakt rektangel som omger textelement i ett dokument eller formulär. Den används som referenspunkt för objektidentifiering.

Avgränsningsrutan anger position med hjälp av ett x- och y-koordinatplan som visas i en matris med fyra numeriska par. Varje par representerar ett hörn av rutan i följande ordning: övre vänstra, övre högra, nedre högra, nedre vänstra.

För en bild finns koordinater i bildpunkter. För en PDF är koordinaterna i tum.

Kan dokumentinformation hjälpa mig att klassificera dokument?

Dokumentinformation tillhandahåller anpassade klassificeringsmodeller som kan analysera dokument med en fil eller flera filer för att identifiera om en indatafil innehåller någon av de tränade dokumenttyperna. Tjänsten stöder följande scenarier:

  • En enda fil som innehåller en dokumenttyp, till exempel ett låneformulär.

  • En enda fil som innehåller flera dokument. Ett exempel är ett låneprogrampaket som innehåller ett låneformulär, ett lönebesked och ett bankutdrag.

  • En enda fil som innehåller flera instanser av samma dokument. Ett exempel är en samling skannade fakturor.

Mer information finns i översikten över anpassade klassificeringsmodeller.

Apputveckling

Vilka är utvecklingsalternativen för Dokumentinformation?

Document Intelligence erbjuder de senaste utvecklingsalternativen på följande plattformar:

Var hittar jag den API-version som stöds för de senaste SDK:erna för programmeringsspråk?

Den här tabellen innehåller länkar till de senaste SDK-versionerna och visar relationen mellan Document Intelligence SDK och API-versioner som stöds:

Språkreferens för Azure SDK som stöds API-versioner som stöds
• C#/.NET: 4.0.0

• Java: 4.0.0

• JavaScript: 4.0.0

• Python 3.2.0
2023-10-31-preview
v3.0 v2.1
v2.0

Mer information finns i Klienter som stöds för v4.0 och klienter som stöds för v3.1.

Vad är skillnaden mellan Document Intelligence v3.0 och v2.1 och hur migrerar jag till den senaste versionen?

För bättre användbarhet introducerar Document Intelligence v3.0 ett fullständigt omdesignat klientbibliotek. Om du vill använda de senaste funktionerna i API:et för dokumentinformation behöver du den senaste SDK:n och programkoden måste uppdateras för att kunna använda de nya klienterna.

Den här tabellen innehåller länkar till detaljerade instruktioner för migrering till den senaste versionen av Dokumentinformation:

Språk/API Migreringsguide
REST-API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Vilka filformat stöder Document Intelligence? Finns det storleksbegränsningar för indatadokument?

Information om hur du får bästa resultat finns i indatakraven.

Hur kan jag ange ett intervall med sidor som ska analyseras i ett dokument?

Använd parametern pages (stöds i v2.1, v3.0 och senare versioner av REST-API:et) för att ange sidor för PDF- och TIFF-dokument med flera sidor. Godkända indata innehåller följande intervall:

  • Enkla sidor. Om du till exempel anger 1, 2bearbetas sidorna 1 och 2.
  • Ändliga intervall. Om du till exempel anger 2-5bearbetas sidorna 2 till 5.
  • Intervall med öppen slutpunkt. Om du till exempel anger 5-bearbetas alla sidor från sidan 5. Om du anger -10bearbetas sidorna 1 till 10.

Du kan blanda dessa parametrar och intervall kan överlappa varandra. Om du till exempel anger -5, 1, 3, 5-10bearbetas sidorna 1 till 10.

Tjänsten godkänner begäran om den kan bearbeta minst en sida i dokumentet. Att till exempel använda 5-100 på ett femsidigt dokument är en giltig indata som innebär att sidan 5 bearbetas.

Om du inte anger något sidintervall bearbetas hela dokumentet.

Både Document Intelligence Studio och FOTT Sample Labeling-verktyget är tillgängliga. Vilken ska jag använda?

För det mesta rekommenderar vi Document Intelligence Studio eftersom det kan minska din tid för att konfigurera dokumentinformationsresurser och lagringstjänster.

Överväg att använda FOTT (Form OCR Testing Tool) för följande scenarier:

Tjänstbegränsningar och priser

Hur beräknar Azure priset för att använda Dokumentinformation?

Fakturering av dokumentinformation beräknas varje månad baserat på modelltypen och antalet sidor som analyseras. Här följer några detaljer:

  • När du skickar ett dokument för analys analyserar tjänsten alla sidor såvida du inte anger ett sidintervall med hjälp av parametern pages i din begäran. När tjänsten analyserar Microsoft Excel- och PowerPoint-dokument via läs-, OCR- eller layoutmodellen räknas varje Excel-kalkylblad och PowerPoint-bild som en sida.

  • När tjänsten analyserar PDF- och TIFF-filer räknas varje sida i PDF-filen eller varje bild i TIFF-filen som en sida utan maximala teckengränser.

  • När tjänsten analyserar Microsoft Word- och HTML-filer som läs- och layoutmodellerna stöder räknar den sidor i block med 3 000 tecken vardera. Om dokumentet till exempel innehåller 7 000 tecken blir de två sidorna med 3 000 tecken vardera och en sida med 1 000 tecken upp till totalt tre sidor.

  • När du använder läs- eller layoutmodellen för att analysera Microsoft Word-, Excel-, PowerPoint- och HTML-filer stöds inte inbäddade eller länkade bilder. Så tjänsten räknar dem inte som tillagda bilder.

  • Det är alltid kostnadsfritt att träna en anpassad modell med Dokumentinformation. Du debiteras bara när tjänsten använder en modell för att analysera ett dokument.

  • Containerpriser är desamma som prissättningen för molntjänster.

  • Document Intelligence erbjuder en kostnadsfri nivå (F0) där du kan testa alla funktioner för dokumentinformation.

  • Document Intelligence har en åtagandebaserad prismodell för stora arbetsbelastningar.

Läs mer om prisalternativ för Azure AI Document Intelligence.

Hur kan jag kontrollera min användning av dokumentinformation och beräkna priset?

Du hittar användningsstatistik på instrumentpanelen för mått i Azure-portalen. Instrumentpanelen visar antalet sidor som Azure AI Document Intelligence bearbetar. Du kan kontrollera den uppskattade kostnaden för resursen med hjälp av Priskalkylatorn för Azure. Detaljerade anvisningar finns i Kontrollera användning och beräkna kostnader.

Vilka är metodtipsen för att minska begränsningen?

Dokumentinformation använder automatisk skalning för att tillhandahålla nödvändiga beräkningsresurser på begäran, samtidigt som kundkostnaderna hålls låga. För att minska begränsningen under autoskalning rekommenderar vi följande metod:

  • Implementera logik för omprövning i ditt program.

  • Om du upptäcker att du begränsas av antalet POST begäranden kan du överväga att lägga till en fördröjning mellan begäranden.

  • Öka arbetsbelastningen gradvis. Undvik skarpa ändringar.

  • Skapa en supportbegäran för att öka gränsen för transaktioner per sekund (TPS).

Läs mer om kvoter och gränser för Document Intelligence-tjänsten.

Hur lång tid tar det att analysera ett dokument?

Tiden för att analysera ett dokument beror på storleken (till exempel antalet sidor) och associerat innehåll på varje sida.

Dokumentinformation är en tjänst med flera klientorganisationer där svarstiden för liknande dokument är jämförbar men inte alltid identisk. Svarstiden är den tid det tar för en API-server att hantera och bearbeta en inkommande begäran och leverera det utgående svaret till klienten. Enstaka variationer i svarstid och prestanda är en naturlig del av alla mikrotjänstbaserade, tillståndslösa, asynkrona tjänster som bearbetar bilder och stora dokument i stor skala.

Även om vi kontinuerligt skalar upp maskinvaru- och kapacitets- och skalningsfunktionerna kan du fortfarande ha problem med svarstiden vid körning.

Anpassade modeller

Hur gör jag för att sammanställa de bästa träningsdata?

När du använder den anpassade modellen För dokumentinformation anger du dina egna träningsdata. Här följer några tips som hjälper dig att träna dina modeller effektivt:

  • Använd textbaserade i stället för bildbaserade PDF-filer när det är möjligt. Ett sätt att identifiera en bildbaserad PDF är att prova att välja specifik text i dokumentet. Om du bara kan välja hela bilden av texten är dokumentet bildbaserat, inte textbaserat.

  • Organisera dina träningsdokument med hjälp av en undermapp för varje format (JPEG/JPG, PNG, BMP, PDF eller TIFF).

  • Använd formulär som har alla tillgängliga fält slutförda.

  • Använd formulär med olika värden i varje fält.

  • Om dina bilder är av låg kvalitet använder du en större datamängd (mer än fem träningsdokument).

Läs mer om att skapa en träningsdatauppsättning.

Vilka är metodtipsen för att träna en mycket exakt anpassad modell?

Noggrannhetsnivån för din modell beror på kvaliteten på ditt träningsmaterial. Här följer några tips:

  • Kontrollera om du behöver använda en enskild modell eller flera modeller som består av en enda modell.

  • Modellens noggrannhet kan minska när du har olika format som analyserats med en enda modell. Planera segmenteringen av datamängden i mappar, där varje mapp är en unik mall. Träna en modell per mapp och skriv de resulterande modellerna till en enda slutpunkt.

  • Anpassade formulär förlitar sig på en konsekvent visuell mall. Om formuläret har variationer med format och sidbrytningar bör du överväga att segmentera datamängden för att träna flera modeller.

  • Se till att du har en balanserad datauppsättning genom att redovisa format, dokumenttyper och struktur.

Läs mer om sammansatta modeller.

Kan jag träna om en anpassad modell?

Dokumentinformation har ingen explicit omträningsåtgärd. Varje tågåtgärd genererar en ny modell.

Om du upptäcker att din modell behöver tränas om lägger du till fler exempel i din träningsdatauppsättning och tränar en ny modell.

Hur många anpassade modeller kan jag skapa i en enda anpassad modell?

Med åtgärden Model Compose kan du tilldela upp till 200 modeller till ett enda modell-ID. När du gör Analyze Document begäran med ett sammansatt modell-ID klassificerar Dokumentinformation det inskickade formuläret, väljer den bästa modellen och returnerar resultatet. Model Compose är för närvarande endast tillgängligt för anpassade modeller som tränats med etiketter.

Att analysera ett dokument med hjälp av sammansatta modeller är identiskt med att analysera ett dokument med hjälp av en enda modell. Resultatet Analyze Document returnerar en docType egenskap som anger vilken av de komponentmodeller som du valde för att analysera dokumentet. Det finns ingen ändring i prissättningen för att analysera ett dokument med hjälp av en enskild anpassad modell eller en sammansatt anpassad modell.

Läs mer om sammansatta modeller.

Om antalet modeller som jag vill skapa överskrider den övre gränsen för en sammansatt modell, vilka är alternativen?

Du kan använda något av följande alternativ:

Hur gör jag för att förfina en modell utöver den inledande träningen?

Varje träningsåtgärd genererar en ny modell.

  1. Skapa en datauppsättning för den nya mallen.

  2. Märk och träna en ny modell.

  3. Kontrollera att den nya modellen fungerar bra för dina specifika dokumenttyper.

  4. Skapa din nya modell med den befintliga modellen till en enda slutpunkt. Dokumentinformation kan sedan fastställa den bästa modellen för varje dokument som ska analyseras.

Läs mer om sammansatta modeller.

Jag skapar en anpassad modell. Vad returnerar signaturidentifieringsetiketten?

Signaturidentifiering söker efter förekomsten av en signatur, inte identiteten för den person som signerar dokumentet.

Om modellen returnerar osignerad för signaturidentifiering hittade modellen ingen signatur i det definierade fältet.

Vad bör jag tänka på och vilka är de bästa metoderna för att extrahera tabeller från dokument?

Du kan börja med layoutmodellen dokumentinformation för att extrahera texter, tabeller, urvalsmarkeringar och strukturinformation från dokument och bilder. Du kan också tänka på följande faktorer:

  • Är de data som du vill extrahera presenterade som en tabell och är tabellstrukturen meningsfull?

  • Kan data få plats i ett tvådimensionellt rutnät om data inte är i tabellformat?

  • Sträcker sig tabellerna över flera sidor? Om så är fallet, för att undvika att behöva märka alla sidor, delar du upp PDF-filen i sidor innan du skickar den till Dokumentinformation. Efter analysen bearbetar du sidorna till en enda tabell.

  • Om du skapar anpassade modeller kan du läsa Etikettering som tabeller. Dynamiska tabeller har ett variabelt antal rader för varje kolumn. Fasta tabeller har ett konstant antal rader för varje kolumn.

Hur kan jag flytta mina tränade modeller från en miljö (till exempel beta) till en annan (till exempel produktion)?

Du kan använda API:et Kopiera för att kopiera anpassade modeller från ett dokumentinformationskonto till andra som finns i valfri geografisk region som stöds. Detaljerade instruktioner finns i Haveriberedskap.

Kopieringsåtgärden är begränsad till att kopiera modeller i den specifika molnmiljö där du har tränat modellen. Till exempel stöds inte kopiering av modeller från det offentliga molnet till Azure Government-molnet.

Varför debiterades jag för layout när jag körde anpassad utbildning?

Layout krävs för att generera etiketter för din datauppsättning. Om den datauppsättning som du använder för anpassad träning inte har etikettfiler tillgängliga genererar tjänsten dem åt dig.

Lagringskonto

Jag kunde komma åt mitt lagringskonto för några dagar sedan. Varför har jag nu problem med att återansluta?

När du skapar en signatur för delad åtkomst är standardvaraktigheten 48 timmar. Efter 48 timmar måste du skapa en ny token.

Överväg att ange en längre varaktighetsperiod för den tid som du använder ditt lagringskonto med Dokumentinformation.

Hur ger jag dokumentinformation åtkomst till data om mitt lagringskonto finns bakom ett virtuellt nätverk eller en brandvägg?

Om du har ett Azure Storage-konto som skyddas av ett virtuellt nätverk eller en brandvägg kan dokumentinformation inte komma åt ditt lagringskonto direkt. Åtkomst och autentisering för privata Azure Storage-konton stöder dock hanterade identiteter för Azure-resurser. När du använder en hanterad identitet kan document intelligence-tjänsten komma åt ditt lagringskonto med hjälp av en tilldelad autentiseringsuppgift.

Om du tänker analysera dina privata lagringskontodata med hjälp av FOTT måste du distribuera verktyget bakom det virtuella nätverket eller brandväggen.

Lär dig hur du skapar och använder en hanterad identitet för din dokumentinformationsresurs.

Document Intelligence Studio

Vilka behörigheter behöver jag för att få åtkomst till Document Intelligence Studio?

Du behöver ett aktivt Azure-konto och en prenumeration med minst en läsarroll för att få åtkomst till Document Intelligence Studio.

Här är rollkraven för användarscenarier för dokumentanalys och fördefinierade modeller:

  • Grundläggande

  • Avancerad

    • Deltagare: Du behöver den här rollen för att skapa en resursgrupp eller en dokumentinformationsresurs. Deltagarrollen tillåter inte att du listar nycklar för Cognitive Services. Om du vill använda Document Intelligence Studio behöver du fortfarande rollen Cognitive Services-användare.

Här är rollkraven för användarscenarier för anpassade modellprojekt:

  • Grundläggande

    • Cognitive Services-användare: Du behöver den här rollen för en dokumentintelligens eller cognitive services-resurs med flera tjänster för att träna en anpassad modell eller analysera med tränade modeller.

    • Storage Blob Data-deltagare: Du behöver den här rollen för ett lagringskonto för att skapa projekt- och etikettdata.

  • Avancerad

    • Lagringskontodeltagare: Du behöver den här rollen för lagringskontot för att konfigurera CORS-inställningar (cross-origin resource sharing). Det är en engångsinsats om du återanvänder samma lagringskonto.

      Deltagarrollen tillåter inte åtkomst till data i din blob. Om du vill använda Document Intelligence Studio behöver du fortfarande rollen Storage Blob Data-deltagare.

    • Deltagare: Du behöver den här rollen för att skapa en resursgrupp och resurser. Deltagarrollen ger dig inte åtkomst till att använda de skapade resurserna eller lagringen. Om du vill använda Document Intelligence Studio behöver du fortfarande grundläggande roller.

Mer information finns i Inbyggda Microsoft Entra-roller och avsnitten om Azure-rolltilldelningar i snabbstarten för Document Intelligence Studio.

Jag har flera sidor i ett dokument. Varför analyseras bara två sidor i Document Intelligence Studio?

För resurser på den kostnadsfria nivån (F0) analyseras endast de två första sidorna oavsett om du använder Document Intelligence Studio, REST API eller SDK:er.

I Document Intelligence Studio väljer du knappen Inställningar (kugghjul), väljer fliken Resurser och kontrollerar prisnivån som du använder för att analysera dokumenten. Om du vill analysera alla sidor i ett dokument ändrar du till en betald resurs (S0).

Hur kan jag ändra kataloger eller prenumerationer i Document Intelligence Studio?

Om du vill ändra en katalog i Document Intelligence Studio väljer du knappen Inställningar (kugghjul). Under Katalog väljer du katalogen i listan och väljer sedan Växla katalog. Du uppmanas att logga in igen när du har bytt katalog.

Om du vill ändra en prenumeration eller resurs går du till fliken Resurs under Inställningar.

Varför får jag ett lagringsfel för en projektdelning, automatisk etikettering eller OCR-uppgradering när min lagringskontoresurs har konfigurerats med en brandvägg eller ett virtuellt nätverk?

Se Hanterade identiteter för Dokumentinformation för att konfigurera dina Azure-resurser.

Varför får jag felet "Åtkomst nekad på grund av regler för virtuellt nätverk/brandvägg" på en automatisk etiketterings- eller OCR-uppgraderingsåtgärd när min Document Intelligence-resurs har konfigurerats med en brandvägg eller ett virtuellt nätverk?

Du måste lägga till den dedikerade IP-adressen 20.3.165.95 i listan över tillåtna brandväggar för dokumentinformationsresursen.

Kan jag återanvända eller anpassa etiketteringsupplevelsen från Document Intelligence Studio och bygga in den i mitt eget program?

Ja. Etiketteringsupplevelsen från Document Intelligence Studio öppen källkod d i Toolkit-lagringsplatsen.

Varför får jag felet "Formigenkänning hittades inte" när jag öppnade mitt anpassade projekt?

Dokumentinformationsresursen som är bunden till det här anpassade projektet har tagits bort eller flyttats till en annan resursgrupp. Det finns två sätt att lösa det här problemet:

  • Återskapa dokumentinformationsresursen under samma prenumeration och resursgrupp med samma namn.

  • Återskapa ett anpassat projekt med den migrerade dokumentinformationsresursen och ange samma lagringskonto.

Containers

Behöver jag en Internetanslutning för att använda Dokumentinformationscontainrar?

Ja. Dokumentinformationscontainrar kräver internetanslutning för att skicka faktureringsinformation till Azure. Läs mer om Azure-containersäkerhet.

Vad är skillnaden mellan frånkopplade och anslutna containrar?

Anslut containrar skickar faktureringsinformation till Azure med hjälp av en dokumentinformationsresurs på ditt Azure-konto. Med anslutna containrar krävs internetanslutning för att skicka faktureringsinformation till Azure.

Med frånkopplade containrar kan du använda API:er som är frånkopplade från Internet. Faktureringsinformation skickas inte via Internet. I stället debiteras du baserat på en inköpt åtagandenivå. För närvarande är frånkopplad containeranvändning tillgänglig för anpassade dokumentinformations- och fakturamodeller.

Modellfunktionerna i anslutna och frånkopplade containrar är desamma och stöds av Document Intelligence v2.1.

Vilka data skickar anslutna containrar till molnet?

Dokumentinformationsanslutna containrar skickar faktureringsinformation till Azure med hjälp av en dokumentinformationsresurs på ditt Azure-konto. Anslut containrar skickar inte kunddata, till exempel den bild eller text som analyseras, till Microsoft.

Ett exempel på den information som anslutna containrar skickar till Microsoft för fakturering finns i Vanliga frågor och svar om Azure AI-container.

Varför får jag felet "Containern är inte i ett giltigt tillstånd. Prenumerationsverifieringen misslyckades med statusen "OutOfQuota"-API-nyckeln är slut på kvoten?

Dokumentinformationsanslutna containrar skickar faktureringsinformation till Azure med hjälp av en dokumentinformationsresurs på ditt Azure-konto. Du kan få det här meddelandet om containrarna inte kan kommunicera med faktureringsslutpunkten.

Kan jag använda lokal lagring för FOTT-containern (Document Intelligence Sample Labeling Tool) ?

FOTT har en version som använder lokal lagring. Versionen måste installeras på en Windows-dator. Du kan installera den från den här platsen.

På projektsidan anger du etikettmappens URI som /shared eller /shared/sub-dir om etiketteringsfilerna finns i en underkatalog. Alla andra beteenden för exempeletiketteringsverktyget för dokumentinformation är samma som den värdbaserade tjänsten.

Vad är den bästa metoden för att skala upp?

För asynkrona anrop kan du köra flera containrar med delad lagring. Containern som bearbetar analysanropet POST lagrar utdata i lagringen. Sedan kan alla andra containrar hämta resultatet från lagringen och hantera anropen GET . Begärande-ID:t är inte kopplat till en container.

För synkrona anrop kan du köra flera containrar, men bara en container hanterar en begäran. Eftersom det är ett blockerande anrop kan alla containrar från poolen hantera begäran och skicka svaret. Här är endast en container kopplad till en begäran i taget och ingen avsökning krävs.

Hur konfigurerar jag containrar med delad lagring?

Containrarna använder Mounts:Shared egenskapen när de startas för att ange det delade lagringsutrymmet för att lagra bearbetningsfilerna. Information om hur du använder den här egenskapen finns i dokumentationen för containrar.

Säkerhet och sekretess

Vilka är metoderna och kraven för att autentisera begäranden till Azure AI-tjänster?

Varje begäran till en Azure-tjänst måste innehålla ett autentiseringshuvud. Du kan autentisera en begäran med hjälp av flera metoder:

Lagrar Dokumentinformation mina data?

För alla funktioner lagrar Document Intelligence tillfälligt data och resultat i Azure Storage i samma region som begäran. Dina data tas sedan bort inom 24 timmar från den tidpunkt då du skickar en analysbegäran.

Läs mer om data, sekretess och säkerhet för dokumentinformation.

Hur lagras och används mina tränade anpassade modeller i Dokumentinformation?

Mellanliggande utdata efter analys och etikettering lagras på samma Azure Storage-plats där du lagrar dina träningsdata. De tränade anpassade modellerna lagras i Azure Storage i samma region och de är logiskt isolerade med din Azure-prenumeration och DINA API-autentiseringsuppgifter.

Mer hjälp och support

Var hittar jag fler lösningar på mina Azure AI Document Intelligence-frågor?

Microsoft Q&A är hem för tekniska frågor och svar på Microsoft. Du kan filtrera frågor som är specifika för dokumentinformation.

Vad ska jag göra om tjänsten inte känner igen specifik text eller identifierar den felaktigt när jag etiketterar dokument?

Vi uppdaterar och förbättrar kontinuerligt OCR-modellen för dokumentinformation. Du kan skicka ett e-postmeddelande till dokumentinformationsteamet. Om möjligt kan du dela ett exempeldokument med problemet markerat.