Začínáme: Rozpoznávání formulářů Studio | Náhled
Poznámka
Rozpoznávání formulářů Studio je aktuálně ve verzi Public Preview. Některé funkce nemusí být podporované nebo mají omezené možnosti.
Rozpoznávání formulářů Studio Preview je online nástroj pro vizuální zkoumání, pochopení a integraci funkcí z Rozpoznávání formulářů ve vašich aplikacích. Začínáme se zkoumáním předem natrénovaných modelů s ukázkovými dokumenty nebo vlastními. Vytvářejte projekty pro vytváření vlastních modelů formulářů a odkazujte na modely ve vašich aplikacích pomocí sady Python SDK Preview a dalších rychlých startů.
Migrace z ukázkového nástroje pro popisování
Pokud jste předchozím uživatelem ukázkového nástroje pro popisování, přeskočte požadavky na přihlášení k verzi Studio Preview a použijte stávající účet Azure a Rozpoznávání formulářů nebo Cognitive Services prostředky pomocí nástroje Studio.
Pokud chcete do studia migrovat existující vlastní projekty, přejděte k části Začínáme s vlastním modelem a vytvořte nový projekt a nasažte ho do stejného umístění úložiště objektů blob v Azure za předpokladu, že k ní máte přístup v Azure. Po konfiguraci nového projektu načte Studio všechny dokumenty a dočasné soubory pro označování a trénování.
Minimální požadavky pro nové uživatele
- Aktivní účet Azure. Pokud ho nemáte, můžete si vytvořit bezplatný účet.
- Prostředek Rozpoznávání formulářů nebo Cognitive Services více služeb.
Další požadavky pro vlastní projekty
Kromě účtu Azure a prostředku Rozpoznávání formulářů nebo Cognitive Services budete potřebovat:
Kontejner Storage objektů blob Azure
Standardní výkon účtu služby Azure Blob Storage blob. Vytvoříte kontejnery pro ukládání a uspořádání dat objektů blob v rámci účtu úložiště. Pokud nevíte, jak vytvořit účet úložiště Azure s kontejnerem, postupujte podle těchto rychlých startů:
- Vytvořte účet úložiště. Při vytváření účtu úložiště nezapomeňte v poli Podrobnosti o instanci v poli Výkon → Standardní výkon.
- Vytvořte kontejner. Při vytváření kontejneru nastavte v okně Nový kontejner pole Úroveň veřejného přístupu na Kontejner (anonymní přístup pro čtení pro kontejnery a objekty blob).
Konfigurace CORS
Cors (sdílení prostředků mezi zdroji) je potřeba nakonfigurovat ve vašem účtu úložiště Azure, aby byl přístupný z Rozpoznávání formulářů Studio. Pokud chcete CORS nakonfigurovat v Azure Portal, budete potřebovat přístup k okně CORS vašeho účtu úložiště.
- Vyberte okno CORS pro účet úložiště.
- Začněte vytvořením nové položky CORS v Blob service.
- Možnost Povolené zdroje nastavte na https://formrecognizer.appliedai.azure.com .
- Vyberte všechny dostupné 8 možností pro Povolené metody.
- Schvalte všechny povolené hlavičky a vystavené hlavičky zadáním * do každého pole.
- Nastavte Maximální věk na 120 sekund nebo libovolnou přijatelnou hodnotu.
- Kliknutím na tlačítko Uložit v horní části stránky uložte změny.
CORS by teď mělo být nakonfigurované pro použití účtu úložiště z Rozpoznávání formulářů Studia.
Sada ukázkových dokumentů
Přejděte na Azure Portal a přejděte následujícím způsobem: Váš účet úložiště → Data Storage → Containers
V seznamu vyberte kontejner.
Vyberte Upload v nabídce v horní části stránky.
Zobrazí Upload okno objektu blob.
Vyberte soubory, které chcete nahrát.
Poznámka
Ve výchozím nastavení bude Studio používat formulářové dokumenty, které jsou umístěné v kořenovém adresáři kontejneru. Můžete ale použít data uspořádaná do složek, pokud jsou určená v krocích vytvoření projektu Vlastní formulář. Viz Uspořádání dat do podsložek.
Přihlaste se k Rozpoznávání formulářů Studio Preview.
Po splnění požadavků přejděte na stránku Rozpoznávání formulářů Studio Preview.
Na domovské Rozpoznávání formulářů Studio vyberte funkci služby pro Rozpoznávání formulářů.
Vyberte své předplatné Azure, skupinu prostředků a prostředek. (Prostředky můžete v horní nabídce Nastavení kdykoli změnit.)
Zkontrolujte a potvrďte vybrané možnosti.
Layout
V zobrazení Rozložení:
Výběrem příkazu Analyzovat spusťte analýzu rozložení ukázkového dokumentu nebo zkuste dokument vyzkoušet pomocí příkazu Přidat.
Sledujte zvýrazněný extrahovaný text, ikony tabulky zobrazující umístění extrahovaných tabulek a zvýrazněné značky výběru.
Ovládací prvky v dolní části obrazovky slouží k přiblížení a oddálení a otočení zobrazení dokumentu.
Zobrazit a skrýt vrstvy textu, tabulek a výběrů značek, abyste se na každou z nich zaměřili po jednotlivých vrstvách.
Na kartě Výsledek v části výstup vyhledejte výstup JSON a seznamte se s formátem odpovědi služby. Zkopírováním a stažením můžete přejít k integraci.
Předem připravené modely
Můžete si vybrat z několika předem připravených modelů, z nichž každý má vlastní sadu podporovaných polí. Model, který se má použít pro operaci analýzy, závisí na typu dokumentu, který se má analyzovat. Tady jsou předem sestavené modely, které aktuálně podporuje Rozpoznávání formulářů služby:
- 🆕 obecný dokument– analýza a extrahování textu, tabulek, struktury, párů klíč-hodnota a pojmenovaných entit
- Faktura:Extrahuje text, značky výběru, tabulky, páry klíč-hodnota a klíčové informace z faktur.
- Účtenka:Extrahuje z účtenek textové a klíčové informace.
- Dokument ID:Extrahuje textové a klíčové informace z řidičský průkaz a mezinárodních pasů.
- Vizitka:Extrahuje informace o textu a klíči z vizitek.
V předem sestavené zobrazení:
Na domovské obrazovce sady Studio vyberte jeden z předem připravených modelů. V tomto příkladu používáme model faktury.
Výběrem příkazu Analyzovat spusťte analýzu ukázkového dokumentu nebo zkuste fakturu pomocí příkazu Přidat.
V části Vizualizace se podívejte na zvýrazněná pole a hodnoty a položky řádku faktury. Zobrazí se také veškerý extrahovaný text a tabulky.
Na kartě Pole v oddílu výstupu si všimněte uvedených polí a hodnot a vyberte řádkové položky, které chcete zobrazit ve formátu tabulky.
Na kartě Výsledek v části výstup vyhledejte výstup JSON a seznamte se s formátem odpovědi služby. Zkopírováním a stažením můžete přejít k integraci.
Základy vlastního modelu
Začínáme
Pokud chcete vytvořit vlastní modely, začněte konfigurací projektu:
Na domovské stránce studia vyberte projekt Vlastní formulář a otevřete domovskou stránku Vlastní formulář.
Pomocí příkazu Vytvořit projekt spusťte průvodce konfigurací nového projektu.
Zadejte podrobnosti o projektu, vyberte předplatné a prostředek Azure a kontejner úložiště objektů blob v Azure, který obsahuje vaše data.
Zkontrolujte a odešlete nastavení a vytvořte projekt.
Základní tok
Po kroku vytvoření projektu ve fázi vlastního modelu:
V zobrazení popisků definujte popisky a jejich typy, které chcete extrahovat.
Vyberte text v dokumentu a v rozevíracím seznamu nebo v podokně popisků vyberte popisek.
Popiskem čtyř dalších dokumentů získáte alespoň pět dokumentů označených popisky.
Vyberte příkaz Train (Trénovat) a zadejte název a popis modelu, abyste začali s trénováním vlastního modelu.
Jakmile je model připravený, pomocí testovacího příkazu ho ověřte v testovacích dokumentech a podívejte se na výsledky.
Další funkce
Kromě toho můžete všechny modely zobrazit pomocí karty Modely na levé straně. V zobrazení seznamu vyberte modely a proveďte následující akce:
Otestujte model ze zobrazení seznamu.
Pomocí příkazu Odstranit odstraňte nepožadované modely.
Stáhněte si podrobnosti o modelu pro offline zobrazení.
Vyberte několik modelů a vytvořte je do nového modelu, který se použije ve vašich aplikacích.
Označování jako tabulek
Při vytváření vlastních modelů možná budete muset z dokumentů extrahovat kolekce dat. Ty se dají zobrazit v několika formátech. Použití tabulek jako vizuálního vzoru:
Dynamický nebo proměnlivý počet hodnot (řádků) pro danou sadu polí (sloupců)
Konkrétní kolekce hodnot pro danou sadu polí (sloupců nebo řádků)
Popisek jako dynamická tabulka
Pomocí dynamických tabulek můžete extrahovat počet proměnných hodnot (řádků) pro danou sadu polí (sloupců):
Přidejte nový popisek typu Tabulka, vyberte typ Dynamická tabulka a pojmnte ho.
Přidejte počet sloupců (polí) a řádků (pro data), které potřebujete.
Vyberte text na stránce a pak zvolte buňku, která se má k textu přiřadit. Postup opakujte pro všechny řádky a sloupce na všech stránkách ve všech dokumentech.
Popisek jako pevná tabulka
Pomocí pevných tabulek můžete extrahovat konkrétní kolekci hodnot pro danou sadu polí (sloupců nebo řádků):
Vytvořte nový popisek typu Tabulka, vyberte typ Pevná tabulka a pojmnte ho.
Přidejte počet sloupců a řádků, které potřebujete, odpovídající dvěma sadách polí.
Vyberte text na stránce a pak zvolte buňku, která ho k textu přiřadí. Postup opakujte pro ostatní dokumenty.
Označování pro detekci signatur
Označení pro detekci signatur:
V zobrazení popisků vytvořte nový popisek typu Podpis a pojmnte ho.
Pomocí příkazu Region vytvořte obdélníkovou oblast v očekávaném umístění podpisu.
Vyberte vykreslenou oblast a zvolte popisek Typ podpisu a přiřaďte ho k vaší vykreslené oblasti. Postup opakujte pro ostatní dokumenty.
Další kroky
- Postupujte podle Rozpoznávání formulářů v3.0 a seznamte se s rozdíly od předchozí verze REST API.
- Prozkoumejte naše rychlé starty se sadou Sdk ve verzi Preview a vyzkoušejte funkce preview ve vašich aplikacích pomocí nových sad SDK.
- Pokud chcete vyzkoušet funkce REST API nové rozhraní RESt API, přečtěte si naše rychlé starty ve verzi Preview.