Ingestování objektů blob do Azure Průzkumník dat díky přihlášení k odběru oznámení Event Grid
Průzkumník dat Azure je rychlá a vysoce škálovatelná služba pro zkoumání dat protokolů a telemetrie. Azure Průzkumník dat nabízí ingestování (načítání dat) z Event Hubs, rozbočovačů IoT a objektů BLOB zapsaných do kontejnerů objektů BLOB.
V tomto článku se dozvíte, jak ingestovat objekty BLOB z účtu úložiště do Azure Průzkumník dat pomocí datového připojení Event Grid. Vytvoříte připojení Event Grid dat, které nastaví Azure Event Grid předplatné. Předplatné Event Grid směruje události z vašeho účtu úložiště do Azure Průzkumník dat prostřednictvím centra událostí Azure. Pak uvidíte příklad toku dat v celém systému.
obecné informace o ingestování do Azure Průzkumník dat z Event Grid najdete v tématu Připojení Event Grid. Postup ručního vytvoření prostředků v Azure Portal najdete v tématu Ruční vytváření prostředků pro Event Gridingestování.
Požadavky
- Předplatné Azure. Vytvořte si bezplatný účet Azure.
- Vytvořte cluster a databázi.
- Vytvořte účet úložiště.
- odběr oznámení Event Grid lze nastavit u Azure Storage účtů pro
BlobStorage,StorageV2neboBlobStorage.
Vytvoření cílové tabulky v Azure Data Exploreru
Vytvoří tabulku v Azure Průzkumník dat, kam Event Hubs odešle data. Vytvořte tabulku v clusteru a databázi připravenou v požadavcích.
Na portálu Azure Portal vyberte v rámci svého clusteru možnost Dotaz.
Zkopírujte následující příkaz do okna a výběrem příkazu Spustit vytvořte tabulku (test), která přijme ingestovaná data.
.create table TestTable (TimeStamp: datetime, Value: string, Source:string)
Zkopírujte do okna následující příkaz a vyberte možnost Spustit pro mapování příchozích dat JSON na názvy sloupců a datové typy tabulky (tabulka).
.create table TestTable ingestion json mapping 'TestMapping' '[{"column":"TimeStamp","path":"$.TimeStamp"},{"column":"Value","path":"$.Value"},{"column":"Source","path":"$.Source"}]'
Vytvoření datového připojení Event Grid
Teď připojte účet úložiště k Azure Průzkumník dat, aby se data do úložiště streamoval do testovací tabulky. Toto připojení se dá vytvořit v Azure Portal pod samotným účtem úložiště nebo v Azure Portal v rámci Azure Průzkumník dat.
V Azure Portal přejděte k účtu úložiště. V nabídce vlevo vyberte možnost události .
V hlavním podokně vyberte kartu Azure Průzkumník dat .
Otevře se podokno datové připojení se zvolenou kartou základy .
Datové připojení – karta základy
Do formuláře zadejte následující informace:
Nastavení Navrhovaná hodnota Popis pole Název datového připojení test-Grid – připojení Název připojení, které chcete vytvořit v Azure Průzkumník dat. Účet úložiště gridteststorage1 Účet úložiště, ze kterého jste se připojili k tomuto průvodci. Vyplní automaticky. Typ události Objekt BLOB se vytvořil nebo přejmenoval objekt BLOB . Typ události, která aktivuje ingestování. Přejmenovaná BLOB je podporovaná jenom pro ADLSv2 úložiště. Podporované typy jsou: Microsoft. Storage. BlobCreated nebo Microsoft. Storage. BlobRenamed. Vytváření prostředků Automatické Definujte, jestli chcete, aby Azure Průzkumník dat pro vás vytvořilo předplatné Event Grid, obor názvů centra událostí a centrum událostí. Informace o ručním vytvoření prostředků najdete v tématu Ruční vytváření prostředků pro ingestování Event Grid. Vyberte Další vlastnostiingestování.
Datové připojení – karta vlastnosti pro přijímání
Do formuláře zadejte následující informace. V názvech tabulek a mapování se rozlišují velká a malá písmena:
Nastavení Navrhovaná hodnota Popis pole Předplatné Vaše předplatné Azure Průzkumník dat. Název clusteru TestCluster Název clusteru, ve kterém chcete ingestovat data. Název databáze TestDatabase Cílová databáze, kterou jste vytvořili v TestCluster. Název tabulky TestTable Cílová tabulka, kterou jste vytvořili v TestDatabase. Formát dat JSON Podporované formáty jsou Avro, CSV, JSON, VÍCEŘÁDKOVé JSON, ORC, PARQUET, PSV, SCSV, SOHSV, TSV, TXT, TSVE, APACHEAVRO, RAW a protokol W3CLOG. Podporované možnosti komprese jsou ZIP a gzip. Mapování TestMapping Mapování, které jste vytvořili v databázi TestDatabase a které mapuje příchozí data JSON na názvy sloupců a datové typy tabulky TestTable. Rozšířená nastavení Data obsahují záhlaví Ignoruje hlavičky. Podporováno pro soubory typu SV. Poznámka
Nemusíte zadávat všechna výchozí nastavení směrování. Jsou také přijata částečná nastavení.
Vybrat Další: zkontrolovat + vytvořit
Datové připojení – kontrola + vytvořit kartu
Zkontrolujte prostředky, které byly pro vás automaticky vytvořeny, a vyberte vytvořit.
Nasazení
Počkejte na dokončení nasazení. Pokud se nasazení nepovedlo, vyberte Podrobnosti o operaci vedle neúspěšné fáze a získejte další informace z důvodu selhání. Vyberte znovu nasadit a zkuste prostředky nasadit znovu. Parametry můžete před nasazením změnit.
Generování ukázkových dat
Teď, když je služba Azure Průzkumník dat a účet úložiště připojené, můžete vytvořit ukázková data.
Upload objekt blob do kontejneru úložiště
budeme pracovat se skriptem malého prostředí, který vydává několik základních příkazů rozhraní příkazového řádku Azure pro interakci s Azure Storagemi prostředky. Tento skript provede následující akce:
- Vytvoří nový kontejner v účtu úložiště.
- Nahraje existující soubor (jako objekt BLOB) do tohoto kontejneru.
- Zobrazí seznam objektů BLOB v kontejneru.
Pomocí Azure Cloud Shell můžete skript spustit přímo na portálu.
Uložte data do souboru a nahrajte ho pomocí tohoto skriptu:
{"TimeStamp": "1987-11-16 12:00","Value": "Hello World","Source": "TestSource"}
#!/bin/bash
### A simple Azure Storage example script
export AZURE_STORAGE_ACCOUNT=<storage_account_name>
export AZURE_STORAGE_KEY=<storage_account_key>
export container_name=<container_name>
export blob_name=<blob_name>
export file_to_upload=<file_to_upload>
export destination_file=<destination_file>
echo "Creating the container..."
az storage container create --name $container_name
echo "Uploading the file..."
az storage blob upload --container-name $container_name --file $file_to_upload --name $blob_name --metadata "rawSizeBytes=1024"
echo "Listing the blobs..."
az storage blob list --container-name $container_name --output table
echo "Done"
Poznámka
Aby se dosáhlo nejlepšího výkonu ingestování, musí být předávána nekomprimovaná velikost komprimovaných objektů BLOB odeslaných pro přijímání. Vzhledem k tomu, že Event Grid oznámení obsahují pouze základní údaje, musí být informace o velikosti explicitně sdělovány. Informace o nekomprimované velikosti lze poskytnout nastavením rawSizeBytes vlastnosti u metadat objektu BLOB s rawSizeBytes daty v bajtech.
Přejmenovat objekt BLOB
Pokud ingestují data z úložiště ADLSv2 a definovali jste jako typ události pro datové připojení přejmenované objekty blob , Trigger pro ingestování objektů BLOB je přejmenování objektu BLOB. Pokud chcete přejmenovat objekt blob, přejděte na objekt BLOB v Azure Portal, klikněte pravým tlačítkem na objekt BLOB a vyberte Přejmenovat:
Vlastnosti ingestování
Vlastnosti příjmu objektu blob můžete určit prostřednictvím metadat objektu BLOB.
Poznámka
Azure Průzkumník dat neodstraní objekty blob po ingestování. Uložte objekty blob po dobu 3 až 5 dní. Použijte životní cyklus úložiště objektů BLOB v Azure ke správě odstranění objektu BLOB.
Kontrola toku dat
Poznámka
Azure Data Explorer má zásady agregace (dávkování) pro příjem dat navržené tak, aby optimalizovaly proces příjmu dat. Ve výchozím nastavení je zásada nakonfigurovaná na 5 minut. V případě potřeby budete moct zásady později změnit. V tomto článku můžete očekávat latenci několika minut.
V Azure Portal v mřížce událostí uvidíte špičku aktivity, když je aplikace spuštěná.
Pokud chcete zkontrolovat, kolik zpráv se zatím dostalo do databáze, spusťte v testovací databázi následující dotaz.
TestTable | countPokud chcete zobrazit obsah zpráv, spusťte v testovací databázi následující dotaz.
TestTableSada výsledků by měla vypadat jako na následujícím obrázku:
Vyčištění prostředků
Pokud už event Grid nechcete znovu používat, vyčistěte odběr služby Event Grid, obor názvů centra událostí a centrum událostí, které se pro vás automaticky vytvořily, abyste se vyhnuli nákladům.
V Azure Portal přejděte do levé nabídky a vyberte Všechny prostředky.
Vyhledejte obor názvů centra událostí a výběrem možnosti Odstranit ho odstraňte:
Ve formuláři Odstranit prostředky potvrďte odstranění, abyste odstranili prostředky oboru názvů centra událostí a centra událostí.
Přejděte ke svému účtu úložiště. V nabídce vlevo vyberte Události:
Pod grafem vyberte své předplatné Event Grid a pak ho odstraňte výběrem možnosti Odstranit:
Pokud chcete odstranit Event Grid datové připojení, přejděte ke svému Azure Data Explorer clusteru. V nabídce vlevo vyberte Databáze.
Vyberte databázi TestDatabase:
V nabídce vlevo vyberte Příjem dat:
Vyberte datové připojení test-grid-connection a pak ho odstraňte výběrem možnosti Odstranit.





