Blobs opnemen in Azure Data Explorer door u te abonneren op Event Grid meldingen
Azure Data Explorer is een snelle en zeer schaalbare service voor gegevensverkenning voor telemetrische gegevens en gegevens uit logboeken. Azure Data Explorer biedt opname (laden van gegevens) van Event Hubs, IoT Hubs en blobs die naar blobcontainers worden geschreven.
In dit artikel leert u hoe u blobs uit uw opslagaccount kunt opnemen in Azure Data Explorer met behulp van Event Grid verbinding. U maakt een Event Grid gegevensverbinding die een Azure Event Grid in. Het Event Grid routeergebeurtenissen van uw opslagaccount naar Azure Data Explorer via een Azure Event Hub. Vervolgens ziet u een voorbeeld van de gegevensstroom in het hele systeem.
Voor algemene informatie over het opnemen in Azure Data Explorer van Event Grid, Verbinding maken naar Event Grid. Zie Handmatig resources maken voor Azure Portal in de Event Grid om handmatig resources te maken in de Event Grid.
Vereisten
- Een Azure-abonnement. Maak een gratis Azure-account.
- Maak een cluster en database.
- Maak een opslagaccount.
- Event Grid meldingsabonnement kan worden ingesteld op Azure Storage-accounts
BlobStoragevoor , of Data Lake StorageStorageV2BlobStorage
Een doeltabel maken in Azure Data Explorer
Maak een tabel in Azure Data Explorer waar Event Hubs gegevens verzendt. Maak de tabel in het cluster en de database die zijn voorbereid in de vereisten.
Selecteer in de Azure-portal, onder het cluster, de optie Query.
Kopieer de volgende opdracht in het venster en selecteer Uitvoeren om de tabel (TestTable) te maken die de opgenomen gegevens ontvangt.
.create table TestTable (TimeStamp: datetime, Value: string, Source:string)
Kopieer de volgende opdracht in het venster en selecteer Uitvoeren om de binnenkomende JSON-gegevens toe te wijzen aan de kolomnamen en gegevenstypen van de tabel (TestTable).
.create table TestTable ingestion json mapping 'TestMapping' '[{"column":"TimeStamp","path":"$.TimeStamp"},{"column":"Value","path":"$.Value"},{"column":"Source","path":"$.Source"}]'
Een verbinding Event Grid gegevens maken
Verbind nu het opslagaccount met Azure Data Explorer, zodat gegevens die naar de opslag stromen, naar de testtabel worden gestreamd. Deze verbinding kan worden gemaakt in de Azure Portal onder het opslagaccount zelf of in de Azure Portal onder Azure Data Explorer.
Blader naar het opslagaccount in de Azure Portal. Selecteer Gebeurtenissen in het menu aan de linkerkant
Selecteer in het hoofdvenster het Azure Data Explorer tabblad.
Het deelvenster Gegevensverbinding wordt geopend met het tabblad Basisinformatie geselecteerd.
Gegevensverbinding - tabblad Basisbeginselen
Vul het formulier in met de volgende gegevens:
Instelling Voorgestelde waarde Beschrijving van veld Naam van gegevensverbinding test-grid-connection De naam van de verbinding die u wilt maken in Azure Data Explorer. Storage-account gridteststorage1 Het opslagaccount van waaruit u deze wizard hebt gebruikt. Automatisch ingevuld. Gebeurtenistype Blob gemaakt ofde naam van blob is gewijzigd Het type gebeurtenis dat de opname activeert. De naam van blob wordt alleen ondersteund voor ADLSv2-opslag. Ondersteunde typen zijn: Microsoft. Storage. BlobCreated of Microsoft. Storage. BlobRenamed. Resources maken Automatisch Definieer of Azure Data Explorer een abonnement Event Grid, een Event Hub-naamruimte en een Event Hub voor u wilt maken. Als u resources handmatig wilt maken, zie Handmatig resources maken voor Event Grid opname Selecteer Volgende opname-eigenschappen.
Gegevensverbinding - tabblad Opname-eigenschappen
Vul in het formulier de volgende gegevens in. Tabel- en toewijzingsnamen zijn casegevoelig:
Instelling Voorgestelde waarde Beschrijving van veld Abonnement Uw Azure Data Explorer abonnement. Clusternaam TestCluster De naam van het cluster waarin u gegevens wilt opnemen. Databasenaam TestDatabase De doeldatabase die u hebt gemaakt in TestCluster. Tabelnaam TestTable De doeltabel die u hebt gemaakt in TestDatabase. Gegevensindeling JSON Ondersteunde indelingen zijn Avro, CSV, JSON, MULTILINE JSON, ORC, PARQUET, PSV, SCSV, SOHSV, TSV, TXT, TSVE, APACHEAVRO, RAW en W3CLOG. Ondersteunde compressieopties zijn Zip en Gzip. Toewijzing TestMapping De toewijzing die u hebt gemaakt in TestDatabase en waarmee die binnenkomende JSON-gegevens worden toegewezen aan de kolomnamen en gegevenstypen van TestTable. Geavanceerde instellingen Mijn gegevens hebben headers Negeert headers. Ondersteund voor *SV-typebestanden. Notitie
U hoeft niet alle standaardrouteringsinstellingen op te geven. Gedeeltelijke instellingen worden ook geaccepteerd.
Selecteer Volgende: Beoordelen en maken
Gegevensverbinding - tabblad Controleren en maken
Controleer de resources die automatisch voor u zijn gemaakt en selecteer Maken.
Implementatie
Wacht tot de implementatie is voltooid. Als de implementatie is mislukt, selecteert u Bewerkingsdetails naast de mislukte fase voor meer informatie over de reden van de fout. Selecteer Opnieuw implementeren om de resources opnieuw te implementeren. U kunt de parameters wijzigen vóór de implementatie.
Voorbeeldgegevens genereren
Nu Azure Data Explorer en het opslagaccount zijn verbonden, kunt u voorbeeldgegevens maken.
Upload blob naar de opslagcontainer
U werkt met een klein shellscript dat een paar eenvoudige Azure CLI-opdrachten opgeeft voor interactie met Azure Storage-resources. Met dit script worden de volgende acties ondernomen:
- Hiermee maakt u een nieuwe container in uw opslagaccount.
- Uploadt een bestaand bestand (als een blob) naar die container.
- Hiermee worden de blobs in de container vermeld.
U kunt Azure Cloud Shell script rechtstreeks in de portal uitvoeren.
Sla de gegevens op in een bestand en upload deze met dit script:
{"TimeStamp": "1987-11-16 12:00","Value": "Hello World","Source": "TestSource"}
#!/bin/bash
### A simple Azure Storage example script
export AZURE_STORAGE_ACCOUNT=<storage_account_name>
export AZURE_STORAGE_KEY=<storage_account_key>
export container_name=<container_name>
export blob_name=<blob_name>
export file_to_upload=<file_to_upload>
export destination_file=<destination_file>
echo "Creating the container..."
az storage container create --name $container_name
echo "Uploading the file..."
az storage blob upload --container-name $container_name --file $file_to_upload --name $blob_name --metadata "rawSizeBytes=1024"
echo "Listing the blobs..."
az storage blob list --container-name $container_name --output table
echo "Done"
Notitie
Om de beste opnameprestaties te bereiken, moet de niet-gecomprimeerde grootte van de gecomprimeerde blobs die worden verzonden voor opname worden gecommuniceerd. Omdat Event Grid alleen basisgegevens bevatten, moet de groottegegevens expliciet worden gecommuniceerd. De niet-gecomprimeerde groottegegevens kunnen worden opgegeven door de eigenschap in te stellen op de metagegevens van de blob met de niet-gecomprimeerde rawSizeBytes gegevensgrootte in rawSizeBytes bytes.
Naam van blob wijzigen
Als u gegevens ophaalt uit ADLSv2-opslag en de naam van blob hebt gedefinieerd als het gebeurtenistype voor de gegevensverbinding, is de trigger voor blob-opname blob-hernoeming. Als u de naam van een blob wilt wijzigen, gaat u naar de blob in Azure Portal, klikt u met de rechtermuisknop op de blob en selecteert u Naam wijzigen:
Opname-eigenschappen
U kunt de opname-eigenschappen van de blob-opname opgeven via de blobmetagegevens.
Notitie
Azure Data Explorer worden de blobs na opname niet verwijderd. De blobs drie tot vijf dagen bewaren. Gebruik de levenscyclus van Azure Blob Storage om het verwijderen van blobs te beheren.
De gegevensstroom controleren
Notitie
Azure Data Explorer heeft een aggregatiebeleid (batching) voor gegevensingestie dat is ontworpen om het opnameproces te optimaliseren. Standaard is het beleid geconfigureerd op vijf minuten. Indien nodig kunt u het beleid op een later tijdstip wijzigen. In dit artikel kunt u een latentie van enkele minuten verwachten.
In de Azure-portal, onder uw Event Grid, ziet u de piek in activiteit terwijl de app wordt uitgevoerd.
Als u wilt controleren hoeveel berichten er op dat moment de database hebben bereikt, voert u de volgende query uit in de testdatabase.
TestTable | countVoer de volgende query in uw testdatabase uit om de inhoud van de berichten te bekijken.
TestTableDe resultatenset moet er als volgt uitzien:
Resources opschonen
Als u niet van plan bent om uw Event Grid opnieuw te gebruiken, schoont u het Event Grid-abonnement, de Event Hub-naamruimte en de Event Hub op die automatisch voor u zijn gemaakt, om kosten te voorkomen.
Ga Azure Portal naar het linkermenu en selecteer Alle resources.
Zoek uw Event Hub-naamruimte en selecteer Verwijderen om deze te verwijderen:
Bevestig in het formulier Resources verwijderen de verwijdering om de Event Hub-naamruimte en Event Hub-resources te verwijderen.
Ga naar uw opslagaccount. Selecteer Gebeurtenissen in het menu links:
Selecteer onder de grafiek uw Event Grid abonnement en selecteer vervolgens Verwijderen om het abonnement te verwijderen:
Als u uw Event Grid wilt verwijderen, gaat u naar uw Azure Data Explorer cluster. Selecteer Databases in het menu aan de linkerkant.
Selecteer uw database TestDatabase:
Selecteer gegevens opnemen in het menu aan de linkerkant:
Selecteer uw gegevensverbinding test-grid-connection en selecteer vervolgens Verwijderen om deze te verwijderen.





