Gegevens ophalen uit Amazon S3

Artikel
01/16/2024

Gegevensopname is het proces dat wordt gebruikt om gegevens uit een of meer bronnen in een tabel in Azure Data Explorer te laden. Zodra de gegevens zijn opgenomen, worden ze beschikbaar voor query's. In dit artikel leert u hoe u gegevens van Amazon S3 in een nieuwe of bestaande tabel kunt ophalen.

Zie Wat is Amazon S3? voor meer informatie over Amazon S3.

Zie Overzicht van gegevensopname in Azure Data Explorer voor algemene informatie over gegevensopname.

Vereisten

Een Microsoft-account of een Microsoft Entra gebruikersidentiteit. Er is geen Azure-abonnement vereist.
Meld u aan bij de azure Data Explorer-webinterface.
Een Azure Data Explorer-cluster en -database. Maak een cluster en database.

Gegevens ophalen

Selecteer Query in het linkermenu.
Klik met de rechtermuisknop op de database waarin u de gegevens wilt opnemen en selecteer vervolgens Gegevens ophalen.

Bron

In het venster Gegevens ophalen is het tabblad Bron geselecteerd.

Selecteer de gegevensbron in de lijst met beschikbare gegevens. In dit voorbeeld neemt u gegevens op van Amazon S3.

Configureren

Selecteer een doeldatabase en -tabel. Als u gegevens wilt opnemen in een nieuwe tabel, selecteert u +Nieuwe tabel en voert u een tabelnaam in.

Notitie

Tabelnamen kunnen maximaal 1024 tekens bevatten, inclusief spaties, alfanumerieke tekens, afbreekstreepjes en onderstrepingstekens. Speciale tekens worden niet ondersteund.
Plak in het veld URI de verbindingsreeks van één bucket of een afzonderlijk object in de volgende indeling.

Bucket: https://BucketName.s3.RegionName.amazonaws.com

Object: ObjectName;AwsCredentials=AwsAccessID,AwsSecretKey

Desgewenst kunt u bucketfilters toepassen om gegevens te filteren op basis van een specifieke bestandsextensie.

Notitie

Opname ondersteunt een maximale bestandsgrootte van 6 GB. Het wordt aanbevolen om bestanden tussen 100 MB en 1 GB op te nemen.
Selecteer Next.

Inspecteren

Het tabblad Inspecteren wordt geopend met een voorbeeld van de gegevens.

Selecteer Voltooien om het opnameproces te voltooien.

Optioneel:

Selecteer Opdrachtviewer om de automatische opdrachten weer te geven en te kopiëren die zijn gegenereerd op basis van uw invoer.
Gebruik de vervolgkeuzelijst Schemadefinitiebestand om het bestand te wijzigen waaruit het schema wordt afgeleid.
Wijzig de automatisch afgeleide gegevensindeling door de gewenste indeling te selecteren in de vervolgkeuzelijst. Zie Gegevensindelingen die worden ondersteund door Azure Data Explorer voor opname.
Kolommen bewerken.
Geavanceerde opties verkennen op basis van gegevenstype.

Kolommen bewerken

Notitie

Voor tabellaire indelingen (CSV, TSV, PSV) kunt u een kolom niet tweemaal toewijzen. Als u wilt toewijzen aan een bestaande kolom, verwijdert u eerst de nieuwe kolom.
U kunt een bestaand kolomtype niet wijzigen. Als u probeert toe te wijzen aan een kolom met een andere indeling, kunt u lege kolommen krijgen.

De wijzigingen die u in een tabel kunt aanbrengen, zijn afhankelijk van de volgende parameters:

Tabeltype is nieuw of bestaand
Toewijzingstype is nieuw of bestaand

Tabletype	Toewijzingstype	Beschikbare aanpassingen
Nieuwe tabel	Nieuwe toewijzing	Kolomnaam wijzigen, gegevenstype wijzigen, gegevensbron wijzigen, toewijzingstransformatie, kolom toevoegen, kolom verwijderen
Bestaande tabel	Nieuwe toewijzing	Kolom toevoegen (waarop u vervolgens het gegevenstype kunt wijzigen, de naam kunt wijzigen en bijwerken)
Bestaande tabel	Bestaande toewijzing	geen

Toewijzingstransformaties

Sommige toewijzingen van gegevensindelingen (Parquet, JSON en Avro) ondersteunen eenvoudige opnametijdtransformaties. Als u toewijzingstransformaties wilt toepassen, maakt of werkt u een kolom bij in het venster Kolommen bewerken .

Toewijzingstransformaties kunnen worden uitgevoerd op een kolom van het type tekenreeks of datum/tijd, waarbij de bron het gegevenstype int of long heeft. Ondersteunde toewijzingstransformaties zijn:

DateTimeFromUnixSeconds
DateTimeFromUnixMilliseconds
DateTimeFromUnixMicroseconds
DateTimeFromUnixNanoseconds

Geavanceerde opties op basis van gegevenstype

Tabellair (CSV, TSV, PSV):

Als u tabelindelingen in een bestaande tabel opneemt, kunt u Geavanceerd>Huidig tabelschema behouden selecteren. Tabellaire gegevens bevatten niet noodzakelijkerwijs de kolomnamen die worden gebruikt om brongegevens toe te wijzen aan de bestaande kolommen. Wanneer deze optie is ingeschakeld, wordt de toewijzing op volgorde uitgevoerd en blijft het tabelschema hetzelfde. Als deze optie is uitgeschakeld, worden nieuwe kolommen gemaakt voor binnenkomende gegevens, ongeacht de gegevensstructuur.
Als u de eerste rij als kolomnamen wilt gebruiken, selecteert u Geavanceerd>Eerste rij is kolomkop.

JSON:

Als u de kolomverdeling van JSON-gegevens wilt bepalen, selecteert u Geavanceerde>geneste niveaus, tussen 1 en 100.
Als u Geavanceerd>Fouten in gegevensindeling negeren selecteert, worden de gegevens opgenomen in JSON-indeling. Als u dit selectievakje uitgeschakeld laat, worden de gegevens opgenomen in multijson-indeling.

Samenvatting

In het venster Gegevensvoorbereiding worden alle drie de stappen gemarkeerd met groene vinkjes wanneer de gegevensopname is voltooid. U kunt de opdrachten bekijken die voor elke stap zijn gebruikt of een kaart selecteren om de opgenomen gegevens op te vragen, te visualiseren of te verwijderen.

Gegevens ophalen uit Amazon S3

Vereisten

Gegevens ophalen

Bron

Configureren

Inspecteren

Kolommen bewerken

Toewijzingstransformaties

Geavanceerde opties op basis van gegevenstype

Samenvatting

Feedback

Feedback

Aanvullende resources

Gegevens ophalen uit Amazon S3

Vereisten

Gegevens ophalen

Bron

Configureren

Inspecteren

Kolommen bewerken

Toewijzingstransformaties

Geavanceerde opties op basis van gegevenstype

Samenvatting

Gerelateerde inhoud

Feedback

Feedback

Aanvullende resources