Exporteren naar Azure Blob Storage

In dit artikel wordt beschreven hoe u de optie exporteren naar Azure Blob Storage gebruikt in de module gegevens exporteren in azure machine learning Studio (klassiek).

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

Deze optie is handig wanneer u gegevens wilt exporteren van een machine learning experiment naar Azure Blob-opslag. U kunt bijvoorbeeld machine learning gegevens uitvoer delen met andere toepassingen of tussenliggende gegevens of gereinigde data sets opslaan voor gebruik in andere experimenten.

Azure-blobs zijn vanaf elke locatie toegankelijk via HTTP of HTTPS. Omdat Azure Blob-opslag een ongestructureerde gegevens opslag is, kunt u gegevens exporteren in verschillende indelingen. De indelingen CSV, TSV en ARFF worden momenteel ondersteund.

Als u gegevens naar Azure Blob wilt exporteren voor gebruik door andere toepassingen, gebruikt u de module gegevens exporteren om de gegevens op te slaan in Azure Blob Storage. Gebruik vervolgens elk hulp programma dat gegevens uit Azure Storage kan lezen (zoals Excel, hulpprogram ma's voor Cloud opslag of andere Cloud Services) om de gegevens te laden en te gebruiken.

Notitie

De modules gegevens importeren en exporteren kunnen alleen gegevens lezen en schrijven vanuit Azure Storage die is gemaakt met het klassieke implementatie model. Met andere woorden, het nieuwe Azure Blob Storage-account type dat een warme en cool Storage-toegangs lagen biedt, wordt nog niet ondersteund.

Over het algemeen zijn alle Azure Storage-accounts die u mogelijk hebt gemaakt voordat deze service optie beschikbaar werd, niet van invloed.

Als u echter een nieuw account moet maken voor gebruik met Azure Machine Learning, raden we u aan om klassiek voor het implementatie modelte selecteren of Resource Manager te gebruiken en voor soort accountde optie Algemeen gebruik te selecteren in plaats van Blob Storage.

Gegevens exporteren naar Azure Blob-opslag

De Azure Blob-service is voor het opslaan van grote hoeveel heden gegevens, inclusief binaire gegevens. Er zijn twee typen Blob-opslag: open bare blobs en blobs waarvoor aanmeldings referenties zijn vereist.

  1. Voeg de module gegevens exporteren toe aan uw experiment. U kunt deze module vinden in de categorie gegevens invoer en uitvoer in Studio (klassiek).

  2. Verbind gegevens exporteren naar de module die de gegevens produceert die u wilt exporteren naar Azure Blob-opslag.

  3. Open het deel venster Eigenschappen van gegevens exporteren. Selecteer Azure Blob Storagevoor de gegevens bestemming.

  4. Kies voor verificatie type openbaar (SAS-URL) als u weet dat de opslag toegang ondersteunt via een SAS-URL.

    Een SAS-URL is een speciaal type URL dat kan worden gegenereerd met behulp van een Azure-opslag programma. Dit is alleen beschikbaar voor een beperkte periode. Het bevat alle informatie die nodig is voor verificatie en downloaden.

    Voor URI, typt of plakt u de volledige URI waarmee het account en de open bare BLOB worden gedefinieerd.

  5. Voor particuliere accounts kiest u accounten geeft u de account naam en de account sleutel op, zodat het experiment naar het opslag account kan schrijven.

    • Account naam: Typ of plak de naam van het account waar u de gegevens wilt opslaan. Als de volledige URL van het opslag account bijvoorbeeld is https://myshared.blob.core.windows.net , typt u myshared .

    • Account sleutel: plak de toegangs sleutel voor opslag die is gekoppeld aan het account.

  6. Pad naar container, map of BLOB: Typ de naam van de BLOB waar de geƫxporteerde gegevens worden opgeslagen. Als u bijvoorbeeld de resultaten van uw experiment wilt opslaan in een nieuwe blob met de naam results01.csv in de container voorspellingen in een account met de naam MYMLDATA, zou de volledige URL voor de BLOB zijn https://mymldata.blob.core.windows.net/predictions/results01.csv .

    Daarom geeft u in het veld pad naar container, map of BLOBde naam van de container en de BLOB als volgt op: predictions/results01.csv

  7. Als u de naam opgeeft van een blob die nog niet bestaat, maakt Azure de BLOB voor u.

    Wanneer u naar een bestaande BLOB schrijft, kunt u opgeven dat de huidige inhoud van de BLOB moet worden overschreven door de eigenschap in te stellen op de schrijf modus voor Azure Blob Storage. Deze eigenschap is standaard ingesteld op fout, wat betekent dat er een fout optreedt wanneer een bestaand blob-bestand met dezelfde naam wordt gevonden.

  8. Selecteer de indeling waarin de gegevens moeten worden opgeslagen voor de bestands indeling voor het BLOB-bestand.

    • CSV: door komma's gescheiden waarden (CSV) is de standaard indeling voor opslag. Als u kolom koppen samen met de gegevens wilt exporteren, selecteert u de optie voor het schrijven van de rij-BLOB-header. Zie converteren naar CSVvoor meer informatie over de door komma's gescheiden indeling die in azure machine learning wordt gebruikt.

    • TSV: de indeling voor door tabs gescheiden waarden (TSV) is compatibel met veel machine learning-hulpprogram ma's. Als u kolom koppen samen met de gegevens wilt exporteren, selecteert u de optie voor het schrijven van de rij-BLOB-header. Zie converteren naar TSVvoor meer informatie over de door tabs gescheiden indeling die wordt gebruikt in azure machine learning.

    • ARFF: deze indeling biedt ondersteuning voor het opslaan van bestanden in de indeling die wordt gebruikt door de Fridge-toolset. Deze indeling wordt niet ondersteund voor bestanden die zijn opgeslagen in een SAS-URL. Zie Convert to ARFFvoor meer informatie over de ARFF-indeling.

  9. In cache opgeslagen resultaten gebruiken: Selecteer deze optie als u wilt voor komen dat de resultaten naar het blobbestand worden geschreven telkens wanneer u het experiment uitvoert. Als er geen andere wijzigingen zijn in de module parameters, schrijft het experiment de resultaten alleen de eerste keer dat de module wordt uitgevoerd of wanneer er wijzigingen in de gegevens zijn.

Voorbeelden

Voor voor beelden van het gebruik van de module gegevens exporteren , zie de Azure AI Gallery:

Technische opmerkingen

Deze sectie bevat implementatie details, tips en antwoorden op veelgestelde vragen.

Veelgestelde vragen

Hoe kan ik voor komen dat de gegevens worden geschreven als het experiment niet is gewijzigd

Wanneer de resultaten van uw experiment worden gewijzigd, wordt de nieuwe gegevensset altijd opgeslagen met de export gegevens . Als u het experiment echter herhaaldelijk uitvoert zonder wijzigingen aan te brengen die van invloed zijn op de uitvoer gegevens, kunt u de optie in cache opgeslagen resultaten gebruiken selecteren.

In de module wordt gecontroleerd of het experiment eerder dezelfde gegevens en dezelfde opties heeft uitgevoerd, en als een vorige uitvoering wordt gevonden, wordt de schrijf bewerking niet herhaald.

Kan ik gegevens opslaan in een account in een andere geografische regio

Ja, u kunt gegevens schrijven naar accounts in verschillende regio's. Als het opslag account echter zich in een andere regio bevindt dan het reken knooppunt dat voor het machine learning experiment wordt gebruikt, kan de toegang tot de gegevens trager worden. Ook worden er kosten in rekening gebracht voor inkomend en uitgaand verkeer op het abonnement.

Module parameters

Algemene opties

Naam Bereik Type Standaard Beschrijving
Gegevensbron Lijst Gegevens bron of sink Azure Blob Storage De doel locatie kan een bestand in azure BLOB Storage zijn, een Azure-tabel, een tabel of weer gave in een Azure SQL Database of een Hive-tabel.
In cache opgeslagen resultaten gebruiken WAAR/ONWAAR Boolean-waarde FALSE Module wordt alleen uitgevoerd als er geen geldige cache bestaat; Gebruik anders in cache opgeslagen gegevens uit eerdere uitvoering.
Geef een verificatie type op SAS/account AuthenticationType Account Geeft aan of SAS-of account referenties moeten worden gebruikt voor toegangs autorisatie

Open bare of SAS-open bare opslag opties

Naam Bereik Type Standaard Beschrijving
SAS-URI voor BLOB alle Tekenreeks geen De SAS-URI van de BLOB waarnaar moet worden geschreven (vereist)
Bestands indeling voor SAS-bestand ARFF

CSV

TSV
LoaderUtils. bestands type CSV Hiermee wordt aangegeven of het bestand CSV, TSV of ARFF is. lang
Rij met SAS-header schrijven WAAR/ONWAAR Boolean-waarde FALSE Hiermee wordt aangegeven of kolom koppen naar het bestand moeten worden geschreven

Account-persoonlijke opslag opties

Naam Bereik Type Standaard Beschrijving
Azure-account naam alle Tekenreeks geen Naam van Azure-gebruikers account
Azure-account sleutel alle SecureString geen Azure-opslag sleutel
Pad naar BLOB dat begint met container alle Tekenreeks geen De naam van het BLOB-bestand, beginnend met de container naam
Schrijf modus Azure Blob-opslag Lijst: fout, overschrijven Enum: BlobFileWriteMode Fout De methode voor het schrijven van BLOB-bestanden kiezen
Bestands indeling voor blob-bestand ARFF

CSV

TSV
LoaderUtils. bestands type CSV Hiermee wordt aangegeven of het BLOB-bestand CSV, TSV of ARFF is
Rij-header van BLOB schrijven WAAR/ONWAAR Boolean-waarde FALSE Hiermee wordt aangegeven of het BLOB-bestand een koprij moet bevatten

Uitzonderingen

Uitzondering Beschrijving
Fout 0027 Een uitzonde ring treedt op wanneer twee objecten dezelfde grootte hebben, maar niet.
Fout 0003 Een uitzonde ring treedt op als een of meer invoer waarden null of leeg zijn.
Fout 0029 Er treedt een uitzonde ring op wanneer een ongeldige URI wordt door gegeven.
Fout 0030 Er treedt een uitzonde ring op in wanneer het niet mogelijk is om een bestand te downloaden.
Fout 0002 Een uitzonde ring treedt op als een of meer para meters niet kunnen worden geparseerd of geconverteerd van het opgegeven type naar het type dat vereist is voor de doel methode.
Fout 0009 Een uitzonde ring treedt op als de naam van het Azure-opslag account of de container naam onjuist is opgegeven.
Fout 0048 Een uitzonde ring treedt op wanneer het niet mogelijk is om een bestand te openen.
Fout 0046 Er treedt een uitzonde ring op wanneer het niet mogelijk is om een map te maken op het opgegeven pad.
Fout 0049 Een uitzonde ring treedt op wanneer het niet mogelijk is om een bestand te parseren.

Zie machine learning fout codesvoor een lijst met fouten die specifiek zijn voor Studio-modules (Classic).

Zie Machine Learning rest API fout codesvoor een lijst met API-uitzonde ringen.

Zie ook

Gegevens importeren
Gegevens exporteren
Exporteren naar Azure SQL Database
Exporteren naar Hive-query
Exporteren naar Azure-tabel