Usare l'URI di Azure Data Lake Storage Gen2

Il driver di file system Hadoop compatibile con Azure Data Lake Storage Gen2 è noto per l'identificatore di schema abfs (file system del BLOB di Azure). Coerentemente con altri driver del file system Hadoop, il driver ABFS usa un formato URI per indirizzare file e directory all'interno di un account abilitato Data Lake Storage Gen2.

Sintassi dell'URI

Il driver del file system BLOB di Azure può essere usato con l'endpoint Data Lake Storage di un account anche se tale account non dispone di uno spazio dei nomi gerarchico abilitato. Se l'account di archiviazione non dispone di uno spazio dei nomi gerarchico, la sintassi URI abbreviata è:

abfs[s]1://<file_system>2@<account_name>3.dfs.core.windows.net/<path>4/<file_name>5
  1. Identificatore di schema: il protocollo abfs viene usato come identificatore di schema. Se si aggiunge un s elemento alla fine (abfss), il driver client Hadoop ABFS userà sempre Transport Layer Security (TLS) indipendentemente dal metodo di autenticazione scelto. Se si sceglie OAuth come autenticazione, il driver client userà sempre TLS anche se si specifica abfs invece di abfss perché OAuth si basa esclusivamente sul livello TLS. Infine, se si sceglie di usare il metodo precedente di chiave dell'account di archiviazione, il driver client interpreta abfs per indicare che non si vuole usare TLS.

  2. File system: il percorso padre che contiene i file e le cartelle. Corrisponde ai contenitori nel servizio BLOB di Archiviazione di Azure.

  3. Nome dell'account: il nome assegnato all'account di archiviazione durante la creazione.

  4. Percorso: una rappresentazione della struttura della directory delimita da una barra (/).

  5. Nome del file: il nome del singolo file. Questo parametro è facoltativo se si sta indirizzando a una directory.

Tuttavia, se l'account a cui si vuole indirizzare ha uno spazio dei nomi gerarchico, la sintassi URI abbreviata è:

/<path>1/<file_name>2
  1. Percorso: una rappresentazione della struttura della directory delimita da una barra (/).

  2. Nome file: nome del singolo file.

Passaggi successivi