Azure Data Lake Storage Gen2 URI

Ovladač systému souborů Hadoop, který je kompatibilní s Azure Data Lake Storage Gen2, je známý podle identifikátoru abfs schématu (Azure Blob File System). Ovladač ABFS je konzistentní s jinými ovladači systému souborů Hadoop a používá formát identifikátoru URI k adresování souborů a adresářů v rámci účtu s povoleným Data Lake Storage Gen2.

Syntaxe identifikátoru URI

Ovladač systému souborů Azure Blob je možné použít s koncovým bodem Data Lake Storage účtu i v případě, že tento účet nemá povolený hierarchický obor názvů. Pokud účet úložiště nemá hierarchický obor názvů, syntaxe zkráceného identifikátoru URI je:

abfs[s]1://<file_system>2@<account_name>3.dfs.core.windows.net/<path>4/<file_name>5
  1. Identifikátor schématu: Protokol abfs se používá jako identifikátor schématu. Pokud přidáte na s konec (abfss), bude klientský ovladač ABFS Hadoop vždy používat protokol TLS (Transport Layer Security) bez ohledu na zvolenou metodu ověřování. Pokud jako ověřování zvolíte OAuth, klientský ovladač bude vždy používat protokol TLS, i když místo abfss toho zadáteabfs, protože OAuth spoléhá výhradně na vrstvu PROTOKOLU TLS. Pokud se nakonec rozhodnete použít starší metodu klíče účtu úložiště, pak ovladač klienta interpretuje abfs tak, že nechcete používat protokol TLS.

  2. Systém souborů: Nadřazené umístění, ve kterém jsou soubory a složky. To je stejné jako kontejnery ve službě Azure Storage Blob Service.

  3. Název účtu: Název, který jste při vytváření dostali k vašemu účtu úložiště.

  4. Cesty: Reprezentace adresářové struktury s oddělovači (/) s oddělovači lomítka.

  5. Název souboru: Název jednotlivého souboru. Tento parametr je volitelný, pokud adresujete adresář.

Pokud ale účet, který chcete adresovat, má hierarchický obor názvů, syntaxe zkráceného identifikátoru URI je:

/<path>1/<file_name>2
  1. Cesta: Dopředné lomítko oddělené (/) reprezentace adresářové struktury.

  2. Název souboru: Název jednotlivého souboru.

Další kroky