Delen via


Gecomprimeerd LZO-bestand

Vanwege licentiebeperkingen is de LZO-compressiecodec niet standaard beschikbaar op Azure Databricks-clusters. Als u een gecomprimeerd LZO-bestand wilt lezen, moet u een init-script gebruiken om de codec op het cluster te installeren tijdens het starten.

Notebook-voorbeeld: Gecomprimeerde Init LZO-bestanden

Het volgende notebook:

  • Hiermee wordt de LZO-codec gebouwd.
  • Hiermee maakt u een init-script dat:
    • Installeert de LZO-compressiebibliotheken en de lzop opdracht en kopieert de LZO-codec naar het juiste klassepad.
    • Hiermee configureert u Spark voor het gebruik van de LZO-compressiecodec.

Init LZO-gecomprimeerde bestandennotitieblok

Notebook downloaden

Notebook-voorbeeld: gecomprimeerde LZO-bestanden lezen

In het volgende notebook worden gecomprimeerde LZO-bestanden gelezen met behulp van de codec die door het init-script is geïnstalleerd:

Notebook met gecomprimeerde LZO-bestanden lezen

Notebook downloaden