Gegevensbronnen
In deze sectie worden de Apache Spark-gegevensbronnen beschreven die u kunt gebruiken in Azure Databricks. Veel bevatten een notebook dat laat zien hoe u de gegevensbron kunt gebruiken om gegevens te lezen en te schrijven.
De volgende gegevensbronnen worden direct ondersteund in Databricks Runtime of vereisen eenvoudige shell-opdrachten om toegang in te schakelen:
- Avro-bestand
- Binair bestand
- CSV-bestand
- Hive-tabel
- Installatiekopie
- JSON-bestand
- Gecomprimeerd LZO-bestand
- MLflow-experiment
- Parquet-bestand
- XML-bestand
- ZIP-bestanden
Raadpleeg Algemene functies voor laden/opslaan en Algemene opties voor bestandsbronnen voor meer informatie over Apache Spark-gegevensbronnen.
Voor de volgende gegevensbronnen voor opslag moet u de verbinding met de opslag configureren. Sommige vereisen ook dat u een Azure Databricks-bibliotheek maakt en installeert op een cluster: