Charger des fichiers dans un volume Unity Catalog

L’interface utilisateur Upload to volume vous permet de charger des fichiers dans n’importe quel format vers un volume Unity Catalog, y compris les données structurées, semi-structurées et non structurées. Consultez Créer et utiliser des volumes.

Les fichiers chargés ne peuvent pas dépasser cinq gigaoctets.

  • Dans Databricks Runtime 13.3 LTS et versions ultérieures, Databricks recommande d’utiliser des volumes pour stocker des bibliothèques .whl pour le calcul avec des modes d’accès attribués ou partagés.
  • Dans Databricks Runtime 13.3 LTS et versions ultérieures, Databricks recommande d’utiliser des volumes pour stocker des fichiers JAR et des scripts d’initialisation pour le calcul avec des modes d’accès attribués ou partagés.

Vous pouvez créer une table managée Unity Catalog à partir d’un fichier chargé. Consultez Créer une table à partir de volumes.

Vous pouvez également exécuter différentes charges de travail d’apprentissage automatique et de science des données sur des fichiers chargés sur un volume. En outre, vous pouvez charger des bibliothèques, des certificats et d’autres fichiers de configuration de formats arbitraires, tels que .whl ou .txt, que vous souhaitez utiliser pour configurer des bibliothèques de cluster, des bibliothèques délimitées aux notebooks ou des dépendances de travail.

Où pouvez-vous accéder à l’interface utilisateur pour charger des fichiers dans un volume ?

Vous pouvez accéder à cette interface utilisateur de plusieurs manières :

  • Dans la barre latérale, cliquez sur Nouveau>Ajouter des données>Charger des fichiers sur le volume.
  • Dans Catalog Explorer, cliquez sur Ajouter>Charger sur le volume. Vous pouvez également charger des fichiers directement sur un volume ou dans un répertoire d’un volume tout en parcourant les volumes dans Catalog Explorer.
  • À partir d’un notebook, en cliquant sur Fichier>Charger des fichiers sur le volume.

Remarque

Les volumes sont uniquement pris en charge dans Databricks Runtime 13.3 LTS et versions ultérieures. Dans Databricks Runtime 12.2 LTS et versions antérieures, les opérations sur les chemins d’accès /Volumes peuvent réussir, mais elles pourraient écrire des données sur des disques de stockage éphémères attachés à des clusters de calcul plutôt que de conserver les données dans les volumes Unity Catalog comme prévu.

Avant de commencer

Avant de charger des fichiers sur un volume Unity Catalog, vous devez disposer des éléments suivants :

  • Un espace de travail avec Unity Catalog activé. Pour plus d’informations, consultez Configurer et gérer Unity Catalog.
  • Le privilège WRITE VOLUME sur le volume sur lequel vous souhaitez charger des fichiers.
  • Le privilège USE SCHEMA sur le schéma parent
  • Le privilège USE CATALOG sur le catalogue parent.

Pour obtenir l’accès, consultez Privilèges Unity Catalog et objets sécurisables.

Étapes de chargement de fichiers sur un volume

Pour charger des fichiers sur un volume Unity Catalog, procédez comme suit :

  1. Cliquez sur Nouveau>Ajouter des données.
  2. Cliquez sur Charger des fichiers sur le volume.
  3. Sélectionnez un volume ou un répertoire à l’intérieur d’un volume, ou collez un chemin d’accès au volume.
    • S’il n’existe aucun volume dans le schéma cible, vous pouvez utiliser la boîte de dialogue pour créer un volume.
    • Si vous le souhaitez, vous pouvez créer un répertoire dans le volume cible en spécifiant le chemin complet du répertoire cible.
  4. Cliquez sur le bouton Parcourir ou faites un glisser-déposer des fichiers directement dans la zone de dépôt.