Créer des bases de données et des tables

Effectué

Après avoir créé et démarré un entrepôt SQL, vous pouvez commencer à utiliser des données dans des tables.

Schéma de base de données

Tous les entrepôts SQL contiennent un schéma de base de données par défaut nommé default. Vous pouvez créer des tables dans ce schéma pour analyser les données. Toutefois, si vous devez utiliser plusieurs tables dans un schéma relationnel, ou si vous avez plusieurs charges de travail analytiques dont vous voulez gérer les données (et y accéder) séparément, vous pouvez créer un schéma de base de données personnalisé. Afin de créer une base de données, utilisez l’éditeur SQL pour exécuter une instruction SQL CREATE DATABASE ou CREATE SCHEMA. Ces instructions sont équivalentes, mais CREATE SCHEMA est recommandée, comme le montre cet exemple :

CREATE SCHEMA salesdata;

Conseil

Pour plus d’informations, consultez CREATE SCHEMA dans la documentation Azure Databricks.

Tables

Vous pouvez utiliser l’interface utilisateur dans le portail Azure Databricks pour charger des données délimitées ou importer des données à partir d’un large éventail de sources de données courantes. Les données importées sont stockées dans des fichiers dans le stockage DBFS (Système de fichiers Databricks) et la table Delta correspondante est définie dans le metastore Hive.

Si les fichiers de données existent déjà dans le stockage ou si vous devez définir un schéma explicite pour la table, vous pouvez utiliser une instruction SQL CREATE TABLE. Par exemple, le code suivant crée une table nommée salesorders dans la base de données salesdata, basée sur le dossier /data/sales/ dans le stockage DBFS.

CREATE TABLE salesdata.salesorders
(
    orderid INT,
    orderdate DATE,
    customerid INT,
    ordertotal DECIMAL
)
USING DELTA
LOCATION '/data/sales/';

Conseil

Pour plus d’informations, consultez CREATE TABLE dans la documentation Azure Databricks.