Databricks ODBC et pilotes JDBC

Cet article explique comment configurer les pilotes ODBC et JDBC Databricks pour connecter vos outils ou clients à Azure Databricks. Pour obtenir des instructions de connexion spécifiques à l’outil ou au client, consultez le Guide d’intégration Databricks.

Spécifications

Avant de commencer, vous devez vous assurer que vous disposez des autorisations appropriées pour vous connecter à Azure Databricks, pour préparer vos informations d’identification et pour récupérer les détails de connexion.

Spécifications relatives aux autorisations

Vous pouvez avoir besoin de deux autorisations lorsque vous vous connectez à un clusterAzure Databricks :

  • Peut être attaché à l’autorisation de se connecter au cluster en cours d’exécution.
  • Peut redémarrer l’autorisation de déclencher automatiquement le démarrage du cluster si son état est terminé lors de la connexion.

pour accéder à un point de terminaisonde SQL Databricks, vous devez utiliserl'autorisation. le point de terminaison de SQL Databricks est démarré automatiquement s’il a été arrêté.

Conditions d’authentification

les pilotes ODBC et JDBC Databricks prennent en charge l’authentification à l’aide d’un jeton d’accès personnel ou d’un jeton Azure Active Directory.

Récupérer les détails de la connexion

Cette section explique comment récupérer les détails de connexion dont vous avez besoin pour vous connecter à Azure Databricks.

Obtenir les détails de connexion pour un cluster

  1. Cliquez sur calcul icônecalcul dans la barre latérale.
  2. Choisissez un cluster auquel vous connecter.
  3. Accédez à Options avancées.
  4. Cliquez sur l’onglet JDBC/ODBC .
  5. Copiez les détails de connexion.

obtenir les détails de connexion pour un point de terminaison de SQL

  1. cliquez sur l' icône des points de terminaisonSQL points de terminaison dans la barre latérale.
  2. Choisissez un point de terminaison auquel se connecter.
  3. Accédez à l’onglet Détails de la connexion .
  4. Copiez les détails de connexion.

Pilote ODBC

Cette section présente les étapes de configuration de votre pilote ODBC pour la connexion à Azure Databricks.

Télécharger le pilote ODBC

Passez en revue le contrat de licence pour le pilote ODBC Databricks avant d’installer le logiciel.

Certains outils et clients requièrent que vous installiez le pilote ODBC Databricks pour configurer une connexion à Azure Databricks, tandis que d’autres incorporent le pilote et ne nécessitent pas d’installation distincte. par exemple, pour utiliser Tableau Desktop, le pilote ODBC doit être installé, tandis que les versions récentes de Power BI Desktop incluent le pilote préinstallé et aucune action n’est nécessaire.

Accédez à la page de téléchargement du pilote DATABRICKS ODBC pour télécharger le pilote de votre système d’exploitation.

Après avoir téléchargé le programme d’installation approprié du pilote pour votre plateforme, suivez les instructions ci-dessous pour installer et configurer le pilote :

Installer et configurer le pilote ODBC pour Windows

dans Windows, vous pouvez configurer une configuration de nom de Source de données (DSN) pour connecter votre application cliente ODBC à Azure Databricks. pour configurer une configuration de source de données, utilisez l’Windows administrateur de la Source de données ODBC.

  1. téléchargez la dernière version du pilote pour Windows, si vous ne l’avez pas déjà fait. Consultez Télécharger le pilote ODBC.
  2. Double-cliquez sur le fichier téléchargé .msi pour installer le pilote. Le répertoire d’installation est C:\Program Files\Simba Spark ODBC Driver .
  3. à partir de la menu Démarrer, recherchez des Sources de données odbc pour lancer l’administrateur de la Source de données odbc.
  4. Accédez à l’onglet pilotes pour vérifier que le pilote (pilote ODBC Simba Spark) est installé.
  5. Accédez à l’onglet DSN utilisateur ou DSN système , puis cliquez sur le bouton Ajouter .
  6. Sélectionnez le pilote ODBC Simba Spark dans la liste des pilotes installés.
  7. Choisissez un nom de source de données et définissez les paramètres de connexion et de configuration ODBCobligatoires. Pour plus d’informations sur les configurations de pilotes, voir aussi fonctionnalités du pilote ODBC .
  8. Cliquez sur OK pour créer le DSN.

Installer et configurer le pilote ODBC pour macOS

Dans macOS, vous pouvez configurer une configuration de nom de source de données (DSN) pour connecter votre application cliente ODBC à Azure Databricks. Pour configurer un DSN sur macOS, utilisez le Gestionnaire ODBC.

  1. Téléchargez le gestionnaire ODBC et double-cliquez sur le .dmg fichier téléchargé pour l’installer.
  2. Téléchargez la dernière version de pilote pour macOS, si vous ne l’avez pas déjà fait. Consultez Télécharger le pilote ODBC.
  3. Double-cliquez sur le fichier téléchargé .dmg pour installer le pilote. Le répertoire d’installation est /Library/simba/spark .
  4. Démarrez le gestionnaire ODBC.
  5. Accédez à l’onglet pilotes pour vérifier que le pilote (pilote ODBC Simba Spark) est installé.
  6. Accédez à l’onglet DSN utilisateur ou DSN système , puis cliquez sur le bouton Ajouter .
  7. Sélectionnez le pilote ODBC Simba Spark dans la liste des pilotes installés.
  8. Cliquez sur Ajouter.
  9. Choisissez un nom de source de données et créez des paires clé-valeur pour définir les paramètres de connexion et de configuration ODBCobligatoires. Pour plus d’informations sur les configurations de pilotes, voir aussi fonctionnalités du pilote ODBC .
  10. Cliquez sur OK pour créer le DSN.

Installer et configurer le pilote ODBC pour Linux

Dans Linux, vous pouvez configurer une configuration de nom de source de données (DSN) pour connecter votre application cliente ODBC à Azure Databricks. Pour configurer un DSN sur Linux, utilisez le gestionnaire de pilotes unixodbc .

  1. Installez unixodbc.

  2. Téléchargez la dernière version du pilote pour Linux, si vous ne l’avez pas déjà fait. Consultez Télécharger le pilote ODBC.

  3. Installez le pilote ODBC.

    • Package RPM :

      sudo yum --nogpgcheck localinstall simbaspark_<version>.rpm
      
    • Paquet DEB :

      sudo dpkg -i simbaspark_<version>.deb
      

    Le répertoire d’installation est /opt/simba/spark .

  4. Localisez le odbc.ini fichier de configuration du pilote qui correspond à SYSTEM DATA SOURCES :

    odbcinst -j
    
  5. Dans un éditeur de texte, ouvrez le odbc.ini fichier de configuration.

  6. Créez une [ODBC Data Sources] section :

    [ODBC Data Sources]
    Databricks=Databricks ODBC Connector
    
  7. Créez une autre section portant le même nom que votre DSN et spécifiez les paramètres de configuration sous forme de paires clé-valeur. Pour plus d’informations sur la définition des paramètres de configuration, consultez les paramètres de connexion et de configuration ODBC obligatoires. Pour plus d’informations sur les configurations de pilotes, voir aussi fonctionnalités du pilote ODBC .

    [Databricks]
    Driver=<path-to-driver>
    <key>=<value>
    ...
    

Configuration ODBC et paramètres de connexion

Cette section présente les paramètres de configuration et de connexion obligatoires pour le pilote ODBC.

Configuration Description
Pilote Chemin d’installation du pilote
Host Nom d’hôte du serveur Azure Databricks
Port 443
HTTPPath Azure Databricks l’URL des ressources de calcul
SSL 1
ThriftTransport 2

Paramètres d’authentification

Pour vous authentifier à l’aide d’un jeton d’accès personnel, définissez les configurations suivantes :

Configuration Description
AuthMech 3
Identificateur d’utilisateur token
PWD

lorsque vous utilisez Azure Active Directory l’authentification, les configurations que vous devez définir sont les suivantes :

Configuration Description
AuthMech 11
Auth_Flow 0
Auth_AccessToken jeton Azure Active Directory

Définissez la chaîne de connexion à utiliser dans votre application comme suit :

Driver=<path-to-driver>;Host=<server-hostname>;Port=443;HTTPPath=<http-path>;ThriftTransport=2;SSL=1;AuthMech=3;UI=token;PWD=<personal-access-token>

Définissez les configurations hôte et HTTPPath sur les valeurs que vous avez récupérées dans récupérer les détails de la connexion.

exemples de DSN pour les ordinateurs non-Windows

Voici quelques exemples qui montrent comment configurer un DSN sur différentes plateformes en fonction de votre méthode d’authentification.

Lorsque vous vous authentifiez avec un jeton d’accès personnel, procédez comme suit :

  1. Définissez le contenu du odbc.ini sur :

    [Databricks]
    Driver=<path-to-driver>
    Host=<server-hostname>
    Port=443
    HTTPPath=<http-path>
    ThriftTransport=2
    SSL=1
    AuthMech=3
    UID=token
    PWD=<personal-access-token>
    
  2. Définissez <personal-access-token> sur le jeton que vous avez récupéré dans la <personal-access-token>.

  3. Définissez les configurations hôte, PORT et HTTPPath sur les valeurs que vous avez récupérées dans récupérer les détails de la connexion.

  4. Utilisez le nom de source de nom dans votre application ODBC en définissant la propriété DSN dans la chaîne de connexion DSN=Databricks; .

lorsque vous utilisez Azure Active Directory authentification par jeton, procédez comme suit :

  1. Définissez le contenu du odbc.ini fichier sur :

    [Databricks]
    Driver=<path-to-driver>
    HOST=<server-hostname>
    PORT=443
    HTTPPath=<http-path>
    ThriftTransport=2
    SSL=1
    AuthMech=11
    Auth_Flow=0
    Auth_AccessToken=<Azure AD token>
    
  2. définissez <Azure AD token> sur le jeton de Azure Active Directory que vous avez récupéré dans la <Azure AD token>.

  3. Définissez les configurations hôte, PORT et HTTPPath sur les valeurs que vous avez récupérées dans récupérer les détails de la connexion.

  4. Utilisez le nom de source de nom dans votre application ODBC en définissant la propriété DSN dans la chaîne de connexion DSN=Databricks; .

Fonctionnalités du pilote ODBC

Cette section présente les configurations de pilote ODBC facultatives.

Prise en charge des requêtes natives

le pilote ODBC accepte les requêtes SQL dans le dialecte SQL-92 ANSI et traduit les requêtes en dialecte SQL Databricks. toutefois, si votre application génère Databricks SQL directement ou si votre application utilise une syntaxe de SQL standard non-ANSI SQL-92 spécifique à Azure Databricks, Databricks vous recommande de définir UseNativeQuery=1 comme configuration de connexion. avec ce paramètre, le pilote transmet le SQL interroge verbatim pour Azure Databricks.

Guide du pilote ODBC

Pour plus d’informations sur le pilote ODBC, reportez-vous au Guide d’installation et de configuration : Simba Apache Spark ODBC Connector Install and Configuration Guide . L’emplacement du Guide d’installation et de configuration du pilote ODBC Databricks dépend de votre plateforme :

  • MacOS : /Library/simba/spark
  • Linux : /opt/simba/spark
  • Windows : C:\Program Files\Simba Spark ODBC Driver

Pilote JDBC

Cette section présente les étapes permettant de configurer votre pilote JDBC pour se connecter à Azure Databricks.

Télécharger le pilote JDBC

  1. Accédez à la page de téléchargement du pilote JDBC Databricks pour télécharger le pilote.
  2. Le pilote est empaqueté en tant que fichier JAR, ce qui ne nécessite pas d’installation et peut être ajouté à la variable CLASSPATH Java.

Configuration JDBC et paramètres de connexion

Pour l’authentification à l’aide d’un jeton personnel, procédez comme suit :

  1. Récupérez l’URL JDBC que vous avez récupérée dans récupérer les détails de la connexion.

  2. Remplacez <personal-access-token> par le jeton que vous avez créé dans la <personal-access-token>:

    jdbc:spark://<server-hostname>:443/default;transportMode=http;ssl=1;httpPath=<http-path>;AuthMech=3;UID=token;PWD=<personal-access-token>
    

pour vous authentifier à l’aide d’un jeton Azure Active Directory, procédez comme suit :

  1. Récupérez l’URL JDBC que vous avez récupérée dans récupérer les détails de la connexion.

  2. Supprimer les paramètres d’authentification pour le nom d’utilisateur et le mot de passe ( AuthMech , UID , PWD ) :

    jdbc:spark://<server-hostname>:443/default;transportMode=http;ssl=1;httpPath=<http-path>;AuthMech=3;UID=token;PWD=<personal-access-token>;
    
  3. ajoutez les paramètres suivants, en remplaçant <Azure AD token> par le jeton Azure AD que vous avez obtenu dans la <Azure AD token>.

    AuthMech=11;Auth_Flow=0;Auth_AccessToken=<Azure AD token>
    

Fonctionnalités du pilote JDBC

Cette section présente les configurations de pilote JDBC facultatives.

Définir l’espace de noms initial

Le pilote JDBC vous permet de spécifier le schéma en ajoutant le <schema-name> au nom d’hôte et au port du serveur, comme suit :

jdbc:spark://<server-hostname>:443/<schema-name>

Prise en charge des requêtes natives

le pilote JDBC accepte les requêtes SQL dans le dialecte SQL-92 ANSI et traduit les requêtes en dialecte SQL Databricks. toutefois, si votre application génère Databricks SQL directement ou si votre application utilise une syntaxe de SQL standard non-ANSI SQL-92 spécifique à Azure Databricks, Databricks vous recommande de définir UseNativeQuery=1 comme configuration de connexion. avec ce paramètre, le pilote transmet le SQL interroge verbatim pour Azure Databricks.

Guide du pilote JDBC

Pour plus d’informations sur le pilote JDBC, reportez-vous au Guide d’installation et de configuration. Recherchez le Guide d’installation et de configuration du pilote JDBC Databricks dans le docs répertoire du package de pilotes.

Dépannage

Consultez résolution des problèmes de connexions JDBC et ODBC.

Voir aussi