Share via


Herstellen einer Verbindung mit Dataiku

Dataiku ist eine End-to-End-KI-Plattform für Datenaufbereitung, AutoML und MLOps. Sie können Ihre Databricks SQL-Warehouses und Azure Databricks-Cluster in Dataiku integrieren.

Herstellen einer Verbindung mit Dataiku mithilfe von Partner Connect

Hinweis

Partner Connect unterstützt nur SQL-Warehouses für Dataiku. Um einen Cluster mit Dataiku zu verbinden, stellen Sie manuell eine Verbindung mit Dataiku her.

Gehen Sie wie folgt vor, um Ihren Azure Databricks-Arbeitsbereich mithilfe von Partner Connect mit Dataiku zu verbinden:

  1. Klicken Sie auf der Seitenleiste auf die Schaltfläche „Partner Connect“Partner Connect.

  2. Klicken Sie auf die Schaltfläche „Partner“.

    Hinweis

    Wenn die Kachel „Dataiku“ ein Häkchensymbol enthält, hat ein Administrator oder eine Administratorin bereits Partner Connect verwendet, um Dataiku mit Ihrem Arbeitsbereich zu verbinden. Fahren Sie mit Schritt 5 fort. Der Partner verwendet die E-Mail-Adresse für Ihr Azure Databricks-Konto, um Sie aufzufordern, sich bei Ihrem bestehenden Dataiku-Konto anzumelden.

  3. Wählen Sie in der Dropdownliste einen Katalog aus, und klicken Sie dann auf Weiter.

    Hinweis

    Wenn für Ihren Arbeitsbereich Unity Catalog aktiviert ist, der Partner Unity Catalog mit Partner Connect jedoch nicht unterstützt, wird der Standardkatalog des Arbeitsbereichs verwendet. Wenn Unity Catalog für Ihren Arbeitsbereich nicht aktiviert ist, wird hive_metastore verwendet.

  4. Wählen Sie in der Dropdownliste ein Schema aus, und klicken Sie dann auf Hinzufügen. Sie können diesen Schritt wiederholen, um mehrere Schemas hinzuzufügen.

  5. Klicken Sie auf Weiter.

    Partner Connect erstellt die folgenden Ressourcen in Ihrem Arbeitsbereich:

    Partner Connect gewährt dem <PARTNER>_USER-Dienstprinzipal außerdem die folgenden Berechtigungen:

    • (Unity-Katalog) USE CATALOG: Erforderlich für die Interaktion mit Objekten innerhalb des ausgewählten Katalogs.
    • (Unity Catalog) USE SCHEMA: Ermöglicht das Lesen der ausgewählten Schemas.
    • (Unity-Katalog) CREATE SCHEMA: Gewährt die Möglichkeit, im ausgewählten Katalog Schemas zu erstellen.
    • (Legacy-Hive-Metastore) USAGE: Erforderlich für die Interaktion mit Objekten innerhalb von hive_metastore und den ausgewählten Schemas.
    • (Legacy Hive-Metastore) CREATE: Ermöglicht die Erstellung eines Schemas in hive_metastore.
    • (Hive-Legacymetastore) READ_METADATA: Weist die Berechtigung zum Lesen von Metadaten für die ausgewählten Schemas zu.
    • (Legacy-Hive-Metastore) SELECT: Ermöglicht das Lesen der ausgewählten Schemas.
  6. Klicken Sie auf Weiter.

    Das Feld E-Mail enthält die E-Mail-Adresse für Ihr Azure Databricks-Konto. Dataiku verwendet diese E-Mail-Adresse, um Sie aufzufordern, entweder ein neues Partner-Konto zu erstellen oder sich bei Ihrem bereits vorhandenen Partner-Konto anzumelden.

  7. Klicken Sie auf Mit Dataiku verbinden oder Anmelden.

    In Ihrem Webbrowser wird ein neuer Tab mit der Dataiku-Website geöffnet.

  8. Führen Sie die Anweisungen auf dem Bildschirm der Dataiku-Website aus, um Ihr Dataiku-Testkonto zu erstellen oder sich bei Ihrem vorhandenen Dataiku-Konto anzumelden.

Manuelles Herstellen einer Verbindung mit Dataiku

In diesem Abschnitt wird beschrieben, wie Sie ein vorhandenes SQL-Warehouse oder einen Cluster in Ihrem Azure Databricks-Arbeitsbereich manuell mit Dataiku verbinden.

Hinweis

Für Databricks SQL-Warehouses können Sie eine Verbindung mit Dataiku herstellen, indem Sie Partner Connect verwenden, um den Vorgang zu vereinfachen.

Anforderungen

Bevor Sie manuell eine Verbindung mit Dataiku herstellen, benötigen Sie Folgendes:

  • Ein Cluster oder SQL-Warehouse in Ihrem Azure Databricks-Arbeitsbereich

  • Die Verbindungsdetails für Ihren Cluster oder Ihr SQL-Warehouse, insbesondere die Werte Serverhostname, Hafen und HTTP-Pfad

  • Ein persönliches Azure Databricks-Zugriffstoken oder ein Microsoft Entra ID-Token (früher Azure Active Directory). Gehen Sie wie folgt vor, um ein persönliches Zugriffstoken zu erstellen:

    1. Wählen Sie in Ihrem Azure Databricks-Arbeitsbereich in der oberen Leiste Ihren Azure Databricks-Benutzernamen und dann im Dropdownmenü die Option Einstellungen aus.
    2. Klicken Sie auf Entwickler.
    3. Klicken Sie neben Zugriffstoken auf Verwalten.
    4. Klicken Sie auf Neues Token generieren.
    5. (Optional) Geben Sie einen Kommentar ein, durch den Sie dieses Token in Zukunft identifizieren können, und ändern Sie die standardmäßige Lebensdauer des Tokens von 90 Tagen. Wenn Sie ein Token ohne Gültigkeitsdauer erstellen möchten (nicht empfohlen), lassen Sie das Feld Lebensdauer (Tage) leer.
    6. Klicken Sie auf Generate (Generieren) .
    7. Kopieren Sie das angezeigte Token an einen sicheren Speicherort, und klicken Sie auf Fertig.

    Hinweis

    Achten Sie darauf, den kopierten Token an einem sicheren Ort zu speichern. Geben Sie das kopierte Token nicht an andere Personen weiter. Wenn Sie das kopierte Token verlieren, können Sie das gleiche Token nicht erneut generieren. Stattdessen müssen Sie erneut das Verfahren zum Erstellen eines neuen Tokens durchlaufen. Wenn Sie das kopierte Token verlieren oder glauben, dass das Token kompromittiert wurde, empfiehlt Databricks dringend, dass Sie das Token sofort aus Ihrem Arbeitsbereich löschen. Klicken Sie hierzu auf der Seite Zugriffstoken auf das Papierkorbsymbol (Widerrufen) neben dem Token.

    Wenn Sie in Ihrem Arbeitsbereich keine Token erstellen oder verwenden können, liegt dies möglicherweise daran, dass Ihr Arbeitsbereichsadministrator Token deaktiviert hat oder Ihnen keine Berechtigung zum Erstellen oder Verwenden von Token erteilt hat. Wenden Sie sich an Ihren Arbeitsbereichsadministrator oder lesen Sie:

    Hinweis

    Als bewährte Methode für die Sicherheit empfiehlt Databricks, dass Sie bei der Authentifizierung mit automatisierten Tools, Systemen, Skripten und Anwendungen persönliche Zugriffstoken verwenden, die zu Dienstprinzipalen und nicht zu Benutzern des Arbeitsbereichs gehören. Informationen zum Erstellen von Token für Dienstprinzipale finden Sie unter Verwalten von Token für einen Dienstprinzipal.

Schritte zum Herstellen einer Verbindung

Wenn Sie eine manuelle Verbindung mit Dataiku herstellen möchten, befolgen Sie die Anweisungen zu Databricks in der Dataiku-Dokumentation.

Zusätzliche Ressourcen

Erkunden Sie die folgenden Dataiku-Ressourcen: