Skapa en extern plats för att ansluta molnlagring till Azure Databricks
Den här artikeln beskriver hur du konfigurerar en extern plats i Unity Catalog för att ansluta molnlagring till Azure Databricks.
Externa platser associerar autentiseringsuppgifter för Unity Catalog-lagring med lagringscontainrar för molnobjekt. Externa platser används för att definiera hanterade lagringsplatser för kataloger och scheman och för att definiera platser för externa tabeller och externa volymer.
Du kan skapa en extern plats som refererar till lagring i en Azure Data Lake Storage Gen2-lagringscontainer eller Cloudflare R2-bucket.
Du kan skapa en extern plats med Hjälp av Catalog Explorer, Databricks CLI, SQL-kommandon i en notebook-fil eller Databricks SQL-fråga eller Terraform.
Kommentar
När du definierar en volym styrs moln-URI-åtkomst till data under volymsökvägen av volymens behörigheter.
Innan du börjar
Förutsättningar:
Du måste skapa Azure Data Lake Storage Gen2-lagringscontainern eller Cloudflare R2-bucketen som du vill använda som extern plats innan du skapar det externa platsobjektet i Azure Databricks.
Azure Data Lake Storage Gen2-lagringskonton som du använder som externa platser måste ha ett hierarkiskt namnområde.
Du måste ha en definierad lagringsautentiseringsuppgift i Azure Databricks som ger åtkomst till platsen för molnlagring. Se Skapa en lagringsautentiseringsuppgift för att ansluta till Azure Data Lake Storage Gen2 och Skapa en lagringsautentiseringsuppgift för anslutning till Cloudflare R2.
Behörighetskrav:
- Du måste ha behörighet för
CREATE EXTERNAL LOCATION
både metaarkivet och lagringsautentiseringsuppgifterna som refereras till på den externa platsen. Metaarkivadministratörer harCREATE EXTERNAL LOCATION
på metaarkivet som standard.
Skapa en extern plats med Hjälp av Katalogutforskaren
Du kan skapa en extern plats manuellt med Hjälp av Katalogutforskaren.
Behörigheter och förutsättningar: se Innan du börjar.
Så här skapar du den externa platsen:
Logga in på en arbetsyta som är kopplad till metaarkivet.
Klicka på Katalog i sidopanelen.
Klicka på knappen + Lägg till och välj Lägg till en extern plats.
Ange ett namn på en extern plats.
Du kan också kopiera containersökvägen från en befintlig monteringspunkt (endast Azure Data Lake Storage Gen2-containrar).
Om du inte kopierar från en befintlig monteringspunkt använder du FÄLTET URL för att ange den lagringscontainer eller R2-bucketsökväg som du vill använda som extern plats.
Exempel:
abfss://my-container-name@my-storage-account.dfs.core.windows.net/<path>
ellerr2://my-bucket@my-account-id.r2.cloudflarestorage.com/<path>
.Välj den lagringsautentiseringsuppgift som ger åtkomst till den externa platsen.
(Valfritt) Om du vill att användarna ska ha skrivskyddad åtkomst till den externa platsen klickar du på Avancerade alternativ och väljer Skrivskyddad. Mer information finns i Markera en extern plats som skrivskyddad.
Klicka på Skapa.
Bevilja behörighet att använda den externa platsen.
För att någon ska kunna använda den externa platsen måste du bevilja behörigheter:
- Om du vill använda den externa platsen för att lägga till en hanterad lagringsplats i metaarkiv, katalog eller schema beviljar du behörigheten
CREATE MANAGED LOCATION
. - Om du vill skapa externa tabeller eller volymer beviljar
CREATE EXTERNAL TABLE
ellerCREATE EXTERNAL VOLUME
.
Så här använder du Catalog Explorer för att bevilja behörigheter:
- Klicka på namnet på den externa platsen för att öppna informationsfönstret.
- På fliken Behörigheter klickar du på Bevilja.
- I dialogrutan Bevilja
<external location>
på väljer du användare, grupper eller tjänstens huvudnamn i fältet Huvudnamn och väljer den behörighet som du vill bevilja. - Klicka på Bevilja.
- Om du vill använda den externa platsen för att lägga till en hanterad lagringsplats i metaarkiv, katalog eller schema beviljar du behörigheten
Skapa en extern plats med SQL
Om du vill skapa en extern plats med SQL kör du följande kommando i en notebook-fil eller SQL-frågeredigeraren. Ersätt platshållarvärdena.
Behörigheter och förutsättningar: se Innan du börjar.
<location-name>
: Ett namn på den externa platsen. Omlocation_name
innehåller specialtecken, till exempel bindestreck (-
), måste det omges av backticks (` `
). Se Namn.<bucket-path>
: Sökvägen i molnklientorganisationen som den här externa platsen ger åtkomst till. Exempel:abfss://my-container-name@my-storage-account.dfs.core.windows.net/<path>
ellerr2://my-bucket@my-account-id.r2.cloudflarestorage.com/<path>
.<storage-credential-name>
: Namnet på lagringsautentiseringsuppgifterna som tillåter läsning från och skrivning till lagringscontainern eller bucketsökvägen. Om namnet på lagringsautentiseringsuppgifterna innehåller specialtecken, till exempel bindestreck (-
), måste det omges av backticks (` `
).
CREATE EXTERNAL LOCATION [IF NOT EXISTS] `<location-name>`
URL '<bucket-path>'
WITH ([STORAGE] CREDENTIAL `<storage-credential-name>`)
[COMMENT '<comment-string>'];
Nästa steg
- Ge andra användare behörighet att använda externa platser. Se Hantera externa platser.
- Definiera hanterade lagringsplatser med hjälp av externa platser. Se Ange en hanterad lagringsplats i Unity Catalog.
- Definiera externa tabeller med hjälp av externa platser. Se Skapa en extern tabell.
- Definiera externa volymer med hjälp av externa platser. Se Skapa och arbeta med volymer.
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för