關於 Azure Databricks 的常見問題集

本文列出您可能與 Azure Databricks 相關的常見問題。 它也會列出您在使用 Databricks 時可能遇到的一些常見問題。 如需詳細資訊,請參閱 什麼是 Azure Databricks

我可以使用 Azure 金鑰保存庫 來儲存要用於 Azure Databricks 的密鑰/秘密嗎?

是。 您可以使用 Azure 金鑰保存庫 來儲存金鑰/秘密,以便與 Azure Databricks 搭配使用。 如需詳細資訊,請參閱 Azure 金鑰保存庫 支援的範圍

我可以搭配 Databricks 使用 Azure 虛擬網絡 嗎?

是。 您可以使用 Azure 虛擬網絡 (VNET) 搭配 Azure Databricks。 如需詳細資訊,請參閱在 Azure 虛擬網絡 中部署 Azure Databricks。

如何? 從筆記本存取 Azure Data Lake 儲存體?

執行下列步驟:

  1. 在 Microsoft Entra ID(先前稱為 Azure Active Directory)中,布建服務主體,並記錄其密鑰。
  2. 將必要的許可權指派給 Data Lake 儲存體 中的服務主體。
  3. 若要存取 Data Lake 儲存體 中的檔案,請使用 Notebook 中的服務主體認證。

如需詳細資訊,請參閱搭配 Azure Databricks 使用 Azure Data Lake 儲存體。

修正常見問題

以下是您可能遇到 Databricks 的幾個問題。

問題:此訂用帳戶未註冊為使用命名空間 'Microsoft.Databricks'

錯誤訊息

「此訂用帳戶未註冊為使用命名空間 『Microsoft.Databricks』。 如需如何註冊訂用帳戶,請參閱 https://aka.ms/rps-not-found 。 (代碼:MissingSubscriptionRegistration)”

解決方案

  1. 前往 Azure 入口網站
  2. 選取 [ 訂用帳戶]、您使用的訂用帳戶,然後選取 [資源提供者]。
  3. 在資源提供者清單中,針對 Microsoft.Databricks,選取 [ 註冊]。 您必須擁有訂用帳戶上的參與者或擁有者角色,才能註冊資源提供者。

問題:您的帳戶 {email} 在 Azure 入口網站 的 Databricks 工作區資源上沒有擁有者或參與者角色

錯誤訊息

「您的帳戶 {email} 在 Azure 入口網站 的 Databricks 工作區資源上沒有擁有者或參與者角色。 如果您是租使用者中的來賓使用者,也可能會發生此錯誤。 要求系統管理員授與您存取權,或直接在 Databricks 工作區中將您新增為使用者。」(代碼:AADSTS90015)

解決方案

以下是此問題的一些解決方案:

如果您是在 Databricks 工作區資源上沒有擁有者或參與者角色的 Azure Databricks 使用者,而且您只想存取工作區:

  • 您應該使用網址直接存取它(例如 , https://adb-5555555555555555.19.azuredatabricks.net。 請勿在 Azure 入口網站 中使用 [啟動工作區] 按鈕。

如果您預期會在工作區資源上辨識為擁有者或參與者:

  • 若要初始化租使用者,您必須以租使用者的一般使用者身分登入,而不是來賓使用者。 您也必須在 Databricks 工作區資源上擁有參與者或擁有者角色。 系統管理員可以從 Azure 入口網站 中 Azure Databricks 工作區內的 [存取控制][IAM] 索引標籤,將角色授與使用者。

  • 如果您的電子郵件功能變數名稱已指派給 Microsoft Entra ID(先前稱為 Azure Active Directory)中的多個目錄,也可能會發生此錯誤。 若要解決此問題,請在目錄中建立包含 Databricks 工作區訂用帳戶的新使用者。

    a. 在 Azure 入口網站 中,移至 Microsoft Entra ID(先前稱為 Azure Active Directory)。 選取 [使用者和群組>] [新增使用者]。

    b. 使用 @<tenant-name>.onmicrosoft.com 電子郵件新增使用者, @<your-domain> 而不是電子郵件。 您可以在 [自定義網域] 的 [Microsoft Entra ID] 下,於 [Azure 入口網站] 底下找到此選項

    c. 將 Databricks 工作區資源上的參與者角色授與此新使用者

    d. 使用新使用者登入 Azure 入口網站,並尋找 Databricks 工作區。

    e. 以此使用者身分啟動 Databricks 工作區。

問題:您的帳戶 {email} 尚未在 Databricks 中註冊

解決方案

如果您未建立工作區,而且您新增為使用者,請連絡建立工作區的人員。 讓該人員使用 Azure Databricks 管理員 控制台來新增您。 如需指示,請參閱 新增和管理使用者。 如果您已建立工作區,但仍收到此錯誤,請嘗試從 Azure 入口網站 再次選取 [初始化工作區]。

問題:設定叢集時雲端提供者啟動失敗 (PublicIPCountLimitReached)

錯誤訊息

「雲端提供者啟動失敗:設定叢集時發生雲端提供者錯誤。 如需詳細資訊,請參閱 Databricks 指南。 Azure 錯誤碼:PublicIPCountLimitReached。 Azure 錯誤訊息:無法在此區域中為此訂用帳戶建立超過 10 個公用 IP 位址。

背景

Databricks 叢集會針對每個節點使用一個公用IP位址(包括驅動程序節點)。 Azure 訂用帳戶每個區域都有 公用IP位址限制 。 因此,如果叢集建立和相應增加作業會導致配置給該區域中該訂用帳戶的公用IP位址數目超過限制,可能會失敗。 此限制也包含為非 Databricks 使用量配置的公用 IP 位址,例如自定義使用者定義的 VM。

一般而言,叢集只會在作用中時取用公用IP位址。 不過, PublicIPCountLimitReached 即使其他叢集終止,錯誤仍可能會持續短時間內發生。 這是因為當叢集終止時,Databricks 會暫時快取 Azure 資源。 資源快取是設計方式,因為它可大幅降低許多常見案例中叢集啟動和自動調整的延遲。

解決方案

如果您的訂用帳戶已達到指定區域的公用IP位址限制,則您應該執行下列其中一項或其他動作。

  • 在不同的 Databricks 工作區中建立新的叢集。 其他工作區必須位於您尚未達到訂用帳戶公用IP位址限制的區域。
  • 要求增加您的公用IP位址限制。 選擇 [配額 ] 作為 [問題類型],然後選擇 [網络:ARM ] 作為 [配額類型]。 在 [詳細數據] 中,要求增加公用IP位址配額。 例如,如果您的限制目前為 60,而且您想要建立 100 個節點的叢集,請要求將限制增加至 160。

問題:設定叢集時第二種類型的雲端提供者啟動失敗(MissingSubscriptionRegistration)

錯誤訊息

「雲端提供者啟動失敗:設定叢集時發生雲端提供者錯誤。 如需詳細資訊,請參閱 Databricks 指南。 Azure 錯誤碼:MissingSubscriptionRegistration Azure 錯誤訊息:訂用帳戶未註冊為使用命名空間 'Microsoft.Compute'。 如需如何註冊訂用帳戶,請參閱 https://aka.ms/rps-not-found 。」

解決方案

  1. 前往 Azure 入口網站
  2. 選取 [ 訂用帳戶]、您使用的訂用帳戶,然後選取 [資源提供者]。
  3. 在資源提供者清單中,針對 Microsoft.Compute 選取 [ 註冊]。 您必須擁有訂用帳戶上的參與者或擁有者角色,才能註冊資源提供者。

如需更詳細的指示,請參閱 資源提供者和類型

問題:Azure Databricks 需要許可權,才能存取組織中只有系統管理員可以授與的資源。

背景

Azure Databricks 與 Microsoft Entra ID 整合(先前稱為 Azure Active Directory)。 您可以藉由指定 Microsoft Entra ID(先前稱為 Azure Active Directory)的使用者,在 Azure Databricks 中設定許可權(例如,在筆記本或叢集上)。 若要讓 Azure Databricks 能夠列出您 Microsoft Entra ID(先前稱為 Azure Active Directory)的用戶名稱,它需要該資訊的讀取許可權,並取得同意。 如果尚未提供同意,您會看到錯誤。

解決方案

以全域系統管理員身分登入 Azure 入口網站。 針對 Microsoft Entra ID(先前稱為 Azure Active Directory),請移至 [設定] 索引卷標,並確定 [使用者可以同意代表他們存取公司數據的應用程式] 設定為 [是]。

問題:Azure Databricks 不支援在以漢字建立的 Azure 資源群組下建立工作區。

解決方案

在工作區建立時,此案例的驗證支援將會在更新版本中新增。

下一步