Rychlý start: Interaktivní transformace dat pomocí Apache Sparku ve službě Azure Machine Učení

Pro zpracování interaktivního uspořádání dat poznámkového bloku Učení poznámkového bloku poskytuje integrace Azure Machine Učení s Azure Synapse Analytics snadný přístup k rozhraní Apache Spark. Tento přístup umožňuje interaktivní transformaci dat ve službě Azure Machine Učení Notebook.

V této úvodní příručce se dozvíte, jak provádět interaktivní transformace dat pomocí azure Machine Učení bezserverové výpočetní prostředí Spark, účtu úložiště Azure Data Lake Storage (ADLS) Gen2 a předávání identity uživatele.

Požadavky

Ukládání přihlašovacích údajů účtu úložiště Azure jako tajných kódů ve službě Azure Key Vault

Pokud chcete přihlašovací údaje účtu úložiště Azure uložit jako tajné kódy ve službě Azure Key Vault, s uživatelským rozhraním webu Azure Portal:

  1. Na webu Azure Portal přejděte do služby Azure Key Vault.

  2. Výběr tajných kódů z levého panelu

  3. Výběr a vygenerování/importu

    Snímek obrazovky znázorňující kartu Generování nebo import tajných kódů služby Azure Key Vault

  4. Na obrazovce Vytvořit tajný kód zadejte název tajného kódu, který chcete vytvořit.

  5. Na webu Azure Portal přejděte na účet služby Azure Blob Storage, jak je znázorněno na tomto obrázku:

    Snímek obrazovky znázorňující přístupový klíč Azure a obrazovku s hodnotami připojovací řetězec

  6. Výběr přístupových klíčů na levém panelu účtu služby Azure Blob Storage

  7. Vyberte Zobrazit vedle klíče 1 a pak zkopírujte do schránky a získejte přístupový klíč účtu úložiště.

    Poznámka:

    Vyberte vhodné možnosti pro kopírování.

    • Tokeny sdíleného přístupového podpisu (SAS) kontejneru služby Azure Blob Storage
    • Přihlašovací údaje instančního objektu účtu úložiště Azure Data Lake Storage (ADLS) Gen2
      • ID tenanta
      • ID klienta a
      • Tajný kód

    v příslušných uživatelských rozhraních při vytváření tajných kódů služby Azure Key Vault pro ně

  8. Přechod zpět na obrazovku Vytvořit tajný kód

  9. Do textového pole Hodnota tajného kódu zadejte přihlašovací údaje přístupového klíče pro účet úložiště Azure, který se zkopíroval do schránky v předchozím kroku.

  10. Vyberte příkaz Vytvořit.

    Snímek obrazovky znázorňující obrazovku pro vytvoření tajného kódu Azure

Tip

Azure CLI a klientská knihovna tajných kódů služby Azure Key Vault pro Python můžou také vytvářet tajné kódy služby Azure Key Vault.

Přidání přiřazení rolí v účtech úložiště Azure

Před zahájením interaktivní transformace dat musíme zajistit přístupnost vstupních a výstupních datových cest. Za prvé, pro

  • identita uživatele relace poznámkových bloků přihlášeného uživatele

    nebo

  • instanční objekt

přiřaďte role Čtenář a Čtenář dat objektů blob služby Storage k identitě uživatele přihlášeného uživatele. V některých scénářích ale můžeme chtít uspořádaná data zapsat zpět do účtu úložiště Azure. Role Čtenář a Čtenář dat objektů blob služby Storage poskytují přístup jen pro čtení k identitě uživatele nebo instančnímu objektu. Pokud chcete povolit přístup pro čtení a zápis, přiřaďte k identitě uživatele nebo instančnímu objektu role Přispěvatel dat Přispěvatel a Přispěvatel dat v objektu blob služby Storage. Přiřazení odpovídajících rolí identitě uživatele:

  1. Otevření webu Microsoft Azure Portal

  2. Hledání a výběr služby Účty úložiště

    Rozbalitelný snímek obrazovky s vyhledáváním a výběrem služby Storage na webu Microsoft Azure Portal

  3. Na stránce Účty úložiště vyberte ze seznamu účet úložiště Azure Data Lake Storage (ADLS) Gen2. Otevře se stránka zobrazující přehled účtu úložiště.

    Rozbalitelný snímek obrazovky znázorňující výběr účtu úložiště Azure Data Lake Storage (ADLS) Gen2

  4. Na levém panelu vyberte Řízení přístupu (IAM).

  5. Vyberte Přidat přiřazení role.

    Snímek obrazovky znázorňující obrazovku přístupových klíčů Azure

  6. Vyhledání a výběr role Přispěvatel dat objektů blob služby Storage

  7. Vyberte Další.

    Snímek obrazovky znázorňující obrazovku přidání role do Azure

  8. Výběr uživatele, skupiny nebo instančního objektu

  9. Vybrat a vybrat členy

  10. Vyhledejte identitu uživatele níže : Vyberte

  11. Ze seznamu vyberte identitu uživatele, aby se zobrazovala v části Vybrané členy.

  12. Vyberte příslušnou identitu uživatele.

  13. Vyberte Další.

    Snímek obrazovky znázorňující kartu Členové na obrazovce Přidat přiřazení role v Azure

  14. Vyberte Zkontrolovat a přiřadit.

    Snímek obrazovky znázorňující kontrolu a přiřazení přiřazení role v Azure

  15. Opakování kroků 2 až 13 pro přiřazení role přispěvatele

Jakmile má identita uživatele přiřazené příslušné role, měla by být data v účtu úložiště Azure přístupná.

Poznámka:

Pokud připojený fond Synapse Spark odkazuje na fond Synapse Spark v pracovním prostoru Azure Synapse, který má přidruženou spravovanou virtuální síť, měli byste nakonfigurovat spravovaný privátní koncový bod na účet úložiště, abyste zajistili přístup k datům.

Zajištění přístupu k prostředkům pro úlohy Sparku

Pro přístup k datům a dalším prostředkům můžou úlohy Sparku používat spravovanou identitu nebo předávací identitu uživatele. Následující tabulka shrnuje různé mechanismy pro přístup k prostředkům, když používáte Azure Machine Učení bezserverové výpočetní prostředí Spark a připojený fond Synapse Spark.

Fond Sparku Podporované identity Výchozí identita
Výpočetní prostředí Spark bez serveru Identita uživatele, spravovaná identita přiřazená uživatelem připojená k pracovnímu prostoru Identita uživatele
Připojený fond Synapse Spark Identita uživatele, spravovaná identita přiřazená uživatelem připojená k připojenému fondu Synapse Spark, spravovaná identita přiřazená systémem připojeného fondu Synapse Spark Spravovaná identita přiřazená systémem připojeného fondu Synapse Spark

Pokud kód rozhraní příkazového řádku nebo sady SDK definuje možnost použití spravované identity, Azure Machine Učení bezserverové výpočetní prostředí Spark spoléhá na spravovanou identitu přiřazenou uživatelem připojenou k pracovnímu prostoru. Spravovanou identitu přiřazenou uživatelem můžete připojit k existujícímu pracovnímu prostoru Azure Machine Učení pomocí Azure Machine Učení CLI v2 nebo pomocí ARMClient.

Další kroky