Jämföra lagringsalternativ för användning med Azure HDInsight-kluster

Du kan välja mellan några olika Azure-lagringstjänster när du skapar HDInsight-kluster:

Den här artikeln innehåller en översikt över dessa lagringstyper och deras unika funktioner.

Lagringstyper och funktioner

I följande tabell sammanfattas De Azure Storage-tjänster som stöds med olika versioner av HDInsight:

Lagringstjänst Kontotyp Namnområdestyp Tjänster som stöds Prestandanivåer som stöds Åtkomstnivåer som stöds HDInsight-version Klustertyp
Azure Data Lake Storage Gen2 Generell användning V2 Hierarkisk (filsystem) Blob Standard Frekvent, lågfrekvent, arkiv 3.6+ Alla utom Spark 2.1 och 2.2
Azure Storage Generell användning V2 Objekt Blob Standard Frekvent, lågfrekvent, arkiv 3.6+ Alla
Azure Storage Generell användning V1 Objekt Blob Standard Ej tillämpligt Alla Alla
Azure Storage Blob Storage** Objekt Blockblob Standard Frekvent, lågfrekvent, arkiv Alla Alla
Azure Data Lake Storage Gen1 Ej tillämpligt Hierarkisk (filsystem) Saknas Saknas Saknas Endast 3.6 Alla utom HBase
Azure Storage Blockblob Objekt Blockblob Premium Ej tillämpligt 3.6+ Endast HBase med accelererade skrivningar
Azure Data Lake Storage Gen2 Blockblob Hierarkisk (filsystem) Blockblob Premium Ej tillämpligt 3.6+ Endast HBase med accelererade skrivningar

**För HDInsight-kluster kan endast sekundära lagringskonton vara av typen BlobStorage och sidblob stöds inte.

Mer information om Azure Storage-kontotyper finns i Översikt över Azure Storage-konto

Mer information om Azure Storage-åtkomstnivåer finns i Azure Blob Storage: Premium (förhandsversion), lagringsnivåer för frekvent lagring, lågfrekvent lagring och arkiv

Du kan skapa kluster med hjälp av kombinationer av tjänster för primär och valfri sekundär lagring. I följande tabell sammanfattas de klusterlagringskonfigurationer som för närvarande stöds i HDInsight:

HDInsight-version Primär lagring Sekundär lagring Stöds
3.6 & 4.0 Generell användning V1, Generell användning V2 Generell användning V1, Generell användning V2, BlobStorage(Blockblobar) Ja
3.6 & 4.0 Generell användning V1, Generell användning V2 Data Lake Storage Gen2 Nej
3.6 & 4.0 Data Lake Storage Gen2* Data Lake Storage Gen2 Ja
3.6 & 4.0 Data Lake Storage Gen2* Generell användning V1, Generell användning V2, BlobStorage(Blockblobar) Ja
3.6 & 4.0 Data Lake Storage Gen2 Data Lake Storage Gen1 Nej
3,6 Data Lake Storage Gen1 Data Lake Storage Gen1 Ja
3,6 Data Lake Storage Gen1 Generell användning V1, Generell användning V2, BlobStorage(Blockblobar) Ja
3,6 Data Lake Storage Gen1 Data Lake Storage Gen2 Nej
4.0 Data Lake Storage Gen1 Alla Nej
4.0 Generell användning V1, Generell användning V2 Data Lake Storage Gen1 Nej

*=Detta kan vara en eller flera Data Lake Storage Gen2, så länge de alla konfigureras för att använda samma hanterade identitet för klusteråtkomst.

Kommentar

Primär lagring i Data Lake Storage Gen2 stöds inte för Spark 2.1- eller 2.2-kluster.

Datareplikering

Azure HDInsight lagrar inte kunddata. Det primära lagringsmedlet för ett kluster är dess associerade lagringskonton. Du kan koppla klustret till ett befintligt lagringskonto eller skapa ett nytt lagringskonto när klustret skapas. Om ett nytt konto skapas skapas det som ett lokalt redundant lagringskonto (LRS) och uppfyller kraven för datahemvist i regionen, inklusive de som anges i Säkerhetscenter.

Du kan kontrollera att HDInsight är korrekt konfigurerat för att lagra data i en enda region genom att se till att lagringskontot som är associerat med din HDInsight är LRS eller något annat lagringsalternativ som anges i Säkerhetscenter.

Kommentar

Uppgradering av det primära eller sekundära lagringskontot för ett kluster som körs med Azure Data Lake Storage Gen2-funktioner stöds inte. Om du vill ändra lagringstypen för ett befintligt HDInsight-kluster till Data Lake Storage Gen2 måste du återskapa klustret och välja ett hierarkiskt namnområde aktiverat lagringskonto.

Nästa steg