Porovnání možností úložiště pro použití s clustery Azure HDInsightCompare storage options for use with Azure HDInsight clusters

Při vytváření clusterů HDInsight si můžete vybrat mezi několika různými službami Azure Storage:You can choose between a few different Azure storage services when creating HDInsight clusters:

Tento článek obsahuje přehled těchto typů úložišť a jejich jedinečných funkcí.This article provides an overview of these storage types and their unique features.

Typy a funkce úložištěStorage types and features

Následující tabulka shrnuje Azure Storage služby, které jsou podporovány v různých verzích služby HDInsight:The following table summarizes the Azure Storage services that are supported with different versions of HDInsight:

Služba úložištěStorage service Typ účtuAccount type Typ oboru názvůNamespace Type Podporované službySupported services Podporované úrovně výkonuSupported performance tiers Podporované úrovně přístupuSupported access tiers Verze HDInsightHDInsight Version Typ clusteruCluster type
Azure Data Lake Storage Gen2Azure Data Lake Storage Gen2 Obecné účely v2General-purpose V2 Hierarchický (systém souborů)Hierarchical (filesystem) Objekt blobBlob StandardStandard Horká, studená, archivníHot, Cool, Archive 3.6 +3.6+ Vše kromě Spark 2,1 a 2,2All except Spark 2.1 and 2.2
Azure StorageAzure Storage Obecné účely v2General-purpose V2 ObjektObject Objekt blobBlob StandardStandard Horká, studená, archivníHot, Cool, Archive 3.6 +3.6+ VšeAll
Azure StorageAzure Storage Obecné účely v1General-purpose V1 ObjektObject Objekt blobBlob StandardStandard N/A VšeAll VšeAll
Azure StorageAzure Storage Blob Storage * *Blob Storage** ObjektObject Objekt blob blokuBlock Blob StandardStandard Horká, studená, archivníHot, Cool, Archive VšeAll VšeAll
Azure Data Lake Storage Gen1Azure Data Lake Storage Gen1 N/A Hierarchický (systém souborů)Hierarchical (filesystem) N/AN/A N/AN/A N/AN/A jenom 3,63.6 Only Všechny kromě adaptérů HBAAll except HBase
Azure StorageAzure Storage Objekt blob blokuBlock Blob ObjektObject Objekt blob blokuBlock Blob PremiumPremium N/A 3.6 +3.6+ Jenom adaptéry HBA s akcelerovanými zápisyOnly HBase with accelerated writes
Azure Data Lake Storage Gen2Azure Data Lake Storage Gen2 Objekt blob blokuBlock Blob Hierarchický (systém souborů)Hierarchical (filesystem) Objekt blob blokuBlock Blob PremiumPremium N/A 3.6 +3.6+ Jenom adaptéry HBA s akcelerovanými zápisyOnly HBase with accelerated writes

* * Pro clustery HDInsight může být pouze sekundární účty úložiště typu BlobStorage a objekt blob stránky není podporovanou možností úložiště.**For HDInsight clusters, only secondary storage accounts can be of type BlobStorage and Page Blob isn't a supported storage option.

Další informace o Azure Storage typech účtů najdete v tématu Přehled účtu Azure Storage .For more information on Azure Storage account types, see Azure storage account overview

Další informace o úrovních přístupu Azure Storage najdete v tématu úložiště objektů BLOB v Azure: Premium (Preview), horké, studené a archivní úrovně úložiště.For more information on Azure Storage access tiers, see Azure Blob storage: Premium (preview), Hot, Cool, and Archive storage tiers

Clustery můžete vytvářet pomocí kombinací služeb pro primární a volitelné sekundární úložiště.You can create clusters using combinations of services for primary and optional secondary storage. Následující tabulka shrnuje konfigurace úložiště clusteru, které jsou aktuálně podporované v HDInsight:The following table summarizes the cluster storage configurations that are currently supported in HDInsight:

Verze HDInsightHDInsight Version Primární úložištěPrimary Storage Sekundární úložištěSecondary Storage PodporovánoSupported
3,6 & 4,03.6 & 4.0 Pro obecné účely V1, Pro obecné účely v2General Purpose V1, General Purpose V2 Pro obecné účely V1, Pro obecné účely v2, BlobStorage (objekty blob bloku)General Purpose V1, General Purpose V2, BlobStorage(Block Blobs) YesYes
3,6 & 4,03.6 & 4.0 Pro obecné účely V1, Pro obecné účely v2General Purpose V1, General Purpose V2 Data Lake Storage Gen2Data Lake Storage Gen2 NeNo
3,6 & 4,03.6 & 4.0 Data Lake Storage Gen2 *Data Lake Storage Gen2* Data Lake Storage Gen2Data Lake Storage Gen2 YesYes
3,6 & 4,03.6 & 4.0 Data Lake Storage Gen2 *Data Lake Storage Gen2* Pro obecné účely V1, Pro obecné účely v2, BlobStorage (objekty blob bloku)General Purpose V1, General Purpose V2, BlobStorage(Block Blobs) YesYes
3,6 & 4,03.6 & 4.0 Data Lake Storage Gen2Data Lake Storage Gen2 Data Lake Storage Gen1Data Lake Storage Gen1 NeNo
3,63.6 Data Lake Storage Gen1Data Lake Storage Gen1 Data Lake Storage Gen1Data Lake Storage Gen1 YesYes
3,63.6 Data Lake Storage Gen1Data Lake Storage Gen1 Pro obecné účely V1, Pro obecné účely v2, BlobStorage (objekty blob bloku)General Purpose V1, General Purpose V2, BlobStorage(Block Blobs) YesYes
3,63.6 Data Lake Storage Gen1Data Lake Storage Gen1 Data Lake Storage Gen2Data Lake Storage Gen2 NeNo
4,04.0 Data Lake Storage Gen1Data Lake Storage Gen1 LibovolnýAny NeNo
4,04.0 Pro obecné účely V1, Pro obecné účely v2General Purpose V1, General Purpose V2 Data Lake Storage Gen1Data Lake Storage Gen1 NeNo

* = Může to být jeden nebo několik Data Lake Storage Gen2, pokud všechna nastavení používají stejnou spravovanou identitu pro přístup k clusteru.*=This could be one or multiple Data Lake Storage Gen2, as long as they're all setup to use the same managed identity for cluster access.

Poznámka

Data Lake Storage Gen2 primární úložiště není pro clustery Spark 2,1 nebo 2,2 podporováno.Data Lake Storage Gen2 primary storage is not supported for Spark 2.1 or 2.2 clusters.

Replikace datData replication

Azure HDInsight neukládá zákaznická data.Azure HDInsight does not store customer data. Primárním prostředkem úložiště pro cluster jsou přidružené účty úložiště.The primary means of storage for a cluster are its associated storage accounts. Cluster můžete připojit k existujícímu účtu úložiště nebo vytvořit nový účet úložiště během procesu vytváření clusteru.You can attach your cluster to an existing storage account, or create a new storage account during the cluster creation process. Pokud se vytvoří nový účet, vytvoří se jako účet místně redundantního úložiště (LRS) a bude vyhovovat požadavkům na umístění dat v regionu, včetně těch, které jsou uvedené v Centru zabezpečení.If a new account is created, it will be created as a locally redundant storage (LRS) account, and will satisfy in-region data residency requirements including those specified in the Trust Center.

Můžete ověřit, jestli je HDInsight správně nakonfigurovaný tak, aby ukládal data v jedné oblasti tím, že zajistí, že účet úložiště přidružený k vašemu HDInsight je LRS nebo jiná možnost úložiště, kterou jste uvedli v Centru zabezpečení.You can validate that HDInsight is properly configured to store data in a single region by ensuring that the storage account associated with your HDInsight is LRS or another storage option mentioned on Trust Center.

Další krokyNext steps