Panoramica della continuità aziendale e del ripristino di emergenzaBusiness continuity and disaster recovery overview

La continuità aziendale e il ripristino di emergenza in Azure Esplora dati consentono all'azienda di continuare a funzionare in caso di interruzione.Business continuity and disaster recovery in Azure Data Explorer enables your business to continue operating in the face of a disruption. Questo articolo illustra la disponibilità (intra-Region) e il ripristino di emergenza.This article discusses availability (intra-region) and disaster recovery. Descrive le funzionalità native e le considerazioni sull'architettura per una distribuzione di Azure Esplora dati resiliente.It details native capabilities and architectural considerations for a resilient Azure Data Explorer deployment. Viene dettagliatamente eseguito il ripristino da errori umani e disponibilità elevata, seguiti da più configurazioni di ripristino di emergenza.It details recovery from human errors, high availability, followed by multiple disaster recovery configurations. Queste configurazioni dipendono da requisiti di resilienza come obiettivo del punto di ripristino (RPO) e obiettivo del tempo di ripristino (RTO), impegno necessario e costo.These configurations depend on resiliency requirements such as Recovery Point Objective (RPO) and Recovery Time Objective (RTO), needed effort, and cost.

Attenuare gli eventi di disturboMitigate disruptive events

Errore umanoHuman error

Gli errori umani sono inevitabili.Human errors are inevitable. Gli utenti possono eliminare accidentalmente un cluster, un database o una tabella.Users can accidentally drop a cluster, database, or a table.

Eliminazione accidentale di un cluster o di un databaseAccidental cluster or database deletion

L'eliminazione accidentale di un cluster o di un database è un'azione irreversibile.Accidental cluster or database deletion is an irrecoverable action. Il proprietario della risorsa Esplora dati di Azure permette di evitare la perdita di dati abilitando la funzionalità di eliminazione del blocco , disponibile a livello di risorsa di Azure.As the Azure Data Explorer resource owner, you can prevent data loss by enabling the delete lock capability, available at the Azure resource level.

Eliminazione accidentale di una tabellaAccidental table deletion

Gli utenti con autorizzazioni di amministratore di tabella o superiore possono eliminare le tabelle.Users with table admin permissions or higher are allowed to drop tables. Se uno di questi utenti elimina accidentalmente una tabella, è possibile ripristinarla usando il .undo drop table comando.If one of those users accidentally drops a table, you can recover it using the .undo drop table command. Per eseguire correttamente questo comando, è necessario abilitare prima la proprietà di ripristino nei criteri di conservazione.For this command to be successful, you must first enable the recoverability property in the retention policy.

Eliminazione accidentale di una tabella esternaAccidental external table deletion

Le tabelle esterne sono entità dello schema di query kusto che fanno riferimento a dati archiviati all'esterno del database.External tables are Kusto query schema entities that reference data stored outside the database. L'eliminazione di una tabella esterna consente di eliminare solo i metadati della tabella.Deletion of an external table only deletes the table metadata. Per ripristinarlo, è possibile eseguire nuovamente il comando Table Creation.You can recover it by re-executing the table creation command. Usare la funzionalità di eliminazione temporanea per evitare l'eliminazione accidentale o la sovrascrittura di un file/BLOB per una quantità di tempo configurata dall'utente.Use the soft delete capability to protect against accidental deletion or overwrite of a file/blob for a user-configured amount of time.

Disponibilità elevata di Azure Esplora datiHigh availability of Azure Data Explorer

La disponibilità elevata si riferisce alla tolleranza di errore del Esplora dati di Azure, dei relativi componenti e delle dipendenze sottostanti all'interno di un'area di Azure.High availability refers to the fault-tolerance of Azure Data Explorer, its components, and underlying dependencies within an Azure region. Questa tolleranza di errore evita singoli punti di errore (SPOF) nell'implementazione.This fault tolerance avoids single points of failure (SPOF) in the implementation. In Azure Esplora dati, la disponibilità elevata include il livello di persistenza, il livello di calcolo e una configurazione leader-follower.In Azure Data Explorer, high availability includes the persistence layer, compute layer, and a leader-follower configuration.

Livello di persistenzaPersistence layer

Azure Esplora dati utilizza archiviazione di Azure come livello di persistenza durevole.Azure Data Explorer leverages Azure Storage as its durable persistence layer. Archiviazione di Azure fornisce automaticamente la tolleranza di errore, con l'impostazione predefinita che offre l'archiviazione con ridondanza locale (con ridondanza locale) all'interno di una data center.Azure Storage automatically provides fault tolerance, with the default setting offering Locally Redundant Storage (LRS) within a data center. Le tre repliche sono rese permanente.Three replicas are persisted. Se una replica viene persa mentre è in uso, viene distribuita un'altra senza interruzione.If a replica is lost while in use, another is deployed without disruption. È possibile aumentare la resilienza con l'archiviazione con ridondanza della zona che inserisce le repliche in modo intelligente tra le zone di disponibilità dell'area di Azure per la massima tolleranza di errore a costi aggiuntivi.Further resiliency is possible with Zone Redundant Storage that places replicas intelligently across Azure regional availability zones for maximum fault tolerance at an additional cost.

Livello di calcoloCompute layer

Azure Esplora dati è una piattaforma di elaborazione distribuita e può avere due o più nodi a seconda del tipo di ruolo del nodo e della scalabilità.Azure Data Explorer is a distributed computing platform and can have two to many nodes depending on scale and node role type. In fase di provisioning selezionare le zone di disponibilità per distribuire la distribuzione del nodo, tra le zone per la resilienza massima tra aree.At provision time, select availability zones to distribute the node deployment, across zones for maximum intra-region resiliency. Un errore della zona di disponibilità non comporta un'interruzione completa, ma il calo delle prestazioni fino al recupero della zona.An availability zone failure won't result in a complete outage but instead, performance degradation until recovery of the zone.

Configurazione del cluster leader-followerLeader-follower cluster configuration

Azure Esplora dati offre una funzionalità facoltativa di seguito per un cluster leader, che deve essere seguito da altri cluster di seguito per l'accesso in sola lettura ai dati e ai metadati del leader.Azure Data Explorer provides an optional follower capability for a leader cluster to be followed by other follower clusters for read-only access to the leader's data and metadata. Le modifiche apportate al leader, ad esempio create , append e, drop vengono sincronizzate automaticamente con il seguente.Changes in the leader, such as create, append, and drop are automatically synchronized to the follower. Mentre i leader possono estendersi alle aree di Azure, i cluster di seguito devono essere ospitati nelle stesse aree del leader.While the leaders could span Azure regions, the follower clusters should be hosted in the same region(s) as the leader. Se il cluster leader è inattivo o i database o le tabelle vengono accidentalmente eliminati, i cluster di follower perderanno l'accesso fino a quando l'accesso non viene recuperato nel leader.If the leader cluster is down or databases or tables are accidentally dropped, the follower clusters will lose access until access is recovered in the leader.

Interruzione di una zona di disponibilità di AzureOutage of an Azure availability zone

Le zone di disponibilità di Azure sono posizioni fisiche univoche all'interno della stessa area di Azure.Azure availability zones are unique physical locations within the same Azure region. Possono proteggere il calcolo e i dati di un cluster Esplora dati di Azure da un errore di area parziale.They can protect an Azure Data Explorer cluster's compute and data from partial region failure. L'errore della zona è uno scenario di disponibilità che si trova all'interno dell'area geografica.Zone failure is an availability scenario as it is intra-region.

Aggiungere un cluster di Azure Esplora dati alla stessa zona di altre risorse di Azure connesse.Pin an Azure Data Explorer cluster to the same zone as other connected Azure resources. Per altre informazioni sull'abilitazione delle zone di disponibilità, vedere creare un cluster.For more information on enabling availability zones, see create a cluster.

Nota

La selezione della zona di disponibilità è supportata solo durante la creazione del cluster e non può essere modificata in un secondo momento.Availability zone selection is only supported at the time of cluster creation and can't be modified later.

Interruzione di un Data Center di AzureOutage of an Azure datacenter

Le zone di disponibilità di Azure dispongono di un costo e alcuni clienti scelgono di eseguire la distribuzione senza ridondanza di zona.Azure availability zones come with a cost and some customers choose to deploy without zonal redundancy. Con una distribuzione Esplora dati di Azure, un'interruzione del Data Center di Azure comporterà un'interruzione del cluster.With such an Azure Data Explorer deployment, an Azure datacenter outage will result in cluster outage. La gestione di un'interruzione del Data Center di Azure è pertanto identica a quella di un'interruzione dell'area di Azure.Handling an Azure datacenter outage is therefore identical to that of an Azure region outage.

Interruzione di un'area di AzureOutage of an Azure region

Azure Esplora dati non offre la protezione automatica dall'interruzione di un'intera area di Azure.Azure Data Explorer doesn't provide automatic protection against the outage of an entire Azure region. Per ridurre al minimo l'effetto aziendale in caso di interruzione di questo tipo, più cluster Esplora dati di Azure tra le aree abbinate di Azure.To minimize business impact if there is such an outage, multiple Azure Data Explorer clusters across Azure paired regions. In base all'obiettivo del tempo di ripristino (RTO), all'obiettivo del punto di ripristino (RPO), nonché alle considerazioni relative ai costi e alle attività, sono disponibili più configurazioni di ripristino di emergenza.Based on your recovery time objective (RTO), recovery point objective (RPO), as well as effort and cost considerations, there are multiple disaster recovery configurations. È possibile ottimizzare i costi e le prestazioni con Azure Advisor raccomandazioni e la configurazione di scalabilità automatica.Cost and performance optimizations are possible with Azure Advisor recommendations and autoscale configuration.

Configurazioni del ripristino di emergenzaDisaster recovery configurations

Questa sezione illustra in dettaglio più configurazioni di ripristino di emergenza in base ai requisiti di resilienza (RPO e RTO), al lavoro necessario e ai costi.This section details multiple disaster recovery configurations depending on resiliency requirements (RPO and RTO), needed effort, and cost.

L'obiettivo del tempo di ripristino (RTO) si riferisce al tempo necessario per il ripristino in seguito a un'operazione.Recovery time objective (RTO) refers to the time to recover from a disruption. Ad esempio, RTO di 2 ore significa che l'applicazione deve essere in esecuzione entro due ore da un'interrotta.For example, RTO of 2 hours means the application has to be up and running within two hours of a disruption. L'obiettivo del punto di ripristino (RPO) si riferisce all'intervallo di tempo che può trascorrere durante un'interruzione prima che la quantità di dati persi durante tale periodo sia maggiore della soglia consentita.Recovery point objective (RPO) refers to the interval of time that might pass during a disruption before the quantity of data lost during that period is greater than the allowable threshold. Ad esempio, se il RPO è di 24 ore e un'applicazione ha dati a partire da 15 anni fa, si trovano ancora nei parametri della RPO concordata.For example, if the RPO is 24 hours, and an application has data beginning from 15 years ago, they're still within the parameters of the agreed-upon RPO.

I processi di inserimento, elaborazione e cura richiedono un progetto diligente prima di pianificare il ripristino di emergenza.Ingestion, processing, and curation processes need diligent design upfront when planning for disaster recovery. L'inserimento fa riferimento ai dati integrati in Esplora dati di Azure da diverse origini. l'elaborazione si riferisce a trasformazioni e attività simili. la cura si riferisce alle viste materializzate, alle esportazioni in data Lake e così via.Ingestion refers to data integrated into Azure Data Explorer from various sources; processing refers to transformations and similar activities; curation refers to materialized views, exports to the data lake, and so on.

Di seguito sono riportate le configurazioni di ripristino di emergenza più diffuse e descritte in dettaglio di seguito.The following are popular disaster recovery configurations, and each is described in detail below.

Configurazione Always onAlways-on configuration

Per le distribuzioni di applicazioni critiche senza tolleranza per le interruzioni, è consigliabile usare più cluster Esplora dati di Azure in aree abbinate di Azure.For critical application deployments with no tolerance for outages, you should use multiple Azure Data Explorer clusters across Azure paired regions. Configurare l'inserimento, l'elaborazione e la cura in parallelo a tutti i cluster.Set up ingestion, processing, and curation in parallel to all of the clusters. Lo SKU del cluster deve essere lo stesso tra le aree.The cluster SKU must be the same across regions. Azure assicurerà che gli aggiornamenti vengano implementati e scaglionati tra le aree abbinate di Azure.Azure will ensure that updates are rolled out and staggered across Azure paired regions. Un'interruzione dell'area di Azure non causerà un'interruzione dell'applicazione.An Azure region outage won't cause an application outage. È possibile che si verifichino problemi di latenza o riduzione delle prestazioni.You may experience some latency or performance degradation.

Configurazione Active-Active-Active-n

ConfigurationConfiguration RPORPO RTORTO ImpegnoEffort CostiCost
Attivo-attivo-attivo-nActive-Active-Active-n 0 ore0 hours 0 ore0 hours MinoreLower Più altaHighest

Configurazione di Active-ActiveActive-Active configuration

Questa configurazione è identica alla configurazione Always-on, ma prevede solo due aree abbinate di Azure.This configuration is identical to the Always-on configuration, but only involves two Azure paired regions. Configurare il doppio inserimento, l'elaborazione e la cura.Configure dual ingestion, processing, and curation. Gli utenti vengono indirizzati all'area più vicina.Users are routed to the nearest region. Lo SKU del cluster deve essere lo stesso tra le aree.The cluster SKU must be the same across regions.

Configurazione di Active-Active

ConfigurationConfiguration RPORPO RTORTO ImpegnoEffort CostiCost
Attivo-attivoActive-Active nessunoNone nessunoNone MinoreLower AltoHigh

Configurazione di Active-hot standbyActive-Hot standby configuration

La configurazione di tipo attivo-attivo è simile alla configurazione di tipo attivo -attivo in doppio inserimento, elaborazione e cura.The Active-Hot configuration is similar to the Active-Active configuration in dual ingest, processing, and curation. Tuttavia, il cluster standby è offline per gli utenti finali e non deve trovarsi nello stesso SKU del database primario.However, the standby cluster is offline to end users, and doesn't need to be in the same SKU as the primary. Anche il cluster hot standby può essere di uno SKU e una scalabilità inferiori e, di conseguenza, è meno efficiente.The hot standby cluster can also be of a smaller SKU and scale, and as such is less performant. In uno scenario di emergenza, il cluster standby viene portato online e scalato verso l'alto.In a disaster scenario, the standby cluster is brought online, and scaled up.

Configurazione hot standby attiva

ConfigurationConfiguration RPORPO RTORTO ImpegnoEffort CostiCost
Attivo-hot standbyActive-Hot Standby BassaLow BassaLow Livello medioMedium Livello medioMedium

Configurazione del ripristino dei dati su richiestaOn-demand data recovery configuration

Questa soluzione offre la minima resilienza (RPO più elevata e RTO), rappresenta il costo più basso e il massimo sforzo.This solution offers the least resiliency (highest RPO and RTO), is the lowest in cost and highest in effort. In questa configurazione non esiste alcun cluster di recupero dati.In this configuration, there's no data recovery cluster. Configurare l'esportazione continua dei dati curati, a meno che non siano richiesti anche dati non elaborati e intermedi, a un account di archiviazione configurato come GRS (archiviazione con ridondanza geografica).Configure continuous export of curated data (unless raw and intermediate data is also required) to a storage account that is configured GRS (Geo Redundant Storage). Un cluster di recupero dati viene attivato se si verifica uno scenario di ripristino di emergenza.A data recovery cluster is spun up if there is a disaster recovery scenario. A questo punto, vengono applicati DDL, configurazione, criteri e processi.At that time, DDLs, configuration, policies, and processes are applied. I dati vengono inseriti dalla risorsa di archiviazione con la proprietà di inserimento kustoCreationTime per eseguire l'override del tempo di inserimento che viene impostato per impostazione predefinita sull'ora di sistema.Data is ingested from storage with the ingestion property kustoCreationTime to over-ride the ingestion time that defaults to system time.

Configurazione del cluster di recupero dati su richiesta

ConfigurationConfiguration RPORPO RTORTO ImpegnoEffort CostiCost
Cluster di recupero dati su richiestaOn-demand data recovery cluster Più altaHighest Più altaHighest Più altaHighest Più bassaLowest

Riepilogo delle opzioni di configurazione del ripristino di emergenzaSummary of disaster recovery configuration options

ConfigurationConfiguration ResilienzaResiliency RPORPO RTORTO ImpegnoEffort CostiCost
Attivo-attivo-attivo-nActive-Active-Active-n Più altaHighest 0 ore0 hours 0 ore0 hours MinoreLower Più altaHighest
Attivo-attivoActive-Active AltoHigh nessunoNone nessunoNone MinoreLower AltoHigh
Attivo-hot standbyActive-Hot Standby MediaMedium BassaLow BassaLow Livello medioMedium Livello medioMedium
Cluster di recupero dati su richiestaOn-demand data recovery cluster Più bassaLowest Più altaHighest Più altaHighest Più altaHighest Più bassaLowest

Procedure consigliateBest practices

Indipendentemente dalla scelta della configurazione di ripristino di emergenza, attenersi alle procedure consigliate seguenti:Regardless of which disaster recovery configuration is chosen, follow these best practices:

  • Tutti gli oggetti di database, i criteri e le configurazioni devono essere salvati in modo permanente nel controllo del codice sorgente, in modo che possano essere rilasciati nel cluster dallo strumento di automazione della versione.All database objects, policies, and configurations should be persisted in source control so they can be released to the cluster from your release automation tool. Per altre informazioni, vedere supporto di Azure DevOps per azure Esplora dati.For more information, see Azure DevOps support for Azure Data Explorer.
  • Progettare, sviluppare e implementare le routine di convalida per assicurarsi che tutti i cluster siano sincronizzati dal punto di vista dei dati.Design, develop, and implement validation routines to ensure all clusters are in-sync from a data perspective. Azure Esplora dati supporta i join tra cluster.Azure Data Explorer supports cross cluster joins. Un conteggio o righe semplici tra le tabelle può essere utile per la convalida.A simple count or rows across tables can help validate.
  • Usare la funzionalità di esportazione continua ed esportare i dati all'interno di tabelle Esplora dati di Azure in un archivio di Azure Data Lake.Use continuous export capability and export data within Azure Data Explorer tables to an Azure Data Lake store. Assicurarsi di selezionare GRS per la resilienza più elevata.Ensure selection of GRS for the highest resilience.
  • Le procedure di rilascio devono includere controlli di governance e saldi che assicurano il mirroring dei cluster.Release procedures should involve governance checks and balances that ensure mirroring of the clusters.
  • È pienamente consapevole del risultato necessario per creare un cluster da zero.Be fully cognizant of what it takes to build a cluster from scratch.
  • Creare un elenco di controllo delle unità di distribuzione.Create a checklist of deployment units. L'elenco sarà univoco per le proprie esigenze, ma deve includere: script di distribuzione, connessioni di inserimento, strumenti di business intelligence e altre configurazioni importanti.Your list will be unique to your needs, but should include: deployment scripts, ingestion connections, BI tools, and other important configurations.

Passaggi successiviNext steps

Per altre informazioni , vedere creare soluzioni di continuità aziendale e ripristino di emergenza con Azure Esplora dati.Learn more with the Create business continuity and disaster recovery solutions with Azure Data Explorer.