Analisi cloud

Con forme di adozione del cloud più grandi e sofisticate, il percorso verso il cloud diventa più complesso. L'analisi su scala cloud di Azure è un framework scalabile e ripetibile che soddisfa le esigenze specifiche dell'organizzazione per la creazione di piattaforme dati moderne.

L'analisi su scala cloud copre sia considerazioni tecniche che non tecniche per l'analisi e la governance nel cloud. Questa guida si impegna a supportare l'adozione ibrida e multicloud, essendo indipendente dal cloud, ma gli esempi di implementazione tecnica inclusi si concentrano sui prodotti Azure.

L'analisi su scala cloud ha gli obiettivi seguenti:

  • Gestire i dati come prodotto, invece di un byproduct
  • Fornire un ecosistema di prodotti dati, anziché un data warehouse singolare che potrebbe non adattarsi meglio allo scenario di dati
  • Promuovere un approccio predefinito per applicare la governance e la sicurezza dei dati
  • Indirizzare i team a definire in modo coerente la priorità dei risultati aziendali invece di concentrarsi solo sulla tecnologia sottostante.

L'analisi su scala cloud si basa sul framework di adozione del cloud di Microsoft e richiede la comprensione delle zone di destinazione. Se non si ha già un'implementazione delle zone di destinazione di Azure, consultare i team cloud su come soddisfare i prerequisiti. Per altre informazioni, vedere Predisporre l'adozione del cloud.

Le architetture di riferimento consentono di iniziare con un footprint ridotto e crescere nel tempo, adattando lo scenario ai casi d'uso.

L'analisi su scala cloud include modelli ripetibili che accelerano cinque distribuzioni di risorse e infrastruttura di base. È anche adattabile per diverse dimensioni dell'organizzazione. Se si è un'azienda di piccole dimensioni con risorse limitate, un modello operativo centralizzato misto con alcuni esperti di materia aziendale potrebbe adattarsi alla propria situazione. Se si è un'azienda più grande con business unit autonome (ognuna con i propri data engineer e analisti) come obiettivo, un modello operativo distribuito, ad esempio mesh di dati o data fabric, potrebbe soddisfare meglio le proprie esigenze.

Obiettivi

L'analisi su scala cloud offre un framework basato sui principi seguenti. Questi principi affrontano le sfide con architetture di dati complesse che non vengono ridimensionate in base alle esigenze delle organizzazioni.

Principio Descrizione
Consentito
  • Scalabilità senza maggiore complessità
  • Separazione dei problemi per facilitare la governance
  • Creazione di un'infrastruttura di dati self-service
Segui
  • Procedure consigliate per servizi cloud ben architettati
Supporto
  • Scenari locali e multicloud
Adozione
  • Approccio indipendente dal prodotto e dal fornitore
  • Cloud Adoption Framework
Eseguire il commit
  • Zone di destinazione di Azure come infrastruttura di base per tutti i carichi di lavoro
  • Modello operativo
Abilita
  • Infrastruttura dei dati comune
  • Architettura distribuita con governance centralizzata
  • Comunicazione sicura con la rete

Indicazioni relative all'implementazione

Le linee guida per l'implementazione possono essere suddivise in due sezioni:

  • Linee guida globali applicabili a tutti i carichi di lavoro.
  • Linee guida specifiche per la scalabilità cloud

Linee guida globali

Documentazione Descrizione
Cloud Adoption Framework La gestione e la governance dei dati sono un processo del ciclo di vita, che inizia basandosi sulla strategia cloud esistente e conduce fino alle operazioni in corso. Il Cloud Adoption Framework aiuta a guidare il ciclo di vita completo del patrimonio di dati.
Azure Well-Architected Framework L'architettura e le operazioni del carico di lavoro hanno un effetto diretto sui dati. Comprendere in che modo l'architettura può migliorare la gestione e la governance dei dati del carico di lavoro.

Linee guida specifiche per la scalabilità cloud

Sezione Descrizione
Creare una strategia iniziale Come creare la strategia dei dati e il pivot per diventare un'organizzazione guidata dai dati.
Definire il piano Come sviluppare un piano per l'analisi su scala cloud.
Preparare l'ambiente di analisi Panoramica della gestione dei dati e delle zone di destinazione dei dati con considerazioni chiave sull'area di progettazione, ad esempio registrazione aziendale, rete, gestione delle identità e degli accessi, criteri, continuità aziendale e ripristino di emergenza.
Gestire l'analisi Requisiti per gestire dati, catalogo dati, derivazione, gestione dei dati master, qualità dei dati, contratti di condivisione dei dati e metadati.
Proteggere il patrimonio di analisi Come proteggere il patrimonio di analisi con autenticazione e autorizzazione, privacy dei dati e gestione dell'accesso ai dati.
Organizzare utenti e team Come organizzare le operazioni, i ruoli, i team e le funzioni del team efficaci.
Gestire il patrimonio di analisi Come effettuare il provisioning della piattaforma e dell'osservabilità per uno scenario.

Architetture

In questa sezione vengono illustrati i dettagli delle implementazioni fisiche dell'analisi su scala cloud. Esegue il mapping delle architetture fisiche delle zone di destinazione di gestione dei dati e delle zone di destinazione dei dati.

L'analisi su scala cloud ha due concetti chiave dell'architettura:

  • Zona di destinazione dei dati
  • Zona di destinazione per la gestione dei dati

Queste architetture standardzzano le procedure consigliate e riducono al minimo i colli di bottiglia della distribuzione per i team di sviluppo e possono accelerare la distribuzione di soluzioni di analisi su scala cloud comuni. È possibile adottare le linee guida per le architetture lakehouse e mesh di dati. Queste linee guida evidenziano le funzionalità necessarie per una piattaforma di analisi ben regolamentata che si adatta alle proprie esigenze.

Il diagramma seguente offre una panoramica di una piattaforma dati che contiene una zona di destinazione di gestione dei dati centrale e più zone di destinazione dei dati.

Diagramma di una progettazione generale contenente sia una zona di destinazione per la gestione dei dati che le zone di destinazione dei dati.

È possibile iniziare con una singola zona di destinazione e scalare in più zone di destinazione e gestirle tutte dalla zona di destinazione di gestione dei dati.

Per altre informazioni, vedere: Panoramica delle architetture

Modelli di distribuzione

Questa sezione include molti modelli di riferimento che possono essere distribuiti.

Archivio Content Necessario Modello di distribuzione
Modello di gestione dei dati Servizi di gestione dei dati centrali e servizi dati condivisi, ad esempio catalogo dati e runtime di integrazione self-hosted Uno per analisi su scala cloud
Modello della zona di destinazione per i dati Servizi condivisi della zona di destinazione dei dati, inclusi i servizi di inserimento, gestione e archiviazione dei dati Uno per zona di destinazione per i dati
Modello di integrazione dei dati - Elaborazione batch Servizi aggiuntivi necessari per l'elaborazione dei dati batch No Uno o più per zona di destinazione dei dati
Modello di integrazione dei dati - Elaborazione del flusso Servizi aggiuntivi necessari per l'elaborazione del flusso di dati No Uno o più per zona di destinazione dei dati
Modello di prodotto dati - Analisi e data science Servizi aggiuntivi necessari per l'analisi dei dati e l'intelligenza artificiale No Uno o più per zona di destinazione dei dati

Questi modelli contengono modelli di azure Resource Manager, i file di parametri dei modelli e le definizioni di pipeline CI/CD per la distribuzione delle risorse.

I modelli possono cambiare nel tempo a causa di nuovi servizi e requisiti di Azure. Proteggere il ramo principale di ogni repository in modo che rimanga privo di errori e pronto per l'utilizzo e la distribuzione. Usare una sottoscrizione di sviluppo per testare le modifiche alla configurazione del modello prima di unire nuovamente i miglioramenti delle funzionalità nel ramo principale.

Per altre informazioni, vedere Modelli di distribuzione.

Acceleratori di soluzioni

Gli acceleratori di soluzioni sono progetti open source in GitHub. Questi repository contengono risorse e informazioni che semplificano e accelerano la possibilità di risolvere i problemi usando la tecnologia.

Per altre informazioni, vedere Acceleratori di soluzioni.

Procedure consigliate

Gli articoli avanzati di livello 300+ seguenti nel sommario di analisi su scala cloud consentono ai team IT centrali di distribuire strumenti e gestire i processi per la gestione e la governance dei dati:

Espandere la sezione Prodotti Azure in primo piano nel sommario dell'analisi su scala cloud per informazioni sui prodotti di Azure che supportano l'analisi su scala cloud.

Percorsi comuni dei clienti

I percorsi comuni dei clienti seguenti supportano l'analisi su scala cloud:

  • Preparare l'ambiente. Usare gli articoli Preparare l'ambiente come risorse. Definire processi e approcci che supportano l'intero portfolio di carichi di lavoro nel patrimonio di dati.

  • Migliorare i controlli nel proprio data estate. Concentrarsi sugli articoli Governance del patrimonio di dati e Proteggere il patrimonio di dati per integrare l'analisi su scala cloud nelle operazioni esistenti.

  • Influenzare le modifiche ai singoli carichi di lavoro. Man mano che i processi di analisi su scala cloud migliorano, i team di governance dei dati centrali troveranno i requisiti che dipendono dalla conoscenza dell'architettura dietro i singoli carichi di lavoro. Usare gli articoli sull'architettura per comprendere come usare gli scenari all'interno del caso d'uso.

  • Ottimizzare singoli carichi di lavoro e team dei carichi di lavoro. Iniziare con le linee guida di Azure Well-Architected Framework per integrare strategie di analisi su scala cloud in singoli carichi di lavoro. Queste linee guida descrivono le procedure consigliate e le architetture che i team IT e governance centrali devono usare per accelerare lo sviluppo dei singoli carichi di lavoro.

  • Usare le procedure consigliate per eseguire l'onboarding di singoli asset. Espandere la sezione Procedure consigliate nel sommario di analisi su scala cloud per trovare articoli sui processi per l'onboarding dell'intero patrimonio di dati in un piano di controllo di analisi su scala cloud.

  • Usare prodotti Azure specifici. Accelerare e migliorare le funzionalità di analisi su scala cloud usando i prodotti Azure nella sezione Prodotti Azure in primo piano del sommario di analisi su scala cloud .

Intervieni

Per altre informazioni sulla pianificazione per l'implementazione dell'analisi su scala cloud, vedere:

Passaggi successivi

Iniziare il percorso di analisi su scala cloud: