Integrare l'analisi su scala cloud nella strategia di adozione del cloud

Creare una singola strategia di adozione del cloud centralizzata per l'organizzazione usando la metodologia strategia nell'Cloud Adoption Framework di Azure. Se non è già stata registrata la strategia di adozione del cloud, usare la strategia e il modello di piano per farlo.

Questo articolo contiene considerazioni sugli scenari di analisi su scala cloud che influiscono sulla strategia più ampia.

Prima di implementare l'analisi su scala cloud, disporre di un piano per la strategia dei dati. È possibile iniziare con un singolo caso d'uso oppure è possibile avere un set molto più ampio di casi d'uso che richiederanno la priorità. La strategia consente di stabilire i processi e di attivare conversazioni iniziali sui pilastri su cui è necessario concentrarsi.

Assegnare una priorità ai risultati aziendali per la strategia dei dati

Avere una strategia di dati riuscita offre un vantaggio competitivo. È consigliabile allineare sempre la strategia dei dati ai risultati aziendali desiderati. La maggior parte dei risultati aziendali può essere classificata in una delle quattro categorie seguenti:

  • Abilitare i dipendenti: Fornire alla forza lavoro conoscenze in tempo reale dei clienti, dei dispositivi e dei computer. Questa conoscenza consente loro di collaborare in modo efficiente per soddisfare le esigenze aziendali o dei clienti con agilità.

  • Interagire con i clienti: Offrire un'esperienza ricca, personalizzata e connessa ispirata al tuo marchio. Sfruttare il potere dei dati e delle informazioni dettagliate per guidare la fedeltà dei clienti lungo ogni passaggio di un percorso dei clienti.

  • Ottimizzare le operazioni: Aumentare il flusso di informazioni nell'intera organizzazione. Sincronizzare i processi aziendali e usare un approccio basato sui dati per rendere ogni interazione utile.

  • Trasformare i prodotti e il ciclo di vita dello sviluppo: Raccogliere i dati di telemetria relativi ai servizi e alle offerte. Usare i dati di telemetria per assegnare priorità a una versione o creare una nuova funzionalità e valutare l'efficacia e l'adozione continua.

Dopo aver prioritario i risultati aziendali, esaminare i progetti correnti e iniziative strategiche a lungo termine e classificarli di conseguenza. È consigliabile combinare le quattro categorie di risultati aziendali in un formato matrice basato sulla complessità e sull'impatto. Prendere in considerazione anche l'aggiunta di pilastri dell'architettura per approfondire lo scenario.

Sbloccare il valore strategico

La creazione di una cultura basata sui dati che guida il business in avanti in modo coerente, in avanti, agile e informato ha alcune complessità intrinseche e realtà di base. Prima di entrare nella fase di distribuzione, concentrarsi sulle attività di formazione di una strategia di dati coerente che consente di ottenere i risultati aziendali desiderati.

L'analisi su scala cloud è allineata alle motivazioni incentrate sull'innovazione. I seguenti driver comuni motivano i clienti a integrare questo scenario nella strategia di adozione del cloud:

  • Framework di analisi scalabile, che consente di creare una piattaforma dati aziendale
  • Self-service, che consente agli utenti di esplorazione dei dati, creazione di asset dati e sviluppo di prodotti
  • Impostazioni cultura guidate dai dati con asset di dati riutilizzabili, community di dati, scambio di terze parti sicure e condivisione sul posto
  • Condivisione dei dati con attendibilità, uso di criteri, identità comune, riservatezza e crittografia
  • Miglioramento delle esperienze degli utenti e del relativo engagement
  • Trasformazione di prodotti o servizi
  • Perturbazione del mercato con nuovi prodotti o servizi

Il diagramma seguente contiene temi chiave che consentono di realizzare queste motivazioni nella propria strategia. Analizzare attentamente questi temi e come contribuiscono a una strategia di dati coerente. Si consideri anche come sbloccare il valore strategico dei dati, consente una crescita aziendale coerente.

Diagramma che illustra i temi principali dell'aumento dell'efficienza, della democratizzazione dei dati e della governance.

"Una strategia per i dati è la base per usare i dati quale asset e favorire la crescita dell'azienda. Non si tratta di un rimedio improvvisato per i problemi di dati, bensì di un piano di massima a lungo termine che definisce le persone, i processi e la tecnologia da mettere in atto per risolvere le sfide legate ai dati."

La creazione della strategia è un passaggio. L'esecuzione della strategia su scala aziendale rappresenta una grande sfida per le impostazioni cultura, le persone, i processi e le scelte tecnologiche esistenti dell'organizzazione. L'esecuzione richiede l'impegno e la proprietà chiara a tutti i livelli dell'organizzazione.

Aumento dell'efficienza

L'agilità del cloud richiede alle organizzazioni di adattarsi rapidamente e portare efficienza a tutte le aree aziendali. Secondo il report sui rischi emergenti di Gartner, nonostante le organizzazioni continuino a concentrarsi su e investire in iniziative digitali, due terzi di queste organizzazioni mostrano debolezze aziendali e non riescono a raggiungere le aspettative, anche se continuano a concentrarsi su e investire in iniziative digitali,

Operazioni di gestione dei dati

Molte organizzazioni hanno lentamente decentralizzato l'IT centrale per abilitare l'agilità. Le organizzazioni vogliono innovare rapidamente e avere accesso ai dati unificati a livello aziendale in modo self-service consente loro di soddisfare requisiti aziendali difficili.

Sono molti i motivi per cui le aziende non riescono a sfruttare al massimo il potenziale dei loro dati. Potrebbe essere dovuto al fatto che le funzioni aziendali funzionano in silos, in cui ogni team usa strumenti e standard diversi per l'analisi dei dati. In alternativa, potrebbe verificarsi un errore per collegare gli indicatori di prestazioni chiave agli obiettivi aziendali generali.

La democratizzazione dei dati consente di restituire valore all'azienda e di raggiungere obiettivi di crescita aziendali impegnativi.

  • Comprendere e assegnare priorità alle esigenze dei LOBS.
  • Distribuire i dati tra domini per abilitare la proprietà e avvicinare i dati agli utenti.
  • Distribuire prodotti dati self-service per guidare informazioni dettagliate e valore aziendale.

Per la governance dei dati, è necessario raggiungere un equilibrio appropriato nel mondo decentralizzato di una democratizzazione dei dati. Se si applica troppo rigorosamente la governance, è possibile stifare l'innovazione. Tuttavia, se non si hanno almeno alcuni principi di base e processi sul posto, è probabile che si finissi con i silos di dati. Questi silos possono danneggiare la reputazione dell'organizzazione e i potenziali ricavi. Un approccio olistico alla governance dei dati è fondamentale per sbloccare il valore strategico dei dati in modo coerente.

L'assenza di una strategia di dati ben ponderata porta a una necessità di "andare" e iniziare rapidamente a fornire valore all'organizzazione. Risolvere i problemi aziendali attuali agendo sui temi chiave menzionati in precedenza o usandoli come principi strategici all'interno di un quadro. L'uso di questi temi chiave consente anche di creare una strategia di dati olistica iterativa con la convalida, ma ancora fornire risultati tempestivi. I leader aziendali e tecnologici devono sviluppare le strategie e la mentalità necessarie per generare valore dai dati e ridimensionare rapidamente in modo semplificato e strutturato

Per altre informazioni, vedere Che cos'è la governance dei dati?

Sviluppare una cultura basata sui dati

Per creare una strategia di dati efficace, è necessaria una cultura basata sui dati. Sviluppare una cultura che promuove in modo coerente la partecipazione aperta e collaborativa. In questo tipo di cultura, l'intera forza lavoro può imparare, comunicare e migliorare i risultati aziendali dell'organizzazione. Lo sviluppo di impostazioni cultura basate sui dati migliora anche la capacità di ogni dipendente di generare un impatto o un'influenza supportata dai dati.

Il punto di partenza del viaggio dipende dall'organizzazione, dal settore e dalla posizione corrente lungo la curva di maturità. Il diagramma seguente mostra un modello di maturità di esempio che illustra i livelli di maturità dell'utilizzo dell'intelligenza artificiale di un'organizzazione:

Diagramma della maturità di un'organizzazione in evoluzione.

Livello 0

I dati non vengono sfruttati a livello di codice e in modo coerente. Lo stato attivo dei dati dell'organizzazione è dal punto di vista dello sviluppo di applicazioni.

A livello 0, l'organizzazione spesso ha progetti di analisi non pianificati. Ogni applicazione è altamente specializzata per i dati univoci e le esigenze degli stakeholder. Ogni applicazione ha anche importanti basi di codice e team di progettazione, con molti tecnici tecnici all'esterno dell'IT. L'abilitazione del caso d'uso e l'analisi sono in silo.

Livello 1

A livello 1, i team vengono creati e la strategia vengono creati, ma l'analisi rimane repartizzata. L'organizzazione tende a essere adatta a acquisizione e analisi dei dati tradizionali. Potrebbe avere un certo livello di impegno per un approccio a livello di cloud. Ad esempio, potrebbe già accedere ai dati dal cloud.

Livello 2

La piattaforma di innovazione dell'organizzazione è quasi pronta. I flussi di lavoro sono disponibili per affrontare la qualità dei dati. L'organizzazione può rispondere ad alcune domande relative alle motivazioni.

A livello 2, l'organizzazione sta cercando attivamente una strategia di dati end-to-end che usa archivi data lake gestiti centralmente per controllare lo sprawl dell'archivio dati e migliorare l'individuazione dei dati. L'organizzazione è pronta per applicazioni intelligenti che portano il calcolo ai data lake regolati centralmente. Queste applicazioni intelligenti riducono i rischi di privacy, i costi di calcolo e la necessità di copie federate di dati importanti.

A questo livello, l'organizzazione è anche pronta a usare multi-tenant, ospitato centralmente, servizi dati condivisi per le attività di calcolo dei dati comuni. Questi servizi dati condivisi consentono informazioni dettagliate rapide dai servizi di intelligence basati su data science.

Level 3

L'organizzazione usa un approccio olistico ai dati. I progetti correlati ai dati sono integrati all'interno dei risultati aziendali. L'organizzazione usa piattaforme di analisi per produrre stime.

A livello 3, l'organizzazione sblocca l'innovazione digitale sia dai punti di vista dello sviluppo di dati che di applicazioni. I servizi dati fondamentali sono disponibili, inclusi i data lake e i servizi dati condivisi.

Più team dell'organizzazione forniscono correttamente carichi di lavoro aziendali critici, casi d'uso aziendali chiave e risultati misurabili. I nuovi servizi dati condivisi vengono identificati usando i dati di telemetria. IT è un advisor attendibile per i team dell'azienda, usando una strategia di dati end-to-end attendibile e connessa per migliorare i processi aziendali critici.

Livello 4

A livello 4, l'intera organizzazione usa framework, standard aziendali e impostazioni cultura basate sui dati. L'automazione, i cicli di feedback basati sui dati e i centri di eccellenza relativi all'analisi o all'automazione possono essere osservati in azione.

Sviluppare obiettivi allineati all'azienda

L'individuazione delle priorità in linea con la visione aziendale e il mantenimento della filosofia di pensare in grande, iniziare in piccolo e agire rapidamente sono le chiavi del successo. La scelta del caso d'uso giusto non deve essere sempre un processo di verifica difficile e a lungo termine. Potrebbe essere un problema in corso in qualunque unità aziendale in cui siano disponibili dati sufficienti per convalidare il ritorno sugli investimenti, una maggiore propensione e un facile buy-in. La situazione può evolvere rapidamente e una buona parte dell'organizzazione può riscontrare difficoltà ad avviarsi.

Informazioni sugli attributi dei dati

Per creare una strategia di dati avanzata, è necessario comprendere il funzionamento dei dati. Conoscere le caratteristiche principali dei dati consente di creare una pratica principiod per la gestione dei dati.

I dati viaggiano rapidamente, ma la sua velocità non può sfidare le leggi della fisica. I dati devono essere conformi alle leggi della terra e all'industria che l'ha creata.

I dati non cambiano da soli, ma sono soggetti a modifiche e perdite accidentali, a meno che non si mettono misure al posto per attenuare tali sfide. Inserire misure anti-danneggiamento per controlli, database e archiviazione sul posto in modo da poter gestire modifiche impreviste. Assicurarsi inoltre di aver configurato il monitoraggio, i controlli, gli avvisi e i processi downstream.

Da soli, i dati non generano informazioni dettagliate o producono alcun valore. Per ottenere informazioni dettagliate o estrarre valore, è necessario inserire la maggior parte o tutti i dati tramite quattro passaggi discreti:

  1. Inserimento
  2. Archiviazione
  3. Elaborazione in corso
  4. Analisi

Ognuno di questi quattro passaggi ha i propri principi, processi, strumenti e tecnologie.

La conservazione dei dati e le informazioni correlate possono influire sulle decisioni socioeconomiche, politiche, di ricerca e di investimento. È fondamentale che l'organizzazione sia in grado di fornire informazioni dettagliate in modo sicuro e responsabile. Tutti i dati generati o acquisiti devono passare attraverso un esercizio di classificazione dei dati, a meno che non diversamente indicato in modo esplicito. La crittografia è lo standard gold per la gestione dei dati riservati sia inattivi che in transito.

I dati, le applicazioni e i servizi hanno tutte le proprie pull gravità, ma il pull dei dati è il più grande. A differenza della leggendaria mela di Sir Isaac Newton, i dati non hanno massa fisica che influisce sugli oggetti circostanti. Ha invece latenza e velocità effettiva, che fungono da acceleratori per il processo di analisi. La latenza, la velocità effettiva e la facilità di accesso richiedono spesso di duplicare i dati, anche quando non è consigliabile. Configurare le persone, i processi, gli strumenti e le tecnologie in modo appropriato in modo da poter bilanciare tali requisiti con i criteri dei dati dell'organizzazione.

I costrutti dell'architettura regolano la velocità in cui è possibile elaborare i dati. I costrutti sono facilitati tramite innovazioni nel software, nell'hardware e nella rete. Alcune considerazioni sull'architettura sono:

  • Configurazione della distribuzione dei dati
  • Partizionamento
  • Tecnologie della cache
  • Elaborazione batch rispetto a elaborazione del flusso
  • Bilanciamento dell'elaborazione lato client e back-end

Definire la strategia dei dati

L'uso dei dati come vantaggio competitivo per la creazione di prodotti migliori e servizi di valore superiore non è niente di nuovo. Ma il volume, la velocità e la varietà di dati abilitati per il cloud computing è.

La progettazione di una moderna piattaforma di analisi dei dati nel cloud è costituita da sicurezza, governance, monitoraggio, scalabilità su richiesta, operazioni di dati e self-service. La comprensione dell'interazione tra questi facet è ciò che distingue una strategia di dati ottimale da una buona. Usare strumenti come il Cloud Adoption Framework per garantire la coesistenza dell'architettura, l'integrità e le procedure consigliate.

Per essere efficace, la strategia dei dati deve contenere il provisioning per la governance dei dati. Il diagramma seguente illustra le fasi principali di un ciclo di vita dei dati, concentrandosi sulla governance dei dati come obiettivo:

Diagramma di un ciclo di vita dei dati.

Le sezioni seguenti descrivono le considerazioni da usare durante la scelta dei principi di progettazione dei livelli della strategia dei dati. Concentrarsi sulla fornitura di risultati aziendali e valore dai dati.

Inserimento dati

Una considerazione fondamentale per l'inserimento dei dati è la possibilità di creare rapidamente una pipeline di dati in modo sicuro e conforme, dai requisiti all'ambiente di produzione. Gli elementi importanti includono le tecnologie basate su metadati, self-service e low-code che idratano il data lake.

Quando si creano pipeline, considerare sia la progettazione che la possibilità di wrangle data, distribuire dati e ridimensionare il calcolo. È anche necessario assicurarsi di disporre del supporto DevOps corretto per l'integrazione e il recapito continuo della pipeline.

Strumenti come Azure Data Factory supportano una pletora di origini dati locali, software come servizio (SaaS) e altre origini dati da altri cloud pubblici.

Archiviazione

Contrassegna e organizza i dati in livelli fisici e logici. I data lake fanno parte di tutte le architetture di analisi dei dati moderne. L'organizzazione deve applicare requisiti appropriati per la privacy, la sicurezza e la conformità dei dati che soddisfano tutti i requisiti di conformità per la classificazione dei dati e il settore in uso. La democratizzazione dei dati a livello di organizzazione e self-service, che alimenta l'innovazione mentre è guidata dal controllo di accesso appropriato.

Scegliere lo spazio di archiviazione appropriato per il carico di lavoro. Anche se non si ottiene l'archiviazione esattamente corretta la prima volta, il cloud consente di eseguire il failover rapidamente e riavviare il percorso. Usare i requisiti dell'applicazione per scegliere il database migliore. Assicurarsi di considerare la possibilità di elaborare i dati batch e di streaming durante la scelta della piattaforma di analisi.

Elaborazione dati

Le esigenze di elaborazione dei dati variano con ogni carico di lavoro. La maggior parte dell'elaborazione dei dati su larga scala contiene elementi di elaborazione in tempo reale e batch. La maggior parte delle aziende ha anche elementi dei requisiti di elaborazione delle serie temporali e una necessità di elaborare testo libero per le funzionalità di ricerca aziendali.

L'elaborazione delle transazioni online (OLTP) offre i requisiti di elaborazione aziendale più diffusi. Alcuni carichi di lavoro richiedono un'elaborazione specializzata come hpC (High Performance Computing), talvolta denominata "big compute". Questi carichi di lavoro risolveranno attività matematiche complesse usando molti computer basati su CPU o GPU.

Per determinati carichi di lavoro specializzati, i clienti possono proteggere gli ambienti di esecuzione come il calcolo riservato di Azure, che consente agli utenti di proteggere i dati mentre i dati vengono usati all'interno di piattaforme cloud pubbliche. Questo stato è necessario per un'elaborazione efficiente. I dati sono protetti all'interno di un ambiente di esecuzione attendibile , noto anche come enclave. Un TEE protegge il codice e i dati da qualsiasi visualizzazione e modifica esterna. Le TEE consentono di eseguire il training dei modelli di intelligenza artificiale senza sacrificare la riservatezza dei dati, anche quando si usano origini dati provenienti da organizzazioni diverse.

Elaborazione analitica

Il costrutto di estrazione, trasformazione e caricamento (ETL) è correlato alle esigenze di elaborazione analitica online (OLAP) e data warehousing. Un modello di dati allineato all'azienda e un modello semantico che consente alle organizzazioni di implementare regole aziendali e indicatori di prestazioni chiave (INDICATORI KPI) vengono spesso implementati come parte del processo analitico. Una funzionalità utile è il rilevamento automatico della deriva dello schema.

Riepilogo della strategia dei dati

Prendendo un approccio di principio ad altre considerazioni, ad esempio governance dei dati e intelligenza artificiale responsabile, paga i dividendi più avanti.

Microsoft segue quattro principi fondamentali: equità, affidabilità e sicurezza, privacy e sicurezza e inclusività. I due principi fondamentali della trasparenza e della responsabilità sono fondamentali per tutti e quattro i principi fondamentali.

Abbiamo messo in pratica i nostri principi e l'intelligenza artificiale responsabile sviluppando risorse e un sistema di governance. Alcune delle linee guida riguardano l'interazione umana/intelligenza artificiale, l'intelligenza artificiale conversazionale, la progettazione inclusiva, un elenco di controllo di equità di intelligenza artificiale e un foglio dati per i set di dati.

Abbiamo anche sviluppato un set di strumenti per aiutare gli altri a comprendere, proteggere e controllare l'intelligenza artificiale in ogni fase dell'innovazione. Questi strumenti sono frutto di sforzi di collaborazione multidisciplinari per rafforzare e accelerare l'intelligenza artificiale responsabile. La collaborazione ha esteso la progettazione e lo sviluppo del software, le scienze sociali, la ricerca degli utenti, la legge e la politica.

Per migliorare la collaborazione, sono stati aperti molti strumenti come InterpretML e Fairlearn. Altri possono contribuire a e costruire su questi strumenti di open source. Inoltre, sono stati democratizzati strumenti tramite Azure Machine Learning.

Il pivot per diventare un'organizzazione guidata dai dati è fondamentale per offrire un vantaggio competitivo nella nuova normalità. Microsoft desidera aiutare i clienti a passare da un approccio basato solo sulle applicazioni a un approccio basato sulle applicazioni e sui dati. Un approccio incentrato su applicazioni e dati consente di creare una strategia di dati end-to-end che garantisce ripetibilità e scalabilità nei casi d'uso correnti e futuri che influiscono sui risultati aziendali.

Diagramma dello sblocco dell'innovazione digitale.

Promuovere l'impegno, la comunicazione e l'engagement

Tutti i ruoli chiave coinvolti nella strategia dei dati devono comprendere chiaramente l'approccio adottato e gli obiettivi aziendali comuni. I ruoli chiave possono includere un team di leadership (livello C), business unit, IT, operazioni e team di distribuzione.

La comunicazione è una delle parti più importanti di questo framework. L'organizzazione deve definire un processo per una comunicazione efficace tra i ruoli. La comunicazione consente di offrire in modo efficace nel contesto del progetto corrente. Definisce anche un forum che aiuta tutti gli utenti coinvolti a rimanere in linea, aggiornati e incentrati sull'obiettivo complessivo di creare una strategia olistica per i dati per il futuro.

Il coinvolgimento è essenziale tra i due gruppi seguenti:

  • membri del team che progettano e implementano la strategia dei dati
  • Membri del team che contribuiscono ai dati, consumano e sfruttano i dati, ad esempio le business unit che prenderemo decisioni e creeranno risultati in base ai dati.

Per metterlo in un altro modo, le strategie dei dati e le piattaforme dati associate create senza problemi di rischio di coinvolgimento degli utenti nella pertinenza e nell'adozione.

Due processi strategici consentono di realizzare correttamente questo framework:

  • la formazione di un centro di eccellenza
  • l'adozione di un metodo di recapito agile

Per altre informazioni, vedere Sviluppare un piano per l'analisi su scala cloud.

Generare valore

Quando si distribuiscono i prodotti dati in base ai criteri di successo in modo standardizzato e strutturato, il recapito convalida il framework iterativo. Inoltre, l'uso dell'apprendimento per innovare continuamente consente di creare fiducia aziendale e ampliare gli obiettivi della strategia dei dati. Questo processo offre un'adozione più chiara e più rapida nell'organizzazione.

Lo stesso vale per la piattaforma dati. Quando si dispone di una configurazione in cui più team operano in modo abbastanza autonomo, è consigliabile guidare verso una mesh. Ottenere un processo iterativo. In molti casi, richiede modifiche significative alla configurazione, alla preparazione e all'allineamento aziendale dell'organizzazione

Passaggi successivi

Leggere gli articoli seguenti per trovare materiale sussidiario per il percorso di adozione del cloud e fare in modo che lo scenario di adozione del cloud sia riuscito: