Democratización de datos con la invención digitalDemocratize data with digital invention

El carbón, el aceite y el potencial humano fueron los tres recursos más importantes durante la revolución industrial.Coal, oil, and human potential were the three most consequential assets during the industrial revolution. Estos recursos creaban compañías, movían los mercados y, en última instancia, cambiaban países.These assets built companies, shifted markets, and ultimately changed nations. En la economía digital, hay tres recursos igualmente importantes: datos, dispositivos y potencial humano.In the digital economy, there are three equally important assets: data, devices, and human potential. Cada uno de estos recursos presenta un fantástico potencial de innovación.Each of these assets holds great innovation potential. En cualquier trabajo de innovación de la era moderna, los datos son el nuevo aceite.For any innovation effort in the modern era, data is the new oil.

En todas las empresas de hoy en día, hay depósitos de datos que podrían emplearse para buscar y satisfacer las necesidades de los clientes de manera más eficaz.Across every company today, there are pockets of data that could be used to find and meet customer needs more effectively. Lamentablemente, el proceso de minería de datos para impulsar la innovación es muy costoso y lento.Unfortunately, the process of mining that data to drive innovation has long been costly and time-consuming. Muchas de las soluciones más valiosas para las necesidades de los clientes se desestiman porque las personas adecuadas no pueden acceder a los datos que necesitan.Many of the most valuable solutions to customer needs go unmet because the right people can't access the data they need.

La democratización de los datos es el proceso de poner estos datos en las manos adecuadas para impulsar la innovación.Democratization of data is the process of getting this data into the right hands to drive innovation. Este proceso puede tener varias formas, pero generalmente incluye soluciones para datos sin procesar ingeridos o integrados, centralización de datos, uso compartido de datos y protección de datos.This process can take several forms, but they generally include solutions for ingested or integrated raw data, centralization of data, sharing data, and securing data. Cuando estos métodos se ejecutan correctamente, los expertos de la empresa pueden usar los datos para probar los supuestos.When these methods are successful, experts around the company can use the data to test hypotheses. En muchos casos, los equipos de adopción de la nube pueden crear con empatía con el cliente usando solo datos, lo que permite satisfacer rápidamente las necesidades existentes de los clientes.In many cases, cloud adoption teams can build with customer empathy using only data, and rapidly addressing existing customer needs.

Proceso de democratización de los datosProcess of democratizing data

En las siguientes fases se guiarán las decisiones y los enfoques necesarios para adoptar una solución que democratiza los datos.The following phases will guide the decisions and approaches required to adopt a solution that democratizes data. No todas las fases serán obligatorias para crear una solución específica.Not every phase will necessarily be required to build a specific solution. Sin embargo, debe evaluar cada fase cuando cree una solución para una hipótesis de cliente.However, you should evaluate each phase when you're building a solution to a customer hypothesis. Cada una de ellas proporciona un enfoque único para la creación de soluciones innovadoras.Each provides a unique approach to the creation of innovative solutions.

Proceso de democratización de los datos

Compartir datosShare data

Al crear con empatía con el cliente, todos los procesos priorizan la necesidad del cliente frente a una solución técnica.When you build with customer empathy, all processes elevate customer need over a technical solution. Dado que la democratización de los datos no es una excepción, comenzaremos compartiendo los datos.Because democratizing data is no exception, we start by sharing data. Para democratizar los datos, debe incluir una solución que comparta los datos con un consumidor de datos.To democratize data, it must include a solution that shares data with a data consumer. El consumidor de datos puede ser un cliente directo o un servidor proxy que toma decisiones para los clientes.The data consumer could be a direct customer or a proxy who makes decisions for customers. Los consumidores de datos aprobados tienen la capacidad de realizar análisis, preguntas e informes con los datos centralizados, sin soporte técnico del personal de TI.Approved data consumers can analyze, interrogate, and report on centralized data, with no support from IT staff.

Muchas innovaciones de éxito se han iniciado como soluciones de producto mínimo viable (MVP) que proporcionan procesos manuales y controlados por datos en nombre del cliente.Many successful innovations have been launched as a minimum viable product (MVP) that deliver manual, data-driven processes on behalf of the customer. En este modelo, un empleado es el consumidor de los datos.In this concierge model, an employee is the data consumer. Ese empleado utiliza datos para ayudar al cliente.That employee uses data to aid the customer. Cada vez que el cliente se pone en contacto con el soporte manual, se puede probar y validar una hipótesis.Each time the customer engages manual support, a hypothesis can be tested and validated. Este enfoque suele ser un medio rentable de probar una hipótesis centrada en el cliente antes de realizar grandes inversiones en soluciones integradas.This approach is often a cost effective means of testing a customer-focused hypothesis before you invest heavily in integrated solutions.

Las principales herramientas para compartir datos directamente con los consumidores de datos incluyen informes de autoservicio o datos insertados en otras experiencias mediante herramientas como Power BI.The primary tools for sharing data directly with data consumers include self-service reporting or data embedded within other experiences, using tools like Power BI.

Nota

Antes de compartir datos, asegúrese de haber leído las secciones siguientes.Before you share data, make sure you've read the following sections. El uso compartido de datos puede requerir gobernanza para proteger los datos compartidos.Sharing data might require governance to provide protection for the shared data. Además, los datos pueden estar diseminados en varias nubes y podrían requerir centralización.Also, that data might be spread across multiple clouds and could require centralization. Gran parte de los datos pueden residir incluso dentro de las aplicaciones, lo que requerirá recopilar los datos antes de compartirlos.Much of the data might even reside within applications, which will require data collection before you can share it.

Gobernanza de los datosGovern data

El uso compartido de datos puede generar rápidamente un producto viable mínimo que puede usar en las conversaciones con los clientes.Sharing data can quickly produce an MVP that you can use in customer conversations. No obstante, para convertir los datos compartidos en conocimientos procesables, suele hacer falta algo más.However, to turn that shared data into useful and actionable knowledge, a bit more is generally required. Una vez que se ha validado una hipótesis mediante el uso compartido de datos, la siguiente fase de desarrollo suele ser la gobernanza de los datos.After a hypothesis has been validated through data sharing, the next phase of development is typically data governance.

La gobernanza de los datos es un tema amplio que podría requerir su propio marco dedicado.Data governance is a broad topic that could require its own dedicated framework. Este grado de granularidad queda fuera del ámbito de Cloud Adoption Framework.That degree of granularity is outside the scope of the Cloud Adoption Framework. Sin embargo, hay algunos aspectos de la gobernanza de los datos que se deben tener en cuenta en el momento en que se valida la hipótesis del cliente.However, there are several aspects of data governance that you should consider as soon as the customer hypothesis is validated. Por ejemplo:For example:

  • ¿Los datos compartidos son confidenciales?Is the shared data sensitive? Los datos se deben clasificar antes de hacer cualquier uso compartido público para proteger los intereses de los clientes y de la empresa.Data should be classified before being shared publicly to protect the interests of customers and the company.
  • Si los datos son confidenciales, ¿se han protegido?If the data is sensitive, has it been secured? La protección de los datos confidenciales debe ser un requisito en todo dato democratizado.Protection of sensitive data should be a requirement for any democratized data. La carga de trabajo de ejemplo centrada en proteger las soluciones de datos proporciona algunas referencias para proteger los datos.The example workload focused on securing data solutions provides a few references for securing data.
  • ¿Los datos están catalogados?Is the data cataloged? Capturar detalles sobre los datos que se comparten ayuda a administrar los datos a largo plazo.Capturing details about the data being shared will aid in long-term data management. Las herramientas para documentar datos, como Azure Data Catalog, pueden hacer que este proceso sea mucho más fácil en la nube.Tools for documenting data, like Azure Data Catalog, can make this process much easier in the cloud. El asesoramiento sobre la anotación de los datos y la documentación de los orígenes de datos puede ayudar a acelerar el proceso.Guidance regarding the annotation of data and the documentation of data sources can help accelerate the process.

Cuando la democratización de los datos es importante para una hipótesis centrada en el cliente, asegúrese de que la gobernanza de los datos compartidos esté en alguna parte del plan de lanzamiento.When democratization of data is important to a customer-focused hypothesis, make sure the governance of shared data is somewhere in the release plan. Esto ayudará a proteger a los clientes, los consumidores de datos y la empresa.This will help protect customers, data consumers, and the company.

Centralización de los datosCentralize data

Cuando se interrumpe el flujo de datos en un entorno de TI, las oportunidades de innovación pueden ser muy limitadas, costosas y lentas.When data is disrupted across an IT environment, opportunities to innovate can be extremely constrained, expensive, and time-consuming. La nube proporciona nuevas oportunidades para centralizar los datos en silos de datos.The cloud provides new opportunities to centralize data across data silos. Cuando es necesario centralizar varios orígenes de datos para crear con empatía con el cliente, la nube puede acelerar la prueba de las hipótesis.When centralization of multiple data sources is required to build with customer empathy, the cloud can accelerate the testing of hypotheses.

Precaución

La centralización de los datos representa un punto de riesgo en cualquier proceso de innovación.Centralization of data represents a risk point in any innovation process. Cuando la centralización de datos supone una demanda técnica, y no una fuente de valor del cliente, se recomienda retrasar la centralización hasta que se hayan validado las hipótesis del cliente.When data centralization is a technical spike, and not a source of customer value, we suggest that you delay centralization until the customer hypotheses have been validated.

Si es necesario centralizar los datos, el primer paso es definir el almacén de datos adecuado para los datos centralizados.If centralization of data is required, you should first define the appropriate data store for the centralized data. El procedimiento recomendado es establecer un almacenamiento de datos en la nube.It's a good practice to establish a data warehouse in the cloud. Esta opción escalable proporciona una ubicación central para todos los datos.This scalable option provides a central location for all your data. Este tipo de solución está disponible en las opciones de procesamiento analítico en línea (OLAP) o de macrodatos.This type of solution is available in online analytical processing (OLAP) or big data options.

Las arquitecturas de referencia de las soluciones OLAP y de macrodatos pueden ayudarle a elegir la solución más adecuada en Azure.The reference architectures for OLAP and big data solutions can help you choose the most relevant solution in Azure. Si se requiere una solución híbrida, la arquitectura de referencia para la extensión de los datos locales también puede ayudar a acelerar el desarrollo de soluciones.If a hybrid solution is required, the reference architecture for extending on-premises data can also help accelerate solution development.

Importante

En función de las necesidades del cliente y la solución correspondiente, quizás un enfoque más sencillo sea suficiente.Depending on the customer need and the aligned solution, a simpler approach may be sufficient. El arquitecto de la nube debe desafiar al equipo para que considere soluciones de menor costo que podrían permitir una validación más rápida de la hipótesis del cliente, especialmente durante las primeras fases del desarrollo.The cloud architect should challenge the team to consider lower cost solutions that could result in faster validation of the customer hypothesis, especially during early development. En la siguiente sección sobre la recopilación de datos se tratan algunos escenarios que podrían sugerir una solución diferente para su situación.The following section on collecting data covers some scenarios that might suggest a different solution for your situation.

Recopilación de datosCollect data

Cuando los datos deben centralizarse para satisfacer las necesidades de un cliente, es muy probable que también sea necesario recopilar los datos de varios orígenes y pasarlos al almacén de datos centralizado.When you need data to be centralized to address a customer need, it's very likely that you'll also have to collect the data from various sources and move it into the centralized data store. Existen principalmente dos maneras de recopilar datos: integración e ingesta.The two primary forms of data collection are integration and ingestion.

Integración: los datos existentes que ya residen en un almacén de datos se pueden integrar en el almacén de datos centralizado mediante técnicas tradicionales de movimiento de datos.Integration: Data that resides in an existing data store can be integrated into the centralized data store by using traditional data movement techniques. Esto es especialmente frecuente en escenarios que implican el almacenamiento de datos en varias nubes.This is especially common for scenarios that involve multicloud data storage. Estas técnicas implican la extracción de los datos del almacén de datos existente y su carga posterior en el almacén de datos central.These techniques involve extracting the data from the existing data store and then loading it into the central data store. En algún momento de este proceso, los datos suelen transformarse para facilitar su uso y para que sean más pertinentes en el almacén central.At some point in this process, the data is typically transformed to be more usable and relevant in the central store.

Las herramientas basadas en la nube han convertido estas técnicas en herramientas de pago por uso, lo que reduce las barreras iniciales para la centralización y recopilación de los datos.Cloud-based tools have turned these techniques into pay-per-use tools, reducing the barrier to entry for data collection and centralization. Herramientas como Azure Database Migration Service y Azure Data Factory son dos ejemplos.Tools like Azure Database Migration Service and Azure Data Factory are two examples. La arquitectura de referencia para una factoría de datos con un almacén de datos OLAP es un ejemplo de este tipo de solución.The reference architecture for Data Factory with an OLAP data store is an example of one such solution.

Ingesta: algunos datos no residen en un almacén de datos existente.Ingestion: Some data doesn't reside in an existing data store. Cuando estos datos transitorios son una fuente principal de innovación, se deben tener en cuenta enfoques alternativos.When this transient data is a primary source of innovation, you'll want to consider alternative approaches. Los datos transitorios se pueden encontrar en diversos orígenes, tales como aplicaciones, API, flujos de datos, dispositivos IoT, cadenas de bloques, caché de aplicaciones, contenido multimedia o incluso archivos planos.Transient data can be found in a variety of existing sources like applications, APIs, data streams, IoT devices, a blockchain, an application cache, in media content, or even in flat files.

Puede integrar estas diversas formas de datos en un almacén de datos central en una solución OLAP o de macrodatos.You can integrate these various forms of data into a central data store on an OLAP or big data solution. Sin embargo, en las primeras iteraciones del ciclo de creación-medición-aprendizaje, una solución de procesamiento transaccional en línea (OLTP) puede ser más que suficiente para validar la hipótesis de un cliente.However, for early iterations of the build-measure-learn cycle, an online transactional processing (OLTP) solution might be more than sufficient to validate a customer hypothesis. Las soluciones OLTP no son la mejor opción en todos los escenarios de informes.OLTP solutions aren't the best option for any reporting scenario. Sin embargo, al crear con empatía con el cliente, es más importante centrarse en las necesidades del cliente que en las decisiones sobre herramientas técnicas.However, when you're building with customer empathy, it's more important to focus on customer needs than on technical tooling decisions. Una vez validada la hipótesis del cliente a escala, puede ser necesaria una plataforma más adecuada.After the customer hypothesis is validated at scale, a more suitable platform might be required. La arquitectura de referencia de los almacenes de datos OLTP puede ayudar a determinar qué almacén de datos es el más adecuado para la solución.The reference architecture on OLTP data stores can help you determine which data store is most appropriate for your solution.

Virtualización: La integración y la ingesta de datos a veces pueden ralentizar la innovación.Virtualize: Integration and ingestion of data can sometimes slow innovation. Si ya hay disponible una solución de virtualización de datos, podría representar un enfoque más razonable.When a solution for data virtualization is already available, it might represent a more reasonable approach. La ingesta y la integración pueden duplicar los requisitos de almacenamiento y desarrollo, agregar latencia de datos, aumentar el área expuesta a ataques, desencadenar problemas de calidad y aumentar el trabajo de gobernanza.Ingestion and integration can both duplicate storage and development requirements, add data latency, increase attack surface area, trigger quality issues, and increase governance efforts. La virtualización de los datos es una alternativa más actual que deja los datos originales en una ubicación única y crea consultas de paso a través o almacenadas en caché de los datos de origen.Data virtualization is a more contemporary alternative that leaves the original data in a single location and creates pass-through or cached queries of the source data.

SQL Server 2017 y Azure SQL Data Warehouse admiten PolyBase, que es el enfoque de virtualización de datos que se usa con más frecuencia en Azure.SQL Server 2017 and Azure SQL Data Warehouse both support PolyBase, which is the approach to data virtualization most commonly used in Azure.

Pasos siguientesNext steps

Cuando ya se disponga de una estrategia de democratización de los datos, lo siguientes es evaluar los enfoques para involucrar a los clientes mediante las aplicaciones.With a strategy for democratizing data in place, you'll next want to evaluate approaches to engaging customers through applications.