Descripción de los tipos de soluciones de almacenamiento de datos

Hay tres tipos comunes de soluciones de almacenamiento de datos:

  • Almacenamiento de datos empresariales: un almacenamiento de datos empresariales (EDW) es un almacén de datos centralizado que proporciona análisis y servicios de ayuda para la toma de decisiones en toda la empresa. Los datos fluyen en el almacenamiento procedentes de varios sistemas transaccionales, bases de datos relacionales y otros orígenes de datos de forma periódica. Los datos almacenados se usan para la realización de informes históricos y de análisis de tendencias. El almacenamiento de datos actúa como repositorio central de muchas áreas temáticas. Contiene el único "origen de los datos".
  • Data mart: un data mart tiene la misma finalidad que un almacenamiento de datos, pero está diseñado para las necesidades de un solo equipo o unidad de negocio, como los de ventas o recursos humanos. Un data mart es más pequeño y específico, y suele prestar servicio a un área temática concreta.
  • Almacén de datos operativo: un almacén de datos operativo (ODS) se usa como almacén provisional para integrar datos en tiempo real o casi real procedentes de varios orígenes para operaciones adicionales en los datos. Como los datos se actualizan en tiempo real, suele preferirse para realizar actividades rutinarias como almacenar los registros de empleados o agregar datos de varios sitios para la elaboración de informes en tiempo real.

Sugerencia

Un almacenamiento de datos es útil cuando el objetivo es reducir el estrés en los sistemas de producción y para reorganizar, indexar o filtrar varios orígenes de datos en una sola área de almacenamiento. Para lograr este objetivo, la organización debe pensar y diseñar de forma deliberada cómo organizar y estructurar sus datos. Un almacén de datos no es un vertedero sin estructura para tablas de varios orígenes.

Diseño de una solución de almacenamiento de datos

Las soluciones de almacenamiento de datos se pueden clasificar por sus construcciones relacionales técnicas y por las metodologías que se usan para definirlas. Para diseñar los almacenamientos de datos, se usan dos enfoques de arquitectura típicos:

Diseño de arquitectura de abajo a arriba, de Ralph Kimball

El diseño de arquitectura de abajo a arriba se basa en data marts conectados. Para empezar a crear el almacenamiento de datos, se generan los data marts individuales para áreas temáticas departamentales. Después, se conectan los data marts a través de un bus de almacenamiento de datos con las dimensiones adecuadas. Los bloques de creación básicos de este enfoque dependen del modelo de esquema de estrella que proporciona las funcionalidades de cubo OLAP multidimensional para el análisis de datos dentro de una base de datos relacional y SQL.

La ventaja de este enfoque es que se puede empezar a pequeña escala. Se crea gradualmente el almacenamiento de datos más grande a través de inversiones relativamente más reducidas en un período de tiempo. Esta opción proporciona una ruta de acceso más rápida a la rentabilidad de la inversión (ROI) de la solución.

Diseño de arquitectura de arriba a abajo, de Bill Inmon

El enfoque de arquitectura de arriba a abajo consiste en crear uno único almacenamiento normalizado integrado. En un almacenamiento normalizado, las estructuras relacionales internas siguen las reglas de normalización. Este estilo de arquitectura es compatible con la integridad transitoria, ya que los datos proceden directamente de los sistemas OLTP de origen.

Este enfoque puede proporcionar datos más coherentes y fiables, pero requiere rigor en el diseño, el desarrollo y las pruebas. Este enfoque también requiere inversiones financieras considerables al principio, y la rentabilidad de la inversión no empieza hasta que todo el almacenamiento de datos es completamente funcional.

Importante

Una creencia común es que las arquitecturas de abajo a arriba y de arriba a abajo son incompatibles. Pero los principios descritos por Kimball e Inmon se pueden usar de forma conjunta según sea necesario para proporcionar una mejor solución.