Introducción

Completado

En este módulo se habla de dos sistemas de archivos distribuidos: el sistema de archivos distribuido Hadoop (HDFS) y Ceph FS. Tanto HDFS como Ceph FS están diseñados como sistemas de archivos de macrodatos, aunque con sutiles diferencias. HDFS está diseñado para archivos de gran tamaño con semántica de una sola escritura y varias lecturas. Por otra parte, Ceph FS está orientado a ser un sistema de archivos distribuido de uso general que se pueda usar para una serie de aplicaciones implementadas en un clúster virtualizado. Ceph FS es un sistema de archivos superpuesto sobre un almacén de objetos distribuido. En este módulo se profundiza en algunas de las opciones de diseño elegidas por los desarrolladores de estos sistemas de archivos para sus aplicaciones de destino.

Objetivos de aprendizaje

Objetivos de este módulo:

  • Revisar los objetivos de diseño y las características de arquitectura del sistema de archivos distribuido Hadoop (HDFS).
  • Revisar los objetivos de diseño y las características de arquitectura del sistema de archivos Ceph (Ceph FS).
  • Comparar y contrastar HDFS y el sistema de archivos Ceph.

Requisitos previos

  • Entender en qué consiste la informática en la nube, incluidos los modelos de servicio en la nube y los proveedores de nube comunes.
  • Conocer las tecnologías que habilitan la informática en la nube.
  • Comprender cómo los proveedores de servicios en la nube pagan la nube y facturan por ella.
  • Saber qué son los centros de datos y por qué existen.
  • Saber cómo se configuran, alimentan y aprovisionan los centros de datos.
  • Comprender cómo se aprovisionan y miden los recursos en la nube.
  • Familiarizarse con el concepto de virtualización.
  • Saber cuáles son los distintos tipos de virtualización.
  • Entender la virtualización de CPU.
  • Entender la virtualización de memoria.
  • Entender la virtualización de E/S.
  • Conocer los diferentes tipos de datos y cómo se almacenan.