Share via


CycleCloud, versión 7.9.0

Esta versión agrega IBM Spectrum LSF como un tipo de clúster. Esta versión también agregó una serie de características que mejoraron los informes de errores, la autoadministrabilidad y facilitan la compilación y depuración de aplicaciones MPI.

Nuevas características:

  • La presentación del nodo ahora incluye información detallada sobre los problemas de preparación y configuración.
  • El resumen del clúster muestra ahora los problemas detectados durante la preparación y configuración del nodo.
  • Se pueden agregar nuevos nodos a un grupo de selección de ubicación desde la interfaz web
  • Los nodos ahora tienen una característica "Keep-Alive" para evitar que se terminen accidentalmente.
  • Ahora se admiten discos de sistema operativo efímeros para máquinas virtuales y conjuntos de escalado
  • Los propietarios de clústeres con una clave SSH en su perfil ahora pueden conectarse como usuario cyclecloud
  • CycleCloud ahora incluye IBM Spectrum LSF como un tipo de clúster
  • Las subredes, las redes virtuales y las máquinas virtuales ahora se muestran en la página Cuentas
  • La información sobre la compatibilidad con Infiniband se incluye en la interfaz de usuario y la API REST.
  • Ahora, el grupo de selección de ubicación de un nodo se muestra de forma más destacada en la interfaz de usuario.
  • CycleCloud ahora muestra problemas con los nodos que se conectan de nuevo a CycleCloud al iniciarse
  • Los nodos pueden obtener su nombre y identificador de nodo desde el jetpack comando.
  • La versión de Jetpack ahora se puede determinar en la máquina virtual mediante la API de Python.
  • Los nodos deben finalizarse antes de que se puedan quitar de un clúster
  • La autenticación de Active Directory ahora admite inicios de sesión "user@domain.com"

Problemas resueltos:

  • Comandos de servidor como cycle_server start/stop imprimiría un seguimiento de pila en algunas versiones de Ubuntu
  • Los tipos de máquina "promo" de Hv1 ahora usan la misma imagen de HPC CentOS que los tipos de máquina Hv1.
  • El atributo Nodearray CoreCount es ahora el factor de escalado automático.
  • A veces, los cambios en la casilla de máquina virtual de prioridad baja no se pudieron guardar en la interfaz de usuario.
  • Los nodos de MPI con direcciones IP públicas podrían provocar errores de "Los atributos del conjunto de escalado no coinciden"
  • Las claves SSH que contenían nuevas líneas provocarían errores de inicio de sesión
  • Los errores de contraseña de Azure no válidos ya no se notifican de forma críptica como "No se puede descodificar ningún objeto JSON".
  • Algunas suscripciones que no admiten la consulta de información de precios ya no provocan errores.
  • La solicitud de un nuevo certificado de Let's Encrypt produciría un error debido a un protocolo en desuso
  • Agregar y, a continuación, quitar inmediatamente un nodo de un clúster provocaría un error.
  • En ocasiones, los nodos principales de PBS tenían errores transitorios de instalación de software
  • Hubo una condición de carrera entre la administración de usuarios y el inicio del programador
  • En algunos casos, los usuarios administrados de un nodo no se configurarían antes de que el nodo empezara a ejecutar trabajos.
  • Jetpack converge cron usó un redireccionamiento de salida incorrecto
  • Los nodos arrancados sin Jetpack instalado provocaron una NullPointerException
  • El cyclecloud initialize comando no funcionaba con el puerto HTTP en sitios con HTTPS.
  • El cuadro de diálogo "nuevo clúster" incluía un botón Siguiente incluso sin una página siguiente.
  • GridEngine genera ocasionalmente errores generados relacionados con el intento de cambiar el tamaño de scaleSets eliminados anteriormente.
  • Los nodos que se vuelven a crear la imagen inicial no se pudieron finalizar hasta que se complete el proceso de nueva imagen inicial
  • Los nodos de ejecución que terminaban podrían permanecer después de eliminar la máquina virtual.
  • La terminación de nodos en un grupo de selección de ubicación se quitaría antes de que la máquina virtual finalizara la eliminación.
  • Forzar el restablecimiento de contraseña no funcionaba correctamente
  • Los nodos se anularon la selección después de realizar una acción en ellos
  • Se quitó la actualización forzada de glib2 en apoyo de ganglia
  • Los identificadores de nodo se regeneraron si se volvió a importar un clúster
  • El cyclecloud connect comando produjo un error al usar un bastión SSH sin una clave privada.
  • Los hipervínculos de Azure Portal a las máquinas virtuales del conjunto de escalado se han roto
  • No se pudieron eliminar las máquinas virtuales si se iniciaron con discos de datos
  • La eliminación de un elemento cluster-init agregado anteriormente a través de la interfaz de usuario no funcionaba correctamente.
  • Si se agregan nodos a un conjunto de escalado después de un error, el nodo con errores aparecerá correctamente en la interfaz de usuario.
  • El jetpack shutdown comando no admitía la desasignación.
  • HB60rs_v2 las máquinas virtuales no se filtraron correctamente como un tipo de máquina virtual "HPC".
  • Ahora no se permite agregar o quitar nodos de ejecución de Slurm manualmente, ya que no podrían ejecutar trabajos
  • Los nodos "Desactivados" se contaron incorrectamente con respecto a la cuota disponible
  • Errores outOfCapacity de región durante la orquestación de nodos a veces dieron lugar a nodos que mostraban una LISTA de MachineTypes y bloqueaba el escalado automático.
  • Nodos de almacenamiento beeGFS eliminados al finalizar
  • El cyclecloud connect comando imprimió una advertencia sobre la modificación de known_hosts cuando no modificó este archivo
  • Los usuarios de un nodo no se pudieron administrar después de reiniciar ese nodo
  • Se ha corregido el bloqueo de "nivel de pila demasiado profundo (SystemStackError)" en CentOS 6.
  • El tamaño del montón predeterminado para el servidor web CycleCloud ahora es de 4 GB.
  • Se han actualizado las dependencias para solucionar los siguientes problemas de CVE: 2012-0881, 2014-0107, 2014-0114, 2015-7501, 2016-3092, 2017-15708, 2018-14720, 2018-16492, 2019-10744, 2019-10746, 2019-14379

En desuso:

  • Se ha quitado el tipo de clúster basado en Gluster.