Recuperación de un dispositivo GPU de Azure Stack Edge Pro con errores
SE APLICA A:
Azure Stack Edge Pro: GPU
Azure Stack Edge Pro R
En este artículo se describe cómo recuperarse de un error no tolerable en su dispositivo GPU de Azure Stack Edge Pro. Un error no tolerable en un dispositivo GPU de Azure Stack Edge Pro requiere la sustitución del dispositivo.
Antes de empezar
Asegúrese de que tiene:
- Se ha puesto en contacto Soporte técnico de Microsoft con respecto al error del dispositivo y le han recomendado la sustitución del dispositivo.
- Ha hecho una copia de seguridad de la configuración del dispositivo como se describe en Preparación para un error del dispositivo.
Configuración del dispositivo de sustitución
Cuando el dispositivo detecta un error no tolerable, debe solicitar un dispositivo de sustitución. Los pasos de configuración para el dispositivo de sustitución siguen siendo los mismos.
Recupere la información de configuración del dispositivo de la que se realizó una copia de seguridad del dispositivo en el que se produjo el error. Usará esta información para configurar el dispositivo de sustitución.
Siga estos pasos para configurar el dispositivo de sustitución:
- Recopile la información necesaria que se indica en Lista de comprobación para implementación. Puede usar la información que guardó de la configuración del dispositivo anterior.
- Solicite un nuevo dispositivo de la misma configuración que la del equipo en el que se produjo el error. Para realizar la solicitud, cree un nuevo recurso de Azure Stack Edge en Azure Portal.
- Desempaquete el dispositivo, móntelo en un bastidor y cabléelo.
- Conéctese a la interfaz de usuario local del dispositivo.
- Configure la red con las mismas direcciones IP que usó para el dispositivo antiguo. Usar las mismas direcciones IP minimiza el impacto en cualquier máquina cliente que se use en el entorno. Consulte cómo definir la configuración de red.
- Asigne el mismo nombre de dispositivo y dominio DNS que el dispositivo antiguo. Esto garantiza que los clientes pueden usar el mismo nombre de dispositivo para comunicarse con el nuevo dispositivo. Consulte cómo configurar el dispositivo.
- Configure los certificados sobre en el nuevo dispositivo de la misma manera que lo hizo para el dispositivo antiguo. Tenga en cuenta que el nuevo dispositivo tiene un nuevo número de serie de nodo. Si ha usado sus propios certificados en el dispositivo antiguo, tendrá que obtener un nuevo certificado de nodo. Consulte cómo configurar certificados.
- Obtenga la clave de activación desde Azure Portal y active el nuevo dispositivo. Consulte cómo activar el dispositivo.
Ahora está preparado para implementar las cargas de trabajo que se estaban ejecutando en el dispositivo antiguo.
Restauración de recursos compartidos en la nube de Edge
Siga estos pasos para restaurar los datos en los recursos compartidos en la nube de Edge en el dispositivo:
- Agregue recursos compartidos con los mismos nombres de recurso compartido creados anteriormente en el dispositivo con errores. Asegúrese de que, al crear recursos compartidos, la opción Seleccionar el contenedor de blobs está establecida en Utilizar existente y luego seleccione el contenedor que se usó con el dispositivo anterior.
- Agregue usuarios que tenían acceso al dispositivo anterior.
- Agregue cuentas de almacenamiento asociadas con los recursos compartidos anteriormente en el dispositivo. Al crear cuentas de almacenamiento de Edge, seleccione de un contenedor existente y apunte al contenedor que se asignó a la cuenta de Azure Storage asignada en el dispositivo anterior. Los datos del dispositivo que estaban escritos en la cuenta de almacenamiento de Edge en el dispositivo anterior se cargaron en el contenedor de almacenamiento seleccionado en la cuenta de Azure Storage asignada.
- Actualice los datos del recurso compartido desde Azure. Esto despliega todos los datos en la nube desde el contenedor existente hasta los recursos compartidos.
Restauración de recursos compartidos locales de Edge
Para prepararse para un posible error de dispositivo, es posible que haya implementado una de las siguientes soluciones de copia de seguridad para proteger los datos de recursos compartidos locales de sus cargas de trabajo de Kubernetes o IoT:
| Software de terceros | Referencia a la solución |
|---|---|
| Cohesity | https://www.cohesity.com/solution/cloud/azure/ Para obtener más información, póngase en contacto con Cohesity. |
| Commvault | https://www.commvault.com/azure Para obtener más información, póngase en contacto con Commvault. |
| Veritas | http://veritas.com/azure Para obtener más información, póngase en contacto con Veritas. |
| Veeam | https://www.veeam.com/kb4041 Para más información, póngase en contacto con Veeam. |
Una vez configurado completamente el dispositivo de sustitución, habilítelo para el almacenamiento local.
Siga estos pasos para recuperar los datos de recursos compartidos locales:
- Configure el proceso en el dispositivo.
- Vuelva a agregar un recurso compartido local.
- Ejecute el procedimiento de recuperación que proporciona la solución de protección de datos que prefiera. Consulte las referencias de la tabla anterior.
Restauración de archivos y carpetas de VM
Para prepararse para un posible error de dispositivo, es posible que haya implementado una de las siguientes soluciones de copia de seguridad para proteger los datos de las máquinas virtuales:
| Soluciones de copia de seguridad | SO admitido | Referencia |
|---|---|---|
| Agente de Microsoft Azure Recovery Services (MARS) para Azure Backup | Windows | Acerca del agente de MARS |
| Cohesity | Windows, Linux | Breve descripción de la solución de integración, copia de seguridad y recuperación de Microsoft Azure Para obtener más información, póngase en contacto con Cohesity. |
| Commvault | Windows, Linux | https://www.commvault.com/azure Para obtener más información, póngase en contacto con Commvault. |
| Veritas | Windows, Linux | https://vox.veritas.com/t5/Protection/Protecting-Azure-Stack-edge-with-NetBackup/ba-p/883370 Para obtener más información, póngase en contacto con Veritas. |
| Veeam | Windows, Linux | https://www.veeam.com/kb4041 Para más información, póngase en contacto con Veeam. |
Una vez configurado completamente el dispositivo de sustitución, puede volver a implementar las máquinas virtuales con la imagen de VM usada anteriormente.
Siga estos pasos para recuperar los datos en las máquinas virtuales:
- Implemente una VM desde una imagen de VM en el dispositivo.
- Instale la solución de protección de datos elegida en la VM.
- Ejecute el procedimiento de recuperación que proporciona la solución de protección de datos que prefiera. Consulte las referencias de la tabla anterior.
Restauración de una implementación de Kubernetes
Si realizó la implementación de Kubernetes a través de Azure Arc, puede restaurar la implementación después de un error de dispositivo no tolerable. Deberá volver a implementar los contenedores o la aplicación del cliente desde el repositorio git en el que se almacena la definición de la aplicación. Información sobre la implementación de Kubernetes con Azure Arc
Pasos siguientes
- Aprenda a devolver un dispositivo Azure Stack Edge Pro.