Reiniciar paquetes de usando puntos de comprobación

Se aplica a:SQL Server SSIS Integration Runtime en Azure Data Factory

Integration Services puede reiniciar los paquetes con errores desde el punto del error, en lugar de volver a ejecutar todo el paquete. Si se configura un paquete para que utilice puntos de comprobación, la información relacionada con la ejecución del paquete se escribirá en un archivo de punto de comprobación. Cuando se vuelve a ejecutar el paquete con error, se utiliza el archivo de punto de comprobación para reiniciar el paquete desde el punto del error. Si el paquete se ejecuta correctamente, el archivo de punto de comprobación se elimina y se vuelve a crear la siguiente vez que se ejecuta el paquete.

El uso de puntos de comprobación en un paquete puede proporcionar las siguientes ventajas.

  • Evita que se repita la descarga y la carga de archivos grandes. Por ejemplo, un paquete que descarga varios archivos grandes mediante una tarea de FTP para cada descarga, se puede reiniciar cuando la descarga de un solo archivo genera un error y, a continuación, descargar únicamente ese archivo.

  • Evita repetir la carga de grandes cantidades de datos. Por ejemplo, un paquete que realiza inserciones masivas en tablas de dimensiones de un almacenamiento de datos, utilizando una tarea Inserción masiva para cada dimensión, se puede reiniciar si la inserción genera un error para una tabla de dimensión y, en ese caso, solo se volverá a cargar esa dimensión.

  • Evita repetir la agregación de valores. Por ejemplo, un paquete que calcula muchos agregados, como promedios y sumas, utilizando una tarea Flujo de datos para realizar cada agregación, se puede reiniciar cuando el cálculo de una agregación genera un error, y solo se vuelve a calcular esa agregación.

Si un paquete está configurado para utilizar puntos de comprobación, Integration Services captura el punto de reinicio del archivo de punto de comprobación. El tipo de contenedor que genera el error y la implementación de características como las transacciones afectan al punto de reinicio que se registra en el archivo de punto de comprobación. Los valores actuales de variables se capturan también en el archivo de punto de comprobación. Sin embargo, los valores de variables que tienen el tipo de datos Object no se guardan en los archivos de punto de comprobación.

Definir puntos de reinicio

El contenedor host de la tarea, que encapsula una sola tarea, es la unidad atómica de trabajo más pequeña que se puede reiniciar. El contenedor de bucles Foreach y un contenedor de transacción también se tratan como unidades atómicas de trabajo.

Si se detiene un paquete mientras se está ejecutando un contenedor de transacción, la transacción finaliza y se revierte todo el trabajo realizado por el contenedor. Cuando se reinicia el paquete, se vuelve a ejecutar el contenedor que generó el error. La finalización de los contenedores secundarios del contenedor de transacción no se registra en el archivo de punto de comprobación. Por lo tanto, cuando se reinicia el paquete, se vuelve a ejecutar el contenedor de transacción con todos sus contenedores secundarios.

Nota:

Utilizar puntos de comprobación y transacciones en el mismo paquete podría producir resultados inesperados. Por ejemplo, cuando un paquete genera un error y se reinicia desde un punto de comprobación, podría repetir una transacción que ya se ha confirmado correctamente.

Los datos de punto de comprobación no se guardan para los contenedores de bucles For y Foreach. Cuando se reinicia un paquete, se vuelven a ejecutar el contenedor de bucles For y Foreach y sus contenedores secundarios. Si un contenedor secundario en el bucle se ejecuta correctamente, no se graba en el archivo de punto de comprobación sino que se vuelve a ejecutar. Para obtener más información y solucionar este problema, vea Los puntos de comprobación de SSIS no se respetan para los elementos de contenedor de bucles For y Foreach.

Si se reinicia el paquete, las configuraciones de paquetes no se vuelven a cargar sino que se utiliza la información de configuración escrita en el archivo de punto de comprobación. Esto asegura que, el paquete utilice las mismas configuraciones cuando se vuelva a ejecutar que cuando sufrió el error.

Un paquete solamente se puede reiniciar en el nivel de flujo de control. No puede reiniciar un paquete a mitad de un flujo de datos. Para evitar volver a ejecutar el flujo de datos entero, el paquete podría estar diseñado para incluir varios flujos de datos, cada uno utilizando una tarea Flujo de datos diferente. Esta manera que se puede reiniciar el paquete, volviendo a ejecutar solo una tarea Flujo de datos.

Configurar un paquete para que se reinicie

El archivo de punto de comprobación incluye los resultados de ejecución de todos los contenedores completados, los valores actuales de las variables del sistema y las definidas por el usuario, y la información de configuración de paquetes. El archivo también incluye el identificador único del paquete. Para reiniciar correctamente un paquete, el identificador del paquete en el archivo de punto de comprobación y el paquete deben coincidir; de lo contrario, no se podrá reiniciar. Esto evita que un paquete utilice un archivo de punto de comprobación escrito por una versión distinta del paquete. Si el paquete se ejecuta correctamente, el archivo de punto de comprobación se elimina después de reiniciar el paquete.

En la tabla siguiente se muestran las propiedades del paquete establecidas para implementar puntos de comprobación.

Propiedad Descripción
CheckpointFileName Especifica el nombre del archivo de punto de comprobación.
CheckpointUsage Especifica si se utilizarán puntos de comprobación.
SaveCheckpoints Indica si el paquete guarda puntos de comprobación. Esta propiedad debe estar establecida en True para poder reiniciar un paquete desde el punto del error.

Además, debe establecer la propiedad FailPackageOnFailure en True para todos los contenedores del paquete que quiera identificar como puntos de reinicio.

Puede usar la propiedad ForceExecutionResult para probar el uso de los puntos de comprobación de un paquete. Si establece ForceExecutionResult de una tarea o un contenedor en Error, puede simular un error en tiempo real. Al volver a ejecutar el paquete, se volverá a ejecutar la tarea que generó el error y los contenedores.

Usar puntos de comprobación

La propiedad CheckpointUsage se puede establecer en los siguientes valores:

Value Descripción
Nunca Especifica que no se utilizará el archivo de punto de comprobación y que el paquete se ejecutará desde el inicio del flujo de trabajo del paquete.
Siempre Especifica que el archivo de punto de comprobación se utilizará siempre y que el paquete se reinicia desde el punto del error de ejecución anterior. Si no se encuentra el archivo de punto de comprobación, el paquete generará un error.
IfExists Especifica que se utilizará el archivo de punto de comprobación, si existe. Si existe un archivo de punto de comprobación, el paquete se reiniciará desde el punto del error de ejecución anterior; de lo contrario, se ejecutará desde el inicio del flujo de trabajo del paquete.

Nota:

La opción /CheckPointing on de dtexec equivale a establecer en True el valor de la propiedad SaveCheckpointsdel paquete y el de la propiedad CheckpointUsage en Always. Para obtener más información, consulte utilidad dtexec.

Proteger archivos de puntos de comprobación

El nivel de protección de paquetes no incluye la protección de archivos de puntos de comprobación; estos archivos se deben proteger por separado. Solo puede almacenar datos de puntos de comprobación en el sistema de archivos y debe utilizar una lista de control de acceso (ACL) al sistema operativo para proteger la ubicación o carpeta en la que ha almacenado el archivo. Es importante proteger los archivos de puntos de comprobación, dado que contienen información sobre el estado del paquete, incluidos los valores actuales de las variables. Por ejemplo, una variable puede contener un conjunto de registros con varias filas de datos privados, tales como números de teléfono. Para más información, vea Acceso a los archivos usados por los paquetes.

Configurar puntos de comprobación para reiniciar un paquete con error

Los paquetes de Integration Services se configuran para que se reinicien desde un punto de error, en lugar de volver a ejecutar todo el paquete, estableciendo las propiedades que afectan a los puntos de comprobación.

Para configurar un paquete de modo que se reinicie

  1. En SQL Server Data Tools (SSDT), abra el proyecto de Integration Services que contiene el paquete que desea configurar.

  2. En el Explorador de soluciones, haga doble clic en el paquete para abrirlo.

  3. Haga clic en la pestaña Flujo de control .

  4. Haga clic con el botón derecho en cualquier parte del fondo de la superficie de diseño de flujo de control y haga clic en Propiedades.

  5. Establezca la propiedad SaveCheckpoints en True.

  6. Escriba el nombre del archivo de punto de comprobación en la propiedad CheckpointFileName.

  7. Establezca la propiedad CheckpointUsage en uno de estos dos valores:

    • Seleccione Always para reiniciar siempre el paquete desde el punto de comprobación.

      Importante

      Si el archivo de punto de comprobación no está disponible se produce un error.

    • Seleccione IfExists para reiniciar el paquete solo si está disponible el archivo de punto de comprobación.

  8. Configure las tareas y contenedores desde los cuales puede reiniciarse el paquete.

    • Haga clic con el botón derecho en una tarea o contenedor y haga clic en Propiedades.

    • Establezca la propiedad FailPackageOnFailure en True para cada tarea y contenedor seleccionados.

Recursos externos