Share via


Uso de procesos

En este artículo se explica cómo conectarse al proceso en el área de trabajo de Azure Databricks. Necesita acceso al proceso para ejecutar cargas de trabajo de ingeniería de datos, ciencia de datos y análisis de datos.

¿Quién puede acceder o crear procesos?

La capacidad de crear procesos o acceder a ellos depende de los derechos de los usuarios.

  • Si el área de trabajo está habilitada para el proceso sin servidor para cuadernos (versión preliminar pública), todos los usuarios del área de trabajo tienen acceso al recurso de proceso sin servidor para ejecutar cargas de trabajo interactivas en cuadernos y flujos de trabajo.

  • Los administradores del área de trabajo pueden crear cualquier tipo de proceso. También heredan el permiso CAN MANAGE en todos los procesos creados en su área de trabajo.

  • Aquellos usuarios que no sean administradores con el derecho Creación de clústeres sin restricciones tienen acceso a todas las opciones de configuración al crear procesos. Podrán acceder a los procesos a los que se les concedan permisos y podrán crear cualquier tipo de proceso. Para obtener información sobre las opciones de configuración disponibles, consulte Referencia de configuración de procesos. Los administradores del área de trabajo pueden asignar este derecho a cualquier usuario, grupo o entidad de servicio. Vea Administración de derechos.

  • Aquellos usuarios que no sean administradores sin el derecho Creación de clústeres sin restricciones solo podrán acceder a aquellos procesos a los que se les concedan permisos o a los que creen mediante directivas a las que se les asignen permisos.

Uso del proceso sin servidor (versión preliminar pública)

Importante

Esta característica está en versión preliminar pública.

Si el área de trabajo se ha habilitado para la versión preliminar pública de proceso sin servidor, tendrá acceso automáticamente al recurso de proceso sin servidor en cualquiera de los cuadernos disponibles. El proceso sin servidor le proporciona acceso a petición para un proceso escalable en cuadernos, lo que le permite escribir y ejecutar inmediatamente el código de Python o SQL.

Para asociar al proceso sin servidor, haga clic en el menú desplegable Conectar del cuaderno y seleccione Sin servidor. En los cuadernos nuevos, el proceso adjunto se asigna automáticamente de forma predeterminada a sin servidor tras la ejecución del código si no se ha seleccionado ningún otro recurso.

Para obtener más información sobre la habilitación, vea Habilitación de la versión preliminar pública de proceso sin servidor.

Uso de procesos configurados por otros usuarios

Si no tuviera permisos de creación de clústeres sin restricciones, solo tendrá acceso a las directivas de proceso y a los procesos concedidos por los administradores del área de trabajo. Los usuarios pueden tener cualquiera de estos permisos en un proceso:

  • CAN ATTACH TO: Permite adjuntar el cuaderno para calcular y ver las métricas de proceso y la interfaz de usuario de Spark.
  • CAN RESTART: Permite iniciar, reiniciar y finalizar el proceso. También incluye los permisos CAN ATTACH TO.
  • CAN MANAGE: Permite editar los detalles de proceso, los permisos y el tamaño. También incluye los permisos CAN ATTACH TO y CAN RESTART.
  • NO PERMISSIONS: No hay permisos en el proceso.

Si tiene permisos para asociar a un proceso, selecciónelo en el menú desplegable Conectar en un cuaderno abierto o en el menú desplegable Proceso al crear un nuevo trabajo. Para obtener más información sobre los permisos de proceso, vea Permisos de proceso.

Creación de nuevos procesos mediante directivas

Si tuviera permisos para una directiva de proceso, podrá crear su propio proceso. Las directivas tienen opciones de configuración mínimas y están diseñadas para ser recursos eficaces con la configuración predeterminada. Si quisiera editar cualquier configuración, obtendrá información sobre cada configuración en la referencia de opciones de configuración.

  1. Haga clic en Nuevo>Clúster en la barra lateral del área de trabajo.
  2. Seleccione una directiva del menú desplegable Directiva.
  3. (Opcional) actualice el nombre del proceso.
  4. (Opcional) configure cualquier opción disponible.
  5. Haga clic en Crear proceso.

Ya tiene un recurso de proceso que podrá usar para ejecutar las cargas de trabajo.

Directivas

Los administradores del área de trabajo pueden crear y administrar las directivas de proceso en el área de trabajo. Si no tuviera acceso a una directiva que le permita crear el proceso que necesite, póngase en contacto con el administrador del área de trabajo. Para obtener más información sobre directivas, consulte Creación y administración de directivas de proceso.

Es posible que el área de trabajo tenga directivas personalizadas o use las directivas predeterminadas de Azure Databricks. Las directivas predeterminadas incluyen:

  • Proceso personal: permite a los usuarios crear fácilmente recursos de proceso de nodo único asignado individualmente con opciones de configuración mínimas.
  • Proceso compartido: permite a los usuarios crear recursos multinodo de mayor tamaño destinados a ser compartidos por varios usuarios.
  • Proceso de usuarios avanzados: permite a los usuarios crear recursos de varios nodos más grandes. La directiva está pensada para cargas de trabajo de usuario único que requieren más recursos de proceso que personal compute permite.
  • Proceso de trabajos: permite a los usuarios crear procesos predeterminados de uso general para trabajos.

De forma predeterminada, todos los usuarios tienen acceso a la directiva de proceso personal. Si no viera la directiva de proceso personal, la organización la habrá quitado del área de trabajo.

Creación de procesos sin restricciones

Si se trata de un administrador del área de trabajo o un usuario con el derecho Creación de clústeres sin restricciones, podrá crear procesos con la directiva Sin restricciones. Esto le proporcionará acceso a todas las configuraciones de procesos de la interfaz de usuario Nuevo proceso. Para obtener una referencia de todas las opciones disponibles, consulte Referencia de configuración de procesos.