Exportar a una tabla de Azure

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

En este artículo se describe cómo usar la opción Exportar a Azure en el módulo Exportar datos de Machine Learning Studio (clásico).

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Esta opción es útil cuando desea exportar los resultados o los datos intermedios de un experimento de aprendizaje automático a una tabla de Azure. Azure Table service es un servicio de administración de datos de Azure que puede almacenar grandes cantidades de datos estructurados y no relacionales. Se trata de un almacén de datos NoSQL que acepta llamadas autenticadas desde dentro y fuera de Azure.

Exportación de datos a una tabla de Azure

  1. Agregue el módulo Exportar datos al experimento. Puede encontrar este módulo en la categoría Entrada y salida de datos en Studio (clásico).

  2. Conectar al módulo que genera los datos que desea exportar a Azure Table Storage.

  3. Especifique si desea exportar datos a un recurso compartido público o a una cuenta de almacenamiento privada que requiera credenciales de inicio de sesión estableciendo la opción Tipo de autenticación .

    • Público (DIRECCIÓN URL de SAS): elija esta opción si la cuenta admite el acceso a través de la dirección URL de SAS. En el campo Table SAS URI (URI de SAS de tabla), escriba o pegue el URI completo que define la cuenta y el blob público.

      La dirección URL de SAS es una dirección URL de acceso con límite de tiempo que puede generar mediante una utilidad de almacenamiento de Azure. En una página accesible a través de la dirección URL de SAS, los datos solo se pueden almacenar con estos formatos: CSV, TSV y ARFF.

    • Cuenta: elija esta opción si los datos están en una cuenta privada. También debe proporcionar credenciales, incluidos el nombre de cuenta y la clave.

  4. Si desea exportar los datos a almacenamiento privado protegido, proporcione las credenciales necesarias para acceder a la cuenta:

    • Nombre de la cuenta de tabla: escriba o pegue el nombre de la cuenta que contiene el blob al que desea acceder. Por ejemplo, si la dirección URL completa de la cuenta de almacenamiento es https://myshared.table.core.windows.net, escribiría myshared.

    • Clave de cuenta de tabla: pegue la clave de acceso asociada a la cuenta de almacenamiento.

    • Nombre de tabla: escriba el nombre de la tabla específica que desea leer.

  5. Especifique las columnas que se guardarán en el almacén de tablas y las columnas que se usarán para definir el esquema de tabla mediante las propiedades de columna.

    • Clave de partición: elija la columna que se debe usar para crear particiones del conjunto de datos guardado para la tabla en Azure Storage. Las tablas de Azure tienen particiones para admitir el equilibrio de carga en los nodos de almacenamiento. Todas las entidades de tabla se organizan por partición; por lo tanto, la propiedad PartitionKey es necesaria para todas las operaciones de tabla.

    • Clave de fila de tabla de Azure: elija la columna que se debe usar para la propiedad RowKey . La propiedad RowKey es una propiedad del sistema necesaria para cada entidad de una tabla. Junto con la propiedad PartitionKey , forma un índice único para cada fila de la tabla.

    Nota:

    Debe usar columnas diferentes para RowKey y PartitionKey. Asegúrese de que cualquier columna que seleccione para RowKey o PartitionKey también esté incluida en la lista de columnas de destino o que se produce un error.

    • Columnas de origen de tabla de Azure: seleccione las columnas adicionales del conjunto de datos que quiera guardar en la tabla de Azure. También debe incluir las columnas seleccionadas para PartitionKey y RowKey.

    Para obtener más información sobre las tablas de Azure Storage, vea Descripción del modelo de datos de Table Service.

  6. Especifique los nombres de las columnas que se escribirán en la tabla.

    Importante

    Debe proporcionar un nombre de columna para cada columna que se genera en la tabla, incluidas las columnas RowKey, PartitionKey y todas las columnas de origen.

    Si el número de nombres de columna que proporcione no coincide con el número de columnas de salida, se producirá un error.

    Si escribe nuevos nombres de columna, deben proporcionarse en el orden de los índices de columna de las columnas de origen.

  7. Modo de escritura de tabla de Azure: indique cómo desea que Export Data se comporte cuando los datos ya existen en la tabla de Azure.

    • Insertar: la Insert Entity operación inserta una nueva entidad con una clave principal única, que se forma a partir de una combinación de las propiedades PartitionKey y RowKey .

    • Combinación: la Merge Entity operación actualiza una entidad existente actualizando las propiedades de la entidad. Esta operación no reemplaza la entidad existente.

    • Replace: la Update Entity operación reemplaza el contenido de la entidad determinada en una tabla.

    • InsertOrReplace: la InsertOrReplace Entity operación inserta la entidad si la entidad no existe. Si la entidad existe, reemplaza al existente.

    • InsertOrMerge: la InsertOrMerge Entity operación inserta la entidad si la entidad no existe. Si la entidad existe, combina las propiedades de la entidad proporcionada con las ya existentes.

  8. Usar resultados almacenados en caché: indique si desea que los datos se actualicen cada vez que se ejecute el experimento.

    Si selecciona esta opción, el módulo Exportar datos guarda los datos en la tabla especificada la primera vez que se ejecuta el experimento y, después, no realiza escrituras, a menos que haya cambios ascendentes.

    Si anula la selección de esta opción, los datos se escriben en el destino cada vez que se ejecuta el experimento, independientemente de si los datos son iguales o no.

  9. Ejecute el experimento.

Notas técnicas

Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.

Preguntas frecuentes

¿Por qué se ha producido un error al escribir en una tabla existente?

Compruebe el esquema de la tabla para asegurarse de que los nombres de las columnas y los tipos de datos son los mismos. Por ejemplo, en Azure Table Storage, se espera que la columna ID sea una cadena.

Si recibe el error Error 0027: El tamaño de los objetos pasados es incoherente, compruebe que la tabla existe en el contenedor especificado. Actualmente, Azure ML solo puede escribir en tablas existentes.

¿Por qué aparece el error de que no se encuentra una columna existente?

Si no ha ejecutado el experimento, a veces la exportación de datos no detecta las columnas ascendentes. Si realiza cambios ascendentes en el experimento, es posible que tenga que quitar el módulo Exportar datos y, a continuación, agregarlo y volver a configurarlo.

¿Cómo puedo evitar volver a escribir los mismos datos innecesariamente?

Si los datos del experimento cambian por cualquier motivo, el módulo Exportar datos siempre escribirá los nuevos datos.

Sin embargo, si está ejecutando el experimento con otro cambio que no afecta a los resultados, establezca la opción Usar resultados almacenados en caché en TRUE. El módulo comprobará si el experimento se ha ejecutado anteriormente con las mismas opciones y, si se encuentra un resultado anterior, los datos no se escribirán en la tabla de Azure.

¿Puedo exportar datos a otra región geográfica?

Sí. Sin embargo, si la cuenta de almacenamiento se encuentra en una región diferente del nodo de proceso usado para el experimento de aprendizaje automático, el acceso a los datos podría ser más lento. Además, se le cobrará por la entrada y salida de datos en la suscripción.

Ejemplos

Para obtener ejemplos de cómo usar estos módulos de aprendizaje automático, consulte el Azure AI Gallery.

Parámetros del módulo

Pública o SAS: opciones públicas

Nombre Intervalo Tipo Valor predeterminado Descripción
URI de tabla SAS cualquiera String

Cuenta: opciones de cuenta privada

Nombre Intervalo Tipo Valor predeterminado Descripción
Nombre de cuenta de tabla
Clave de cuenta de tabla cualquiera SecureString

Opciones de almacenamiento

Nombre Intervalo Tipo Valor predeterminado Descripción
Nombre de la tabla String ninguno
Clave de partición cualquiera SecureString ninguno Elija la columna que se usará como clave al crear particiones en la tabla. Si no se selecciona ninguna columna, el nombre de columna como clave de partición para todas las entradas
Clave de fila de tabla de Azure cualquiera ColumnPicker ninguno Elija la columna que contiene el identificador único para las filas de tabla. El valor predeterminado es una clave de fila basada en GUID
Columnas de origen de tabla de Azure cualquiera ColumnPicker ninguno Especifique las columnas que se incluirán en la tabla, ya sea por nombre o por índice de columna.
Columnas de destino de tabla de Azure cualquiera String ninguno Escriba los nombres de las columnas que se usarán en la tabla de destino.
Modo de escritura de tabla de Azure Lista: Insert, Merge, Replace, InsertOrReplace, InsertOrMerge Enumeración ninguno
Uso de resultados almacenados en caché TRUE/FALSE Boolean FALSE El módulo solo se ejecuta si no existe una caché válida; de lo contrario, use los datos almacenados en caché de la ejecución anterior.

Excepciones

Excepción Descripción
Error 0027 Se produce una excepción cuando dos objetos tienen que ser del mismo tamaño pero no lo son.
Error 0003 Se produce una excepción si una o varias de las entradas son nulas o están vacías.
Error 0029 Se produce una excepción cuando se pasa un URI no válido.
Error 0030 Se produce una excepción cuando no es posible descargar un archivo.
Error 0002 Se produce una excepción si uno o más parámetros no se pudieron analizar o convertir del tipo especificado al tipo requerido por el método de destino.
Error 0009 Se produce una excepción si se especifica incorrectamente el nombre de la cuenta de almacenamiento de Azure o el nombre del contenedor.
Error 0048 Se produce una excepción cuando no es posible abrir un archivo.
Error 0046 Se produce una excepción si no es posible crear el directorio en la ruta de acceso especificada.
Error 0049 Se produce una excepción cuando no es posible analizar un archivo.

Para obtener una lista de errores específicos de los módulos de Studio (clásico), consulte Machine Learning códigos de error.

Para obtener una lista de excepciones de API, consulte Machine Learning códigos de error de la API REST.

Consulte también

Import Data
Export Data
Exportar a Azure SQL Database
Exportación a Azure Blob Storage
Exportar a una consulta de Hive