Exportar a una tabla de Azure

En este artículo se describe cómo usar la opción exportar a Azure en el módulo exportar datos en Azure machine learning Studio (clásico).

Nota

Se aplica a: machine learning Studio (clásico)

Este contenido solo pertenece a Studio (clásico). Se han agregado módulos similares de arrastrar y colocar al diseñador de Azure Machine Learning. Obtenga más información en este artículo comparativa de las dos versiones.

Esta opción es útil si desea exportar los resultados o los datos intermedios de un experimento de aprendizaje automático a una tabla de Azure. El servicio tabla de Azure es un servicio de administración de datos de Azure que puede almacenar grandes cantidades de datos estructurados y no relacionales. Es un almacén de datos NoSQL que acepta llamadas autenticadas desde dentro y fuera de Azure.

Exportación de datos a una tabla de Azure

  1. Agregue el módulo exportar datos al experimento. Puede encontrar este módulo en la categoría entrada y salida de datos en Studio (clásico).

  2. Conéctelo al módulo que genera los datos que desea exportar a Azure Table Storage.

  3. Especifique si desea exportar datos a un recurso compartido público o a una cuenta de almacenamiento privada que requiera credenciales de inicio de sesión; para ello, establezca la opción tipo de autenticación .

    • Público (dirección URL de SAS): elija esta opción si la cuenta admite el acceso a través de la dirección URL de SAS. En el campo URI de SAS de tabla , escriba o pegue el URI completo que define la cuenta y el BLOB público.

      La dirección URL de SAS es una dirección URL de acceso de enlace de tiempo que se puede generar mediante una utilidad de almacenamiento de Azure. En una página accesible a través de la dirección URL de SAS, los datos se pueden almacenar usando solo estos formatos: CSV, TSV y ARFF.

    • Cuenta: elija esta opción si los datos están en una cuenta privada . También debe proporcionar credenciales, incluido el nombre de cuenta y la clave.

  4. Si desea exportar los datos al almacenamiento seguro y privado, proporcione las credenciales necesarias para obtener acceso a la cuenta:

    • Nombre de la cuenta de tabla: escriba o pegue el nombre de la cuenta que contiene el BLOB al que desea obtener acceso. Por ejemplo, si la dirección URL completa de la cuenta de almacenamiento es https://myshared.table.core.windows.net, escribiría myshared.

    • Clave de cuenta de tabla: pegue la clave de acceso que está asociada a la cuenta de almacenamiento.

    • Nombre de tabla: escriba el nombre de la tabla específica que desea leer.

  5. Especifique las columnas que se van a guardar en el almacén de tabla y las columnas que se van a usar para definir el esquema de tabla mediante las propiedades de columna.

    • Clave de partición: elija la columna que debe usarse para crear particiones del conjunto de los conjuntos de los guardados de la tabla en Azure Storage. Las tablas de Azure tienen particiones para admitir el equilibrio de carga en los nodos de almacenamiento. Todas las entidades de tabla se organizan por partición; por lo tanto, la propiedad PartitionKey es necesaria para todas las operaciones de tabla.

    • Clave de fila de tabla de Azure: elija la columna que se debe usar para la propiedad RowKey . La propiedad RowKey es una propiedad del sistema que es necesaria para cada entidad de una tabla. Junto con la propiedad PartitionKey , crea un índice único para cada fila de la tabla.

    Nota

    Debe usar columnas diferentes para RowKey y PartitionKey. Asegúrese de que las columnas que seleccione para RowKey o PartitionKey también se incluyan en la lista de columnas de destino o se produzca un error.

    • Columnas de origen de tabla de Azure: seleccione las columnas adicionales del conjunto de cambios que desea guardar en la tabla de Azure. También debe incluir las columnas seleccionadas para PartitionKey y RowKey.

    Para obtener más información acerca de las tablas de Azure Storage, consulte Descripción del modelo de datos de Table Service.

  6. Especifique los nombres de las columnas que se van a escribir en la tabla.

    Importante

    Debe proporcionar un nombre de columna para cada columna que genere en la tabla, incluidas las columnas RowKey, PartitionKey y todas las columnas de origen.

    Si el número de nombres de columna que proporciona no coincide con el número de columnas de salida, se produce un error.

    Si escribe nuevos nombres de columna, se deben proporcionar en el orden de los índices de columna de las columnas de origen.

  7. Modo de escritura de tabla de Azure: indica cómo desea que se comporten los datos de exportación cuando ya existen datos en la tabla de Azure.

    • Insert: la Insert Entity operación inserta una nueva entidad con una clave principal única, formada a partir de una combinación de las propiedades PartitionKey y RowKey .

    • Merge: la Merge Entity operación actualiza una entidad existente mediante la actualización de las propiedades de la entidad. Esta operación no reemplaza la entidad existente.

    • Reemplazar: la Update Entity operación reemplaza el contenido de la entidad especificada en una tabla.

    • InsertOrReplace: la InsertOrReplace Entity operación inserta la entidad si la entidad no existe. Si la entidad existe, reemplaza al existente.

    • InsertOrMerge: la InsertOrMerge Entity operación inserta la entidad si la entidad no existe. Si la entidad existe, combina las propiedades de la entidad proporcionada con las ya existentes.

  8. Usar resultados almacenados en caché: indique si desea que los datos se actualicen cada vez que se ejecute el experimento.

    Si selecciona esta opción, el módulo exportar datos guarda los datos en la tabla especificada la primera vez que se ejecuta el experimento y, a partir de ese momento, no realiza escrituras, a menos que haya cambios ascendentes.

    Si anula la selección de esta opción, los datos se escriben en el destino cada vez que se ejecuta el experimento, independientemente de si los datos son iguales o no.

  9. Ejecute el experimento.

Notas técnicas

Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.

Preguntas frecuentes

¿Por qué obtengo un error al escribir en una tabla existente?

Compruebe el esquema de la tabla para asegurarse de que los nombres de las columnas y los tipos de datos son los mismos. Por ejemplo, en Azure Table Storage, se espera que la columna ID sea una cadena.

Si obtiene el error 0027: el tamaño de los objetos que se han pasado es incoherente, compruebe que la tabla existe en el contenedor especificado. Actualmente, Azure ML solo puede escribir en tablas existentes.

¿Por qué obtengo el error que no se puede encontrar una columna existente?

Si no ha ejecutado el experimento, los datos de exportacióna veces no detectan las columnas de nivel superior. Si realiza cambios ascendentes en el experimento, es posible que tenga que quitar el módulo exportar datos y, a continuación, agregarlo y volver a configurarlo.

¿Cómo puedo evitar volver a escribir los mismos datos innecesariamente?

Si los datos del experimento cambian por cualquier motivo, el módulo exportar datos siempre escribirá los nuevos datos.

Sin embargo, si está ejecutando el experimento con otro cambio que no afecte a los resultados, establezca la opción usar resultados almacenados en caché en true. El módulo comprobará si el experimento se ejecutó anteriormente con las mismas opciones y, si se encuentra un resultado anterior, los datos no se escribirán en la tabla de Azure.

¿Puedo exportar datos a una región geográfica diferente?

Sí. Sin embargo, si la cuenta de almacenamiento está en una región diferente del nodo de proceso que se usa para el experimento de machine learning, el acceso a los datos puede ser más lento. Además, se le cobrará por la entrada y salida de datos en la suscripción.

Ejemplos

Para obtener ejemplos de cómo usar estos módulos de aprendizaje automático, vea el Azure AI Gallery.

Parámetros del módulo

Opciones públicas o SAS-Public

Nombre Intervalo Tipo Valor predeterminado Descripción
URI de tabla SAS cualquiera String

Cuenta: opciones de cuenta privada

Nombre Intervalo Tipo Valor predeterminado Descripción
Nombre de cuenta de tabla
Clave de cuenta de tabla cualquiera SecureString

Opciones de almacenamiento

Nombre Intervalo Tipo Valor predeterminado Descripción
Nombre de la tabla String ninguno
Clave de partición cualquiera SecureString ninguno Elija la columna que se usará como clave al crear particiones en la tabla. Si no hay ninguna columna seleccionada, el nombre de la columna es la clave de partición para todas las entradas.
Clave de fila de tabla de Azure cualquiera ColumnPicker ninguno Elija la columna que contiene el identificador único para las filas de la tabla. Tiene como valor predeterminado una clave de fila basada en GUID
Columnas de origen de tabla de Azure cualquiera ColumnPicker ninguno Especificar las columnas que se van a incluir en la tabla, ya sea por nombre o por índice de columna
Columnas de destino de tabla de Azure cualquiera String ninguno Escriba los nombres de las columnas que se van a usar en la tabla de destino
Modo de escritura de tabla de Azure List: INSERT, Merge, Replace, InsertOrReplace, InsertOrMerge Enumeración ninguno
Usar resultados almacenados en caché TRUE/FALSE Boolean false El módulo solo se ejecuta si no existe una caché válida; de lo contrario, use los datos en caché de la ejecución anterior.

Excepciones

Excepción Descripción
Error 0027 Se produce una excepción cuando dos objetos tienen que ser del mismo tamaño pero no lo son.
Error 0003 Se produce una excepción si una o varias de las entradas son nulas o están vacías.
Error 0029 Se produce una excepción cuando se pasa un URI no válido.
Error 0030 Se produce una excepción cuando no es posible descargar un archivo.
Error 0002 Se produce una excepción si uno o más parámetros no se pudieron analizar o convertir del tipo especificado al tipo requerido por el método de destino.
Error 0009 Se produce una excepción si se especifica incorrectamente el nombre de la cuenta de almacenamiento de Azure o el nombre del contenedor.
Error 0048 Se produce una excepción cuando no es posible abrir un archivo.
Error 0046 Se produce una excepción si no es posible crear el directorio en la ruta de acceso especificada.
Error 0049 Se produce una excepción cuando no es posible analizar un archivo.

Para obtener una lista de los errores específicos de los módulos de Studio (clásico), consulte Machine Learning de los códigos de error.

Para obtener una lista de excepciones de API, consulte códigos de error de la API de REST de machine learning.

Vea también

Importar datos
Exportar datos
Exportar a Azure SQL Database
Exportar a Azure Blob Storage
Exportar a una consulta de Hive