Modificación de parámetros de tabla de recuento

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Modifica los parámetros usados para crear características a partir de recuentos.

Categoría: Learning con recuentos

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo Modificar parámetros de tabla de recuento en Machine Learning Studio (clásico) para cambiar la forma en que se generan las características a partir de una tabla de recuento.

En general, para crear características basadas en recuento, se usa la transformación Recuento de compilaciones para procesar un conjunto de datos y crear una tabla de recuento, y a partir de esa tabla de recuento se genera un nuevo conjunto de características.

Sin embargo, si ya ha creado una tabla de recuento, puede usar el módulo Modificar parámetros de tabla de recuento para editar la definición de cómo se procesan los datos de recuento. Esto le permite crear un conjunto diferente de estadísticas basadas en recuento basadas en los datos existentes, sin tener que volver a analizar el conjunto de datos.

Cómo configurar Modificar parámetros de recuento

  1. Busque la transformación que desea modificar, en el grupo Transformaciones , y agrégréla al experimento.

    Debe haber ejecutado previamente un experimento que creó una transformación de recuento.

    • Para modificar una transformación guardada: busque la transformación en el grupo Transformaciones y agrégréla al experimento.

    • Para modificar una transformación de recuento creada dentro del mismo experimento: si la transformación no se ha guardado, pero está disponible como salida en el experimento actual (por ejemplo, compruebe la salida del módulo Build Counting Transform), puede usarla directamente conectando los módulos.

  2. Agregue el módulo Modificar parámetros de tabla de recuento y conecte la transformación como entrada.

  3. En el panel Propiedades del módulo Modify Count Table Parameters (Modificar parámetros de tabla de recuento), escriba un valor para usarlo como umbral de bin deGarbage.

    Este valor especifica el número mínimo de repeticiones que se deben encontrar para cada valor de característica, para que se utilicen recuentos. Si la frecuencia del valor es menor que el umbral del cubo de elementos no utilizados, el par valor-etiqueta no se cuenta como un elemento discreto; en su lugar, todos los elementos con recuentos inferiores al valor de umbral se colocan en un único "cubo de elementos no utilizados".

    Si usa un conjunto de datos pequeño y está contando y entrenando con los mismos datos, un buen valor inicial es 1.

  4. En Ejemplos pseudo adicionales anteriores, escriba un número que indique el número de pseudo ejemplos adicionales que se incluirán. No es necesario proporcionar estos ejemplos; los pseudo ejemplos se generan en función de la distribución anterior.

  5. En Escala de ruido laplaciano, escriba un valor de punto flotante positivo que represente la escala usada para introducir el ruido muestreado de una distribución laplaciana. Cuando se establece un valor de escala, se incorpora algún nivel aceptable de ruido al modelo, por lo que es menos probable que el modelo se vean afectados por valores no vistos en los datos.

  6. En Incluir características de salida, elija el método que se usará al crear características basadas en recuento para su inclusión en la transformación.

    • CountsOnly: cree características mediante recuentos.

    • LogOddsOnly: cree características con el registro de la proporción de probabilidades.

    • BothCountsAndLogOdds: cree características con recuentos y probabilidades de registro.

  7. Seleccione la opción Omitir columna atrás si desea IsBackOff invalidar la marca en la salida al crear características. Al seleccionar esta opción, se crean características basadas en recuento incluso si la columna no tiene valores de recuento significativos.

  8. Ejecute el experimento. A continuación, puede guardar la salida de Modificar parámetros de tabla de recuento como una nueva transformación, si lo desea.

Ejemplos

Para obtener ejemplos de cómo este módulo, vea el Azure AI Gallery:

  • Learning con recuentos: clasificación binaria: muestra cómo usar el aprendizaje con módulos de recuentos para generar características a partir de columnas de valores categóricos para un modelo de clasificación binaria.

  • Learning con recuentos: clasificación multiclase con datos de taxis de Nueva York: muestra cómo usar el aprendizaje con módulos de recuentos para realizar la clasificación multiclase en el conjunto de datos de taxis de Nueva York disponible públicamente. El ejemplo usa un aprendiz de regresión logística multiclase para modelar este problema.

  • Learning con recuentos: clasificación binaria con datos de taxis de Nueva York: muestra cómo usar el aprendizaje con módulos de recuentos para realizar la clasificación binaria en el conjunto de datos de taxis de Nueva York disponible públicamente. El ejemplo usa un aprendiz de regresión logística de dos clases para modelar este problema.

Notas técnicas

Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.

Es estadísticamente seguro contar y entrenar en el mismo conjunto de datos si establece el parámetro de escala de ruido laplaciano.

Entradas esperadas

Nombre Tipo Descripción
Transformación de recuento Interfaz ITransform Transformación de recuento que se aplicará

Parámetros del módulo

Nombre Tipo Intervalo Opcional Valor predeterminado Descripción
Umbral de papelera Float >=0,0f Obligatorio 10.0f Umbral bajo el que se caracterizará un valor de columna en el cubo de elementos no utilizados
Pseudoejemplos anteriores adicionales Float >=0,0f Obligatorio 42.0f Los pseudo ejemplos adicionales que se muestran a continuación de las distribuciones anteriores que se incluirán
Escala de ruido laplaciano Float >=0,0f Obligatorio 0,0f Escala de la distribución laplaciana de la que se muestrea el ruido
Inclusión de características de salida OutputFeatureType Obligatorio BothCountsAndLogOdds Características que se pueden generar
Omitir columna de interrupción Boolean Obligatorio false Si se debe omitir la columna IsBackOff en la salida

Salidas

Nombre Tipo Descripción
Transformación modificada Interfaz ITransform Transformación modificada

Excepciones

Excepción Descripción
Error 0003 Se produce una excepción si una o varias de las entradas son NULL o están vacías.
Error 0086 Se produce una excepción cuando una transformación de recuento no es válida.

Para obtener una lista de errores específicos de los módulos de Studio (clásico), consulte Machine Learning códigos de error.

Para obtener una lista de excepciones de API, consulte Machine Learning códigos de error de la API REST.

Consulte también

Aprendizaje con recuentos