Referencia del componente y algoritmo para el diseñador de Azure Machine Learning
Este contenido de referencia proporciona el contexto técnico de cada uno de los algoritmos y componentes de aprendizaje automático disponibles en el diseñador de Azure Machine Learning.
Cada componente representa un conjunto de código que puede ejecutarse de forma independiente y realizar una tarea de aprendizaje automático, dadas las entradas necesarias. Un componente puede contener un algoritmo en particular o realizar una tarea que sea importante para el aprendizaje automático, como el reemplazo de un valor que falta o análisis estadísticos.
Para obtener ayuda con la elección de algoritmos, consulte
Sugerencia
En cualquier canalización del diseñador, puede obtener información sobre un componente específico. Seleccione el vínculo Más información en la tarjeta de componentes al mantener el puntero sobre el componente en la lista de componentes o en el panel derecho del componente.
Componentes de preparación de datos
| Funcionalidad | Descripción | component |
|---|---|---|
| Entrada y salida de datos | Mueva los datos de los orígenes en la nube a la canalización. Escriba los resultados o los datos intermedios en Azure Storage, SQL Database o Hive, mientras ejecuta una canalización, o use el almacenamiento en la nube para intercambiar datos entre canalizaciones. | Introducción manual de datos Export Data Import Data |
| Transformación de datos | Operaciones con los datos que son exclusivas del aprendizaje automático, como la normalización o discretización de datos, la reducción de la dimensionalidad y la conversión de datos entre barios formatos de archivo. | Adición de columnas Adición de filas Aplicación de operación matemática Aplicación de transformaciones de SQL Clean Missing Data (limpiar datos faltantes) Recorte de valores Conversión a CSV Conversión en conjunto de datos Convertir en valores de indicador Edición de metadatos Agrupación de datos en intervalos Combinación de datos Normalize Data (normalizar datos) Partición y ejemplo Supresión de filas duplicadas SMOTE Selección de transformación de columnas Seleccionar columnas de conjunto de datos División de datos |
| Selección de características | Seleccione un subconjunto de características pertinentes y útiles para la creación de un modelo analítico. | Selección de características basada en filtros Importancia de la característica de permutación |
| Funciones estadísticas | Proporcionar una amplia variedad de métodos estadísticos relacionados con la ciencia de datos. | Resumen de datos |
Algoritmos de aprendizaje automático
| Funcionalidad | Descripción | component |
|---|---|---|
| Regresión | Prediga un valor. | Boosted Decision Tree Regression (Regresión del árbol de decisión ampliado) Regresión de bosque de decisión Regresión rápida de bosque por cuantiles Regresión lineal Regresión de red neuronal Regresión de Poisson |
| Agrupación en clústeres | Agrupe datos. | Agrupación en clústeres K-Means |
| clasificación | Prediga una clase. Elija en algoritmos binarios (dos clases) o multiclase. | Árbol de decisión ampliado multiclase Bosque de decisión multiclase Regresión logística multiclase Red neuronal multiclase One vs. All Multiclass (Multiclase uno frente a todos) Uno contra One Multiclass Perceptrón promedio de dos clases Two-Class Boosted Decision Tree (Árbol de decisión promovido por dos clases) Bosque de decisión de dos clases Regresión logística de dos clases Red neuronal de dos clases Two Class Support Vector Machine (Máquina de vectores compatible con dos clases) |
Componentes para compilar y evaluar modelos
| Funcionalidad | Descripción | component |
|---|---|---|
| Entrenamiento del modelo | Ejecute datos a través del algoritmo. | Entrenamiento del modelo de agrupación en clústeres Train Model (entrenar modelo) Entrenamiento del modelo de PyTorch Tune Model Hyperparameters (Optimizar hiperparámetros del modelo) |
| Evaluación y puntuación del modelo | Mida la precisión del modelo entrenado. | Aplicación de la transformación Assign Data to Clusters (asignar datos a los clústeres) Cross Validate Model (Modelo de validación cruzada) Evaluación de módulo Puntuación del modelo de imagen Score Model (puntuar modelo) |
| Lenguaje Python | Escriba código e insértelo en un componente para integrar Python con la canalización. | Creación de modelo Python Ejecución de script de Python |
| Lenguaje R | Escriba código e insértelo en un componente para integrar R con la canalización. | Ejecución script de R |
| Text Analytics | Proporcione herramientas de cálculo especializadas para trabajar con texto estructurado y no estructurado. | Conversión de palabra en vector Extracción de características de n-gramas a partir de texto Hash de características Preprocesamiento de texto Asignación de Dirichlet latente Puntuación del modelo de Vowpal Wabbit Entrenamiento del modelo de Vowpal Wabbit |
| Computer Vision | Componentes relacionados con el preprocesamiento de datos de imagen y el reconocimiento de imágenes. | Aplicación de transformación de imagen Conversión al directorio de imagen Transformación de imagen init División de directorio de imagen DenseNet ResNet |
| Recomendación | Compile modelos de recomendación. | Evaluate Recommender (Evaluar recomendador) Score SVD Recommender (Puntuar recomendador de SVD) Puntuación del recomendador ancho y profundo Train SVD Recommender (Entrenar recomendador de SVD) Entrenamiento del recomendador ancho y profundo |
| Detección de anomalías | Compile modelos de detección de anomalías. | Detección de anomalías basada en PCA Train Anomaly Detection Model (entrenar un modelo de detección de anomalías) |
Servicio web
Obtenga información sobre los componentes del servicio web que son necesarios para la inferencia en tiempo real en el diseñador de Azure Machine Learning.
Mensajes de error
Conozca los mensajes de error y códigos de excepción que pueden surgir al usar los componentes del diseñador de Azure Machine Learning.