Glosario de aprendizaje automáticoMachine learning glossary

La lista siguiente es una compilación de los términos importantes sobre aprendizaje automático que resultan de utilidad al crear los modelos personalizados.The following list is a compilation of important machine learning terms that are useful as you build your custom models.

ExactitudAccuracy

En clasificación, la exactitud es el número de elementos correctamente clasificados dividido entre el número total de elementos en el conjunto de pruebas.In classification, accuracy is the number of correctly classified items divided by the total number of items in the test set. Va desde 0 (el menos preciso) a 1 (el más preciso).Ranges from 0 (least accurate) to 1 (most accurate). La exactitud es una de las métricas de evaluación del rendimiento de su modelo.Accuracy is one of evaluation metrics of the performance of your model. Trátela junto con el valor de precisión, el de recuperación y la puntuación F.Consider it in conjunction with precision, recall, and F-score.

API de ML.NET relacionada: BinaryClassificationMetrics.Accuracy.Related ML.NET API: BinaryClassificationMetrics.Accuracy.

Área bajo la curva (AUC)Area under the curve (AUC)

En clasificación binaria, una métrica de evaluación que es el valor del área bajo la curva que traza la tasa de verdaderos positivos (en el eje y) en relación con la tasa de falsos positivos (en el eje x).In binary classification, an evaluation metric that is the value of the area under the curve that plots the true positives rate (on the y-axis) against the false positives rate (on the x-axis). Va de 0,5 (el peor) a 1 (el mejor).Ranges from 0.5 (worst) to 1 (best). También conocida como el área bajo la curva ROC; es decir, la curva característica operativa del receptor.Also known as the area under the ROC curve, i.e., receiver operating characteristic curve. Para obtener más información, consulte el artículo de Wikipedia Curva ROC.For more information, see the Receiver operating characteristic article on Wikipedia.

API de ML.NET relacionada:BinaryClassificationMetrics.Auc.Related ML.NET API: BinaryClassificationMetrics.Auc.

Clasificación binariaBinary classification

Un caso de clasificación donde la etiqueta es solo una de dos clases.A classification case where the label is only one out of two classes. Para obtener más información, vea la sección Clasificación binaria del tema Tareas de aprendizaje automático.For more information, see the Binary classification section of the Machine learning tasks topic.

ClasificaciónClassification

Cuando los datos se usan para predecir una categoría, la tarea de aprendizaje automático supervisado se llama clasificación.When the data is used to predict a category, supervised machine learning task is called classification. La clasificación binaria hace referencia a la predicción de únicamente dos categorías (por ejemplo, clasificar una imagen como la foto de un "gato" o un "perro").Binary classification refers to predicting only two categories (for example, classifying an image as a picture of either a 'cat' or a 'dog'). La clasificación multiclase hace referencia a la predicción de varias categorías (por ejemplo, clasificar una imagen como la foto de una raza específica de perro).Multiclass classification refers to predicting multiple categories (for example, when classifying an image as a picture of a specific breed of dog).

Coeficiente de determinaciónCoefficient of determination

En regresión, una métrica de evaluación que indica en qué grado los datos se ajustan a un modelo.In regression, an evaluation metric that indicates how well data fits a model. Va de 0 a 1.Ranges from 0 to 1. Un valor de 0 significa que los datos son aleatorios o no pueden ajustarse al modelo.A value of 0 means that the data is random or otherwise cannot be fit to the model. Un valor de 1 significa que el modelo coincide exactamente con los datos.A value of 1 means that the model exactly matches the data. Esto se conoce a menudo como r2, R2, o r cuadrado.This is often referred to as r2, R2, or r-squared.

API de ML.NET relacionada: RegressionMetrics.RSquared.Related ML.NET API: RegressionMetrics.RSquared.

CaracterísticaFeature

Una propiedad medible del fenómeno que se mide, generalmente un valor numérico (doble).A measurable property of the phenomenon being measured, typically a numeric (double) value. Las características múltiples se conocen como vector de características y generalmente se almacenan como double[].Multiple features are referred to as a Feature vector and typically stored as double[]. Las características definen los elementos importantes del fenómeno que se mide.Features define the important characteristics of the phenomenon being measured. Para obtener más información, vea el artículo Feature (Característica) en Wikipedia.For more information, see the Feature article on Wikipedia.

Ingeniería de característicasFeature engineering

La ingeniería de características es el proceso que implica la definición de un conjunto de características y el desarrollo de software que produce vectores de características a partir de los datos de fenómenos disponibles, es decir, la extracción de características.Feature engineering is the process that involves defining a set of features and developing software that produces feature vectors from available phenomenon data, i.e., feature extraction. Para obtener más información, vea el artículo Feature engineering (Ingeniería de características) en Wikipedia.For more information, see the Feature engineering article on Wikipedia.

Puntuación FF-score

En clasificación, una métrica de evaluación que equilibra precisión y recuperación.In classification, an evaluation metric that balances precision and recall.

API de ML.NET relacionada: BinaryClassificationMetrics.F1Score.Related ML.NET API: BinaryClassificationMetrics.F1Score.

HiperparámetroHyperparameter

Un parámetro de un algoritmo de aprendizaje automático.A parameter of a machine learning algorithm. Algunos ejemplos son el número de árboles para aprender en un bosque de decisión o el tamaño de paso en un algoritmo de gradiente descendente.Examples include the number of trees to learn in a decision forest or the step size in a gradient descent algorithm. Los valores de los hiperparámetros se establecen antes de entrenar el modelo y rigen el proceso de búsqueda de los parámetros de la función de predicción; por ejemplo, los puntos de comparación en un árbol de decisión o las ponderaciones en un modelo de regresión lineal.Values of Hyperparameters are set before training the model and govern the process of finding the parameters of the prediction function, for example, the comparison points in a decision tree or the weights in a linear regression model. Para obtener más información, vea el artículo Hyperparameter (Hiperparámetro) en Wikipedia.For more information, see the Hyperparameter article on Wikipedia.

EtiquetaLabel

El elemento que se va a predecir con el modelo de aprendizaje automático.The element to be predicted with the machine learning model. Por ejemplo, una raza de perro o el precio futuro de unas acciones.For example, the breed of dog or a future stock price.

Pérdida de registroLog loss

En clasificación, una métrica de evaluación que caracteriza la precisión de un clasificador.In classification, an evaluation metric that characterizes the accuracy of a classifier. Cuanto menor sea la pérdida de registro, más preciso será un clasificador.The smaller log loss is, the more accurate a classifier is.

API de ML.NET relacionada: BinaryClassificationMetrics.LogLoss.Related ML.NET API: BinaryClassificationMetrics.LogLoss.

Error de media absolutoMean absolute error (MAE)

En regresión, una métrica de evaluación que es el promedio de todos los errores del modelo, donde el error del modelo es la distancia entre el valor de la etiqueta predicho y el valor de la etiqueta correcto.In regression, an evaluation metric that is the average of all the model errors, where model error is the distance between the predicted label value and the correct label value.

API de ML.NET relacionada: RegressionMetrics.L1.Related ML.NET API: RegressionMetrics.L1.

ModeloModel

Tradicionalmente, los parámetros de la función de predicción.Traditionally, the parameters for the prediction function. Por ejemplo, las ponderaciones en un modelo de regresión lineal o los puntos de división en un árbol de decisión.For example, the weights in a linear regression model or the split points in a decision tree. En ML.NET, un modelo contiene toda la información necesaria para predecir la etiqueta de un objeto de dominio (por ejemplo, imagen o texto).In ML.NET, a model contains all the information necessary to predict the label of a domain object (for example, image or text). Esto significa que los modelos de ML.NET incluyen los pasos de caracterización necesarios, así como los parámetros para la función de predicción.This means that ML.NET models include the featurization steps necessary as well as the parameters for the prediction function.

Clasificación multiclaseMulticlass classification

Un caso de clasificación donde la etiqueta es una de tres o más clases.A classification case where the label is one out of three or more classes. Para obtener más información, vea la sección Clasificación multiclase del tema Tareas de aprendizaje automático.For more information, see the Multiclass classification section of the Machine learning tasks topic.

N-gramaN-gram

Un esquema de extracción de características para datos de texto: cualquier secuencia de N palabras se convierte en un valor de característica.A feature extraction scheme for text data: any sequence of N words turns into a feature value.

Vector de características numéricoNumerical feature vector

Un vector de características que se compone únicamente de valores numéricos.A feature vector consisting only of numerical values. Esto es similar a double[].This is similar to double[].

CanalizaciónPipeline

Todas las operaciones necesarias para ajustar un modelo a un conjunto de datos.All of the operations needed to fit a model to a data set. Una canalización consta de pasos de importación, transformación, caracterización y aprendizaje de datos.A pipeline consists of data import, transformation, featurization, and learning steps. Una vez que una canalización está entrenada, se convierte en un modelo.Once a pipeline is trained, it turns into a model.

PrecisiónPrecision

En clasificación, la precisión de una clase es el número de elementos con una predicción correcta en cuando a pertenencia a esa clase dividido entre el número total de elementos cuya predicción señalaba la pertenencia a esa clase.In classification, the precision for a class is the number of items correctly predicted as belonging to that class divided by the total number of items predicted as belonging to the class.

API de ML.NET relacionada:BinaryClassificationMetrics.NegativePrecision, BinaryClassificationMetrics.PositivePrecision.Related ML.NET API: BinaryClassificationMetrics.NegativePrecision, BinaryClassificationMetrics.PositivePrecision.

RecuperaciónRecall

En clasificación, la recuperación de una clase es el número de elementos con una predicción correcta en cuando a pertenencia a esa clase dividido entre el número total de elementos que efectivamente pertenecen a la clase.In classification, the recall for a class is the number of items correctly predicted as belonging to that class divided by the total number of items that actually belong to the class.

API de ML.NET relacionada:BinaryClassificationMetrics.NegativeRecall, BinaryClassificationMetrics.PositiveRecall.Related ML.NET API: BinaryClassificationMetrics.NegativeRecall, BinaryClassificationMetrics.PositiveRecall.

RegresiónRegression

Una tarea de aprendizaje automático supervisada donde el resultado es un valor real, por ejemplo, doble.A supervised machine learning task where the output is a real value, for example, double. Por ejemplo, la predicción de los precios de las acciones.Examples include predicting stock prices. Para obtener más información, vea la sección Regresión del tema Tareas de aprendizaje automático.For more information, see the Regression section of the Machine learning tasks topic.

Error absoluto relativoRelative absolute error

En regresión, una métrica de evaluación que es la suma de todos los errores absolutos dividida entre la suma de las distancias entre los valores de etiqueta correctos y el promedio de todos los valores de etiqueta correctos.In regression, an evaluation metric that is the sum of all absolute errors divided by the sum of distances between correct label values and the average of all correct label values.

Error cuadrático relativoRelative squared error

En regresión, una métrica de evaluación que es la suma de todos los errores absolutos cuadráticos dividida entre la suma de las distancias cuadráticas existente entre los valores de etiqueta correctos y el promedio de todos los valores de etiqueta correctos.In regression, an evaluation metric that is the sum of all squared absolute errors divided by the sum of squared distances between correct label values and the average of all correct label values.

Raíz cuadrada del error cuadrático medioRoot of mean squared error (RMSE)

En regresión, una métrica de evaluación que es la raíz cuadrada del promedio de los cuadrados de los errores.In regression, an evaluation metric that is the square root of the average of the squares of the errors.

API de ML.NET relacionada: RegressionMetrics.Rms.Related ML.NET API: RegressionMetrics.Rms.

Aprendizaje automático supervisadoSupervised machine learning

Una subclase de aprendizaje automático en la que un modelo deseado predice la etiqueta de datos aún no vistos.A subclass of machine learning in which a desired model predicts the label for yet-unseen data. Algunos ejemplos son la clasificación, la regresión y la predicción estructurada.Examples include classification, regression, and structured prediction. Para obtener más información, vea el artículo Aprendizaje supervisado en Wikipedia.For more information, see the Supervised learning article on Wikipedia.

AprendizajeTraining

El proceso de identificación de un modelo para un conjunto de datos de entrenamiento determinado.The process of identifying a model for a given training data set. Para un modelo lineal, esto significa buscar las ponderaciones.For a linear model, this means finding the weights. Para un árbol, implica la identificación de los puntos de división.For a tree, it involves the identifying the split points.

TransformaciónTransform

Un componente de canalización que transforma los datos.A pipeline component that transforms data. Por ejemplo, de texto a vector de números.For example, from text to vector of numbers.

Aprendizaje automático no supervisadoUnsupervised machine learning

Una subclase de aprendizaje automático en la que un modelo deseado encuentra una estructura oculta (o latente) en los datos.A subclass of machine learning in which a desired model finds hidden (or latent) structure in data. Algunos ejemplos son la agrupación en clústeres, el modelado de temas y la reducción de la dimensionalidad.Examples include clustering, topic modeling, and dimensionality reduction. Para obtener más información, vea el artículo Aprendizaje no supervisado en Wikipedia.For more information, see the Unsupervised learning article on Wikipedia.