Compartilhar via


ClusteringCatalog.CrossValidate Método

Definição

Execute a validação cruzada em numberOfFolds dobras de data, ajustando estimatore respeitando samplingKeyColumnName se fornecido. Em seguida, avalie cada subexame e labelColumnName retorne métricas.

public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))

Parâmetros

data
IDataView

Os dados em que executar a validação cruzada.

estimator
IEstimator<ITransformer>

O estimador a ser ajustado.

numberOfFolds
Int32

Número de dobras de validação cruzada.

labelColumnName
String

Coluna de rótulo opcional para avaliação (tarefas de clustering nem sempre podem ter um rótulo).

featuresColumnName
String

Coluna de recursos opcionais para avaliação (necessária para calcular a métrica Dbi)

samplingKeyColumnName
String

Nome de uma coluna a ser usada para agrupar linhas. Se dois exemplos compartilharem o mesmo valor do samplingKeyColumnName, eles têm a garantia de aparecer no mesmo subconjunto (treinar ou testar). Isso pode ser usado para garantir que nenhum vazamento de rótulo do trem para o conjunto de testes. Se null nenhum agrupamento de linhas for executado.

seed
Nullable<Int32>

Semente para o gerador de número aleatório usado para selecionar linhas para dobras de validação cruzada.

Retornos

Aplica-se a