Modificar parâmetros de tabela de contagem

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Modifica os parâmetros utilizados para criar funcionalidades a partir de contagens

Categoria: Aprendizagem com Condes

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Visão geral do módulo

Este artigo descreve como usar o módulo de parâmetros de tabela de contagem de modificação no Machine Learning Studio (clássico), para alterar a forma como as funcionalidades são geradas a partir de uma tabela de contagem.

Em geral, para criar funcionalidades baseadas na contagem, utiliza-se a Build Counting Transform para processar um conjunto de dados e criar uma tabela de contagem, e a partir dessa tabela de contagem gera um novo conjunto de funcionalidades.

No entanto, se já criou uma tabela de contagem, pode utilizar o módulo Descostódicos de Tabela De Modificação para editar a definição de como os dados da contagem são tratados. Isto permite-lhe criar um conjunto diferente de estatísticas baseadas na contagem com base nos dados existentes, sem ter que analisar o conjunto de dados.

Como configurar modificar parâmetros de contagem

  1. Localize a transformação que pretende modificar, no grupo Transforms , e adicione-a à sua experiência.

    Devias ter feito uma experiência que criou uma transformação de contagem.

    • Para modificar uma transformação salva: Localize a transformação, no grupo Transforms , e adicione-a à sua experiência.

    • Para modificar uma transformação de contagem criada dentro da mesma experiência: Se a transformação não tiver sido salva, mas estiver disponível como saída na experiência atual (por exemplo, verificar a saída do módulo Build Counting Transform ), pode utilizá-la diretamente ligando os módulos.

  2. Adicione o módulo de parâmetros de tabela de contagem de modificação e conecte a transformação como uma entrada.

  3. No painel de propriedades do módulo de parâmetros de tabela de modificação, digite um valor a utilizar como limiar do caixote do lixo.

    Este valor especifica o número mínimo de ocorrências que devem ser encontradas para cada valor de recurso, para que as contagens sejam utilizadas. Se a frequência do valor for inferior ao limiar do caixote do lixo, o par de etiquetas de valor não é contabilizado como um item discreto; em vez disso, todos os itens com contagens inferiores ao valor limiar são colocados num único "caixote do lixo".

    Se estiver a utilizar um pequeno conjunto de dados e estiver a contar e a treinar com os mesmos dados, um bom valor inicial é 1.

  4. Para exemplos pseudo-exemplos adicionais, escreva um número que indique o número de pseudo-exemplos adicionais a incluir. Não é necessário dar estes exemplos; os pseudo exemplos são gerados com base na distribuição prévia.

  5. Para a escala de ruído laplaciana, escreva um valor positivo de ponto flutuante que represente a escala utilizada para introduzir ruído amostrado de uma distribuição laplaciana. Quando se define um valor de escala, algum nível aceitável de ruído é incorporado no modelo, pelo que o modelo é menos suscetível de ser afetado por valores invisíveis nos dados.

  6. Nas funcionalidades de Saída incluem,escolha o método a utilizar ao criar funcionalidades baseadas na contagem para inclusão na transformação.

    • CountsOnly: Criar funcionalidades utilizando contagens.

    • LogOddsOnly: Criar funcionalidades utilizando o registo da relação odds.

    • BothCountsAndLogOdds: Criar funcionalidades utilizando as probabilidades de contagem e de registo.

  7. Selecione a opção Descodusar-se se pretender anular a IsBackOff bandeira na saída ao criar funcionalidades. Quando seleciona esta opção, as funcionalidades baseadas na contagem são criadas mesmo que a coluna não tenha valores significativos de contagem.

  8. Execute a experimentação. Em seguida, pode guardar a saída de Alterar parâmetros de tabela como uma nova transformação, se desejar.

Exemplos

Por exemplo, como este módulo, consulte a Galeria Azure AI:

Notas técnicas

Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.

É estatisticamente seguro contar e treinar no mesmo conjunto de dados se definir o parâmetro da escala de ruído laplaciana.

Entradas esperadas

Nome Tipo Description
Contagem de transformação Interface ITransform A contagem transforma-se para aplicar

Parâmetros do módulo

Nome Tipo Intervalo Opcional Predefinição Description
Limiar do caixote do lixo Float >=0,0f Necessário 10.0f O limiar sob o qual um valor de coluna será aparafusado contra o caixote do lixo
Exemplos pseudo-anteriores adicionais Float >=0,0f Necessário 42.0f Os pseudo exemplos adicionais que seguem as distribuições prévias a incluir
Escala de ruído laplacian Float >=0,0f Necessário 0.0f A escala da distribuição laplaciana a partir da qual o ruído é amostrado
As funcionalidades de saída incluem Modo de SaídaFeatureType Necessário BothCountsAndLogOdds As características de saída
Ignore a coluna de trás Booleano Necessário false Se ignorar a coluna IsBackOff na saída

Saídas

Nome Tipo Description
Transformação modificada Interface ITransform A transformação modificada

Exceções

Exceção Description
Erro 0003 A exceção ocorre se uma ou mais entradas forem nulas ou vazias.
Erro 0086 A exceção ocorre quando uma transformação de contagem é inválida.

Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte Machine Learning Códigos de Erro.

Para obter uma lista de exceções da API, consulte Machine Learning CÓDIGOs de Erro da API REST.

Ver também

Aprendizagem com Condes