Modificar parâmetros da tabela de contagem

Modifica os parâmetros usados para criar recursos de contagens

Categoria: aprendendo com contagens

Observação

Aplica-se a: Machine Learning Studio (clássico)

Esse conteúdo pertence apenas ao estúdio (clássico). Módulos de arrastar e soltar semelhantes foram adicionados ao designer de Azure Machine Learning. Saiba mais neste artigo comparando as duas versões.

Visão geral do módulo

Este artigo descreve como usar o módulo Modificar parâmetros de tabela de contagem no Azure Machine Learning Studio (clássico), para alterar a forma como os recursos são gerados a partir de uma tabela de contagem.

Em geral, para criar recursos baseados em contagem, você usa a transformação criar contagem para processar um conjunto de um e criar uma tabela de contagem, e a partir dessa tabela de contagem gera um novo conjunto de recursos.

No entanto, se você já tiver criado uma tabela de contagem, poderá usar o módulo Modificar parâmetros de tabela de contagem para editar a definição de como os dados de contagem são processados. Isso permite que você crie um conjunto diferente de estatísticas baseadas em contagem com base nos dados existentes, sem a necessidade de analisar novamente o DataSet.

Como configurar parâmetros de modificação de contagem

  1. Localize a transformação que você deseja modificar, no grupo transformações e adicione-a ao seu experimento.

    Você deve ter executado anteriormente um experimento que criou uma transformação de contagem.

    • Para modificar uma transformação salva: Localize a transformação, no grupo transformações e adicione-a ao seu experimento.

    • Para modificar uma transformação de contagem criada no mesmo experimento: se a transformação não tiver sido salva, mas estiver disponível como uma saída no experimento atual (por exemplo, verifique a saída do módulo criar transformação de contagem ), você poderá usá-la diretamente conectando os módulos.

  2. Adicione o módulo Modificar parâmetros de tabela de contagem e conecte a transformação como uma entrada.

  3. No painel Propriedades do módulo Modificar parâmetros de tabela de contagem , digite um valor a ser usado como o limite de compartimento de lixo.

    Esse valor especifica o número mínimo de ocorrências que devem ser encontradas para cada valor de recurso, a fim de que as contagens sejam usadas. Se a frequência do valor for menor que o limite de compartimento de lixo, o par de rótulo de valor não será contado como um item discreto; em vez disso, todos os itens com contagens inferiores ao valor do limite são colocados em um único "compartimento de lixo".

    Se você estiver usando um pequeno conjunto de dados e estiver contando e treinando os mesmos, um bom valor inicial será 1.

  4. Para obter mais exemplos anteriores, digite um número que indique o número de pseudo exemplos adicionais a serem incluídos. Você não precisa fornecer estes exemplos; os pseudo exemplos são gerados com base na distribuição anterior.

  5. Para a escala de ruído de laplaciana, digite um valor de ponto flutuante positivo que represente a escala usada para introduzir a amostra de ruído de uma distribuição laplaciana. Quando você define um valor de escala, um nível aceitável de ruído é incorporado ao modelo, portanto, é menos provável que o modelo seja afetado por valores não vistos nos dados.

  6. Em recursos de saída incluem, escolha o método a ser usado ao criar recursos baseados em contagem para inclusão na transformação.

    • CountsOnly: criar recursos usando contagens.

    • LogOddsOnly: Crie recursos usando o log da taxa de chances.

    • BothCountsAndLogOdds: Crie recursos usando contagens e chances de log.

  7. Selecione a opção ignorar coluna de retirada se desejar substituir o IsBackOff sinalizador na saída ao criar recursos. Quando você seleciona essa opção, os recursos baseados em contagem são criados mesmo que a coluna não tenha valores de contagem significativos.

  8. Execute o experimento. Em seguida, você pode salvar a saída de parâmetros da tabela de contagem de modificação como uma nova transformação, se desejado.

Exemplos

Para obter exemplos de como esse módulo, consulte o Galeria de ia do Azure:

Observações técnicas

Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.

É seguro estatisticamente contar e treinar no mesmo conjunto de dados se você definir o parâmetro de escala de ruído Laplaciana.

Entradas esperadas

Nome Tipo Descrição
Transformação de contagem Interface ITransform A transformação de contagem a ser aplicada

Parâmetros do módulo

Nome Tipo Intervalo Opcional Padrão Descrição
Limite de compartimento de lixo Float >=0.0f Necessária 10.0f O limite sob o qual um valor de coluna será destacados em relação à lixeira de lixo
Exemplos pseudo-anterior adicionais Float >=0.0f Necessária 42.0 f Os exemplos pseudo adicionais após as distribuições anteriores a serem incluídos
Escala de ruído Laplaciana Float >=0.0f Necessária 0,0 f A escala da distribuição laplaciana da qual o ruído é amostrado
Incluem recursos de saída OutputFeatureType Necessária BothCountsAndLogOdds Os recursos para saída
Ignorar a coluna de retirada Boolean Necessária false Se a coluna isretrocesso deve ser ignorada na saída

Saídas

Nome Tipo Descrição
Transformação modificada Interface ITransform A transformação modificada

Exceções

Exceção Descrição
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia.
Erro 0086 A exceção ocorre quando uma transformação de contagem é inválida.

Para obter uma lista de erros específicos para módulos do Studio (clássicos), consulte Machine Learning códigos de erro.

Para obter uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.

Consulte também

Aprendendo com contagens