Importar tabela de contagem

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Importa uma tabela de contagens criada anteriormente

categoria: Learning com contagens

Observação

aplica-se a: somente Machine Learning Studio (clássico)

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Visão geral do módulo

este artigo descreve como usar o módulo importar tabela de contagem no Machine Learning Studio (clássico).

a finalidade do módulo tabela de contagem de importação é permitir que os clientes que criaram uma tabela de estatísticas baseadas em contagem usem uma versão anterior do Machine Learning para atualizar o experimento. Esse módulo mescla as tabelas de contagem existentes com novos dados.

para obter informações gerais sobre tabelas de contagem e como elas são usadas para criar recursos, consulte Learning com contagens.

Importante

Esse módulo é fornecido unicamente para compatibilidade com versões anteriores com experimentos que usam a tabela de contagem de compilação preterida e módulos de Featurizer de contagem preteridos. Recomendamos que você atualize seu experimento para usar os módulos mais recentes, para aproveitar os novos recursos.

Para todos os novos experimentos, recomendamos que você use os seguintes módulos:

Como configurar a tabela de contagem de importação

  1. no Machine Learning Studio (clássico), abra um experimento que contenha uma tabela de contagem criada usando o módulo de tabela de contagem de compilação preterida.

  2. Adicione o módulo importar tabela de contagem ao experimento.

  3. Conexão as duas saídas do módulo tabela de contagem de compilação (preterido) para as portas de entrada correspondentes da tabela de contagem de importações.

    Se você tiver outro conjunto de dados de contagens que deseja mesclar com a tabela de contagem importada, conecte-o à entrada mais à direita para o módulo importar tabela de contagem .

  4. Use a opção tipo de contagem para especificar onde e como a tabela de contagem é armazenada:

    • Dataset: os dados usados para compilar contagens são salvos como um Dataset no Machine Learning Studio (clássico).

    • Blob: os dados usados para criar contagens são armazenados como um Blob de blocos no armazenamento Windows Azure.

    • MapReduce: os dados usados para criar contagens são armazenados como um blob no armazenamento Windows Azure.

      Normalmente, essa opção é preferida para conjuntos de grandes volumes de DataSet. Para acessar as contagens, você deve ativar o cluster HDInsight. um trabalho de MapReduce é iniciado para executar a contagem. Essas duas atividades podem incorrer em custos de armazenamento e computação.

      Para obter mais informações, consulte HDInsight no Azure.

    Depois de especificar o modo de armazenamento de dados, talvez seja necessário fornecer informações de conexão adicionais para os dados, mesmo que você tenha usado anteriormente um módulo importar dados no experimento para acessar dados. Isso ocorre porque o módulo Count Featurizer (preterido) acessa o armazenamento de dados separadamente para ler os dados e criar as tabelas necessárias.

  5. Use a opção de tipo de tabela Count para especificar o formato e o modo de armazenamento da tabela usada para armazenar contagens.

    • Dicionário: usa uma tabela de contagem de dicionários.

      Todos os valores de coluna nas colunas selecionadas são tratados como cadeias de caracteres e são transformados em hash usando uma matriz de bits de até 31 bits de tamanho. Portanto, todos os valores de coluna são representados por um inteiro de 32 bits não negativo.

    • CMSketch: usa uma tabela salva na tabela de esboço de contagem mínima.

      Com esse formato, várias funções de hash independentes com um intervalo menor são usadas para melhorar a eficiência da memória e reduzir a chance de colisões de hash.

    Em geral, você deve usar a opção de dicionário para conjuntos de dados menores ( < 1 GB) e usar a opção CMSketch para conjuntos de dados maiores.

  6. Execute o experimento.

  7. Ao concluir, clique com o botão direito do mouse na saída do módulo tabela de contagem de importações , selecione salvar como transformaçãoe digite um nome para a transformação. Quando você faz isso, as tabelas de contagem mescladas e os parâmetros personalização que você pode ter aplicado são salvos em um formato que pode ser aplicado a um novo conjunto de um.

Exemplos

Explore exemplos de personalização com base em contagem usando esses experimentos de exemplo no Galeria de ia do Azure:

Observação

esses experimentos da galeria foram todos criados usando a versão anterior, e agora preterida, da Learning com módulos de contagens. Quando você abre o experimento no Studio (clássico), o experimento é atualizado automaticamente para usar os módulos mais recentes.

Entradas esperadas

Nome Tipo Descrição
Contagem de metadados Tabela de Dados Os metadados das contagens
Tabela de contagem Tabela de Dados A tabela de contagem
Conjunto de dados contado Tabela de Dados O conjunto de dados usado para contagem

Parâmetros do módulo

Nome Tipo Intervalo Opcional Padrão Descrição
Tipo de contagem CountingType Obrigatório O tipo de contagem

Saídas

Nome Tipo Descrição
Transformação de contagem Interface ITransform A transformação contagem

Exceções

Exceção Descrição
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia.
Erro 0018 Ocorrerá uma exceção se o conjunto de dados de entrada não for válido.

Para ver uma lista de erros específicos dos módulos do Studio (clássico), consulte Machine Learning Códigos de erro.

Para ver uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.

Confira também

Aprendendo com contagens