Tabela de Contagem de Importações

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Importa uma tabela de contagens previamente criada

Categoria: Aprendizagem com Condes

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Visão geral do módulo

Este artigo descreve como usar o módulo de tabela de contagem de importações em Machine Learning Studio (clássico).

O objetivo do módulo tabela de contagem de importações é permitir que os clientes que criaram uma tabela de estatísticas baseadas na contagem usando uma versão anterior de Machine Learning para atualizar a sua experiência. Este módulo funde as tabelas de contagem existentes com novos dados.

Para obter informações gerais sobre tabelas de contagem e como são usadas para criar funcionalidades, consulte Aprendizagem com os Condes.

Importante

Este módulo é fornecido unicamente para retrocompatibilidade com experiências que utilizam a tabela de contagem de construção precada e módulos condeprecados. Recomendamos que atualize a sua experiência para utilizar os módulos mais recentes, para tirar partido de novas funcionalidades.

Para todas as novas experiências, recomendamos que utilize os seguintes módulos:

Como configurar tabela de contagem de importações

  1. Em Machine Learning Studio (clássico), abra uma experiência que contenha uma tabela de contagem criada usando o módulo de tabela de contagem de construção precada.

  2. Adicione o módulo de tabela de contagem de importações à experiência.

  3. Ligação as duas saídas do módulo Build Count Table (precotado) para as portas de entrada correspondentes da Tabela de Contagem de Importações.

    Se tiver outro conjunto de contagens que pretende fundir com a tabela de contagem importada, conecte-a à entrada mais à direita para o módulo tabela de contagem de importações .

  4. Utilize a opção 'Contagem' para especificar onde e como a tabela de contagem é armazenada:

    • Conjunto de dados: Os dados utilizados para construir contagens são guardados como um conjunto de dados no Machine Learning Studio (clássico).

    • Blob: Os dados utilizados para construir contagens são armazenados como uma bolha de bloco no Windows armazenamento Azure.

    • MapReduce: Os dados utilizados para construir contagens são armazenados como uma bolha no Windows armazenamento Azure.

      Esta opção é normalmente preferida para conjuntos de dados muito grandes. Para aceder às contagens, tem de ativar o cluster HDInsight. Um trabalho MapReduce é lançado para realizar a contagem. Ambas as atividades podem incorrer em custos de armazenamento e computação.

      Para mais informações, consulte HDInsight no Azure.

    Depois de especificar o modo de armazenamento de dados, poderá ter de fornecer informações adicionais de ligação para os dados, mesmo que tenha usado previamente um módulo de Dados de Importação na experiência para aceder aos dados. Isto porque o módulo Conde Featurizer (precotado) acede ao armazenamento de dados separadamente para ler os dados e construir as tabelas necessárias.

  5. Utilize a opção de tipo de tabela Count para especificar o formato e o modo de armazenamento da tabela utilizada para armazenar as contagens.

    • Dicionário: Usa uma tabela de contagem de dicionários.

      Todos os valores de coluna nas colunas selecionadas são tratados como cordas, e são hashed usando um pouco de matriz de até 31 bits de tamanho. Portanto, todos os valores da coluna são representados por um inteiro não negativo de 32 bits.

    • CMSketch: Utiliza uma tabela guardada na tabela de esboços mínimos de contagem.

      Com este formato, várias funções de hash independentes com uma gama menor são usadas para melhorar a eficiência da memória e reduzir a chance de colisões de hash.

    Em geral, deve utilizar a opção Dicionário para conjuntos de dados mais pequenos (<1GB) e utilizar a opção CMSketch para conjuntos de dados maiores.

  6. Execute a experimentação.

  7. Quando estiver concluído, clique com o botão direito na saída do módulo tabela de contagem de importações , selecione Save as Transform e escreva um nome para a transformação. Quando o faz, as tabelas de contagem fundidas e quaisquer parâmetros de caracterização que possa ter aplicado são guardados num formato que pode ser aplicado a um novo conjunto de dados.

Exemplos

Explore exemplos de caracterização baseada na contagem utilizando estas experiências de amostra na Galeria Azure AI:

Nota

Estas experiências da Galeria foram todas criadas usando a versão anterior, e agora depreciada, do Aprendizagem com módulos Condes. Quando abre a experiência em Studio (clássico), a experiência é automaticamente atualizada para utilizar os módulos mais recentes.

Entradas esperadas

Nome Tipo Description
Contar metadados Tabela de Dados Os metadados das contagens
Tabela contagem Tabela de Dados A tabela de contagem
Conjunto de dados contados Tabela de Dados O conjunto de dados utilizado para a contagem

Parâmetros do módulo

Nome Tipo Intervalo Opcional Predefinição Description
Tipo de contagem CountingType Necessário O tipo de contagem

Saídas

Nome Tipo Description
Contagem de transformação Interface ITransform A transformação da contagem

Exceções

Exceção Description
Erro 0003 A exceção ocorre se uma ou mais entradas forem nulas ou vazias.
Erro 0018 A exceção ocorre se o conjunto de dados de entrada não for válido.

Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte Machine Learning Códigos de Erro.

Para obter uma lista de exceções da API, consulte Machine Learning CÓDIGOs de Erro da API REST.

Ver também

Aprendizagem com Condes