Aplicar operação matemática

Este artigo descreve um módulo do designer do Azure Machine Learning.

Use o módulo Aplicar operação matemática para criar cálculos que são aplicados a colunas numéricas no conjunto de dados de entrada.

As operações matemáticas incluem funções aritméticas, funções trigonométricas, funções de arredondamento e funções especiais usadas na ciência de dados, como gama e funções de erro.

Depois de definir uma operação e executar o pipeline, os valores são adicionados ao seu conjunto de dados. Dependendo de como você configura o módulo, é possível:

  • Acrescentar os resultados ao seu conjunto de dados (útil ao verificar o resultado da operação).
  • Substituir os valores de colunas pelos novos valores calculados.
  • Gerar uma nova coluna para resultados e não mostrar os dados originais.

Procure a operação que você precisa nessas categorias:

  • Basic

    As funções na categoria Básico podem ser usadas para manipular um único valor ou uma coluna de valores. Por exemplo, você pode obter o valor absoluto de todos os números em uma coluna ou calcular a raiz quadrada de cada valor em uma coluna.

  • Comparar

    Todas as funções na categoria Comparar são usadas para comparação: você pode fazer uma comparação por pares dos valores em duas colunas ou pode comparar cada valor em uma coluna para uma constante especificada. Por exemplo, você pode comparar colunas para determinar se os valores eram os mesmos em dois conjuntos de dados. Ou, você pode usar uma constante, como um valor máximo permitido, para localizar exceções em uma coluna numérica.

  • Operações

    A categoria Operações inclui funções matemáticas básicas: adição, subtração, multiplicação e divisão. Você pode trabalhar com colunas ou constantes. Por exemplo, você pode adicionar o valor da coluna A ao valor da coluna B. Ou, você pode subtrair uma constante, como uma média calculada anteriormente, de cada valor da coluna A.

  • Arredondamento

    A categoria de Arredondamento inclui uma variedade de funções para executar operações, como arredondamento, teto, piso e truncamento para vários níveis de precisão. Você pode especificar o nível de precisão para números decimais e inteiros.

  • Especial

    A categoria Especial inclui funções matemáticas que são especialmente usadas em ciência de dados, como integrais elípticos e a função erro de Gauss.

  • Trigonométricas

    A categoria Trigonométrica inclui todas as funções trigonométricas padrão. Por exemplo, você pode converter radianos em graus ou calcular funções, como tangentes, em radianos ou graus. Essas funções são unárias, o que significa que pegam uma única coluna de valores como entrada, aplicam a função trigonométrica e retornam uma coluna de valores como resultado. Verifique se a coluna de entrada é o tipo apropriado e se ela contém o tipo correto de valores para a operação especificada.

Como configurar a opção Aplicar operação matemática

O módulo Aplicar operação matemática requer um conjunto de dados que contém pelo menos uma coluna somente com números. Os números podem ser discretos ou contínuos, mas devem ser de um tipo de dados numérico, não uma cadeia de caracteres.

Você pode aplicar a mesma operação a várias colunas numéricas, mas todas as colunas devem estar no mesmo conjunto de dados.

Cada instância desse módulo pode executar apenas um tipo de operação por vez. Para executar operações matemáticas complexas, talvez seja necessário encadear várias instâncias do módulo Aplicar operação matemática.

  1. Adicione o módulo Aplicar operação matemática ao seu pipeline.

  2. Conecte um conjunto de dados que contenha pelo menos uma coluna numérica.

  3. Selecione uma ou mais colunas de origem para executar o cálculo.

    • Qualquer coluna escolhida deve ser um tipo de dados numérico.
    • O intervalo de dados deve ser válido para a operação matemática selecionada. Caso contrário, poderá ocorrer um erro ou o resultado NaN (não um número). Por exemplo, Ln(-1.0) é uma operação inválida e resulta em um valor de NaN.
  4. Escolha Categoria para selecionar o tipo de operação matemática a ser executada.

  5. Escolha uma operação específica da lista nessa categoria.

  6. Defina parâmetros adicionais necessários para cada tipo de operação.

  7. Use a opção Modo de saída para indicar como você deseja que a operação matemática seja gerada:

    • Append. Todas as colunas usadas como entradas são incluídas no conjunto de dados de saída, além disso uma coluna adicional é anexada, que contém os resultados da operação matemática.
    • Inplace. Os valores nas colunas usadas como entradas são substituídos pelos novos valores calculados.
    • ResultOnly. Uma única coluna é retornada contendo os resultados da operação matemática.
  8. Enviar o pipeline.

Resultados

Se você gerar os resultados usando as opções Append ou ResultOnly, os cabeçalhos de coluna do conjunto de dados retornado indicará a operação e as colunas que foram usadas. Por exemplo, se você comparar duas colunas usando o operador Igual, os resultados seriam como o seguinte:

  • Igual(Col2_Col1) , indicando que você testou Col2 em relação a Col1.
  • Igual(Col2_$10) , indicando que você comparou a coluna 2 com a constante 10.

Mesmo que você use a opção no local, os dados de origem não serão excluídos ou alterados; a coluna no conjunto de dados original ainda estará disponível no designer. Para exibir os dados originais, você pode conectar o módulo Adicionar colunas e associá-lo à saída do módulo Aplicar operação matemática.

Operações matemáticas básicas

As funções na categoria Básico geralmente usam um único valor de uma coluna, executam a operação predefinida e retornam um único valor. Para algumas funções, você pode especificar uma constante ou um conjunto de colunas como um segundo argumento.

O Azure Machine Learning é compatível com as seguintes funções na categoria Básico :

Abs

Retorna o valor absoluto das colunas selecionadas.

Atan2

Retorna uma tangente inversa de quatro quadrantes.

Selecione as colunas que contêm as coordenadas de ponto. Para o segundo argumento, que corresponde à coordenada x, você também pode especificar uma constante.

Corresponde à função ATAN2 no MATLAB.

Conj

Retorna o conjugado para os valores na coluna selecionada.

CubeRoot

Calcula a raiz cúbica para os valores na coluna selecionada.

DoubleFactorial

Calcula o fatorial duplo para valores na coluna selecionada. O fatorial duplo é uma extensão da função fatorial normal e é denotado como x!!.

Eps

Retorna o tamanho do espaço entre o valor atual e o próximo número mais alto de precisão dupla. Corresponde à função EPS no MATLAB.

Exp

Retorna e eleva à potência do valor na coluna selecionada. Essa função é igual à função EXP do Excel.

Exp2

Retorna o exponencial de base 2 dos argumentos, resolvendo para y = x * 2t, em que t é uma coluna de valores que contém expoentes.

Em Conjunto de colunas, selecione a coluna que contém os valores de expoente t.

Para Exp2, você pode especificar um segundo argumento x, que pode ser uma constante ou outra coluna de valores. No Tipo do segundo argumento, indique se você fornecerá o multiplicador x como uma constante ou um valor em uma coluna.

Por exemplo, se você selecionar uma coluna com os valores {0,1,2,3,4,5} para o multiplicador e o expoente, a função retornará {0, 2, 8, 24, 64 160).

ExpMinus1

Retorna o expoente negativo para valores na coluna selecionada.

Fatorial

Retorna o fatorial para valores na coluna selecionada.

Hipotenusa

Calcula a hipotenusa de um triângulo no qual o comprimento de um lado é especificado como uma coluna de valores, e o comprimento do segundo lado é especificado como uma constante ou como duas colunas.

Ln

Retorna o logaritmo natural dos valores na coluna selecionada.

LnPlus1

Retorna o logaritmo natural mais um para os valores na coluna selecionada.

Registro

Retorna o log dos valores na coluna selecionada, dada a base especificada.

Você pode especificar a base (o segundo argumento) como uma constante ou selecionando outra coluna de valores.

Log10

Retorna os valores de logaritmo de base 10 para a coluna selecionada.

Log2

Retorna os valores de logaritmo de base 2 para a coluna selecionada.

NthRoot

Retorna a enésima raiz do valor usando um n especificado.

Selecione as colunas para as quais você deseja calcular a raiz, usando a opção ColumnSet.

No Tipo do segundo argumento, selecione outra coluna que contenha a raiz ou especifique uma constante a ser usada como raiz.

Se o segundo argumento for uma coluna, cada valor na coluna será usado como o valor de n para a linha correspondente. Se o segundo argumento for uma constante, digite o valor para n na caixa de texto do Segundo argumento.

Pow

Calcula X elevado à potência de Y para cada um dos valores na coluna selecionada.

Primeiro, selecione as colunas que contêm a base, que deve ser um float, usando a opção ColumnSet.

No Tipo do segundo argumento, selecione a coluna que contém o expoente ou especifique uma constante a ser usada como expoente.

Se o segundo argumento é uma coluna, cada valor na coluna é usado como o exponente para a linha correspondente. Se o segundo argumento for uma constante, digite o valor para o expoente na caixa de texto do Segundo argumento.

Sqrt

Retorna a raiz quadrada dos valores na coluna selecionada.

SqrtPi

Para cada valor na coluna selecionada, multiplica o valor por pi e, em seguida, retorna a raiz quadrada do resultado.

Square

Eleva ao quadrado os valores na coluna selecionada.

Operadores de comparação

Use as funções de comparação no designer do Azure Machine Learning sempre que precisar testar dois conjuntos de valores entre si. Por exemplo, em um pipeline, talvez seja necessário fazer essas operações de comparação:

  • Avaliar uma coluna do modelo de pontuação de probabilidade em relação a um valor limite.
  • Determine se dois conjuntos de resultados são os mesmos. Para cada linha diferente, adicione um sinalizador FALSE que pode ser usado para processamento ou filtragem adicional.

EqualTo

Retorna True se os valores forem iguais.

GreaterThan

Retorna True se os valores no Conjunto de colunas forem maiores que a constante especificada, ou maiores que os valores correspondentes na coluna de comparação.

GreaterThanOrEqualTo

Retorna True se os valores no Conjunto de colunas forem maiores ou iguais à constante especificada, ou maiores ou iguais aos valores correspondentes na coluna de comparação.

LessThan

Retorna True se os valores no Conjunto de colunas forem menores que a constante especificada, ou menores que os valores correspondentes na coluna de comparação.

LessThanOrEqualTo

Retorna True se os valores no Conjunto de colunas forem menores ou iguais à constante especificada, ou menores ou iguais aos valores correspondentes na coluna de comparação.

NotEqualTo

Retorna True se os valores em Coluna definida não forem iguais à constante ou coluna de comparação e retorna False se forem iguais.

PairMax

Retorna o valor maior; o valor na Coluna definida ou o valor na coluna constante ou comparação.

PairMin

Retorna o valor menor; o valor no Conjunto de colunas ou o valor na constante ou na coluna de comparação.

Arithmetic operations

Inclui as operações aritméticas básicas: adição e subtração, divisão e multiplicação. Como a maioria das operações é binária, que exigem dois números, você primeiro escolhe a operação e, em seguida, a coluna ou os números a serem usados no primeiro e segundo argumento.

A ordem de divisão e subtração são as seguintes:

  • Subtrair(Arg1_Arg2) = Arg1 - Arg 2
  • Dividir(Arg1_Arg2) = Arg1 / Arg 2

A tabela a seguir mostra alguns exemplos:

Operação Núm1 Núm2 Coluna de resultado Valor do resultado
Adição 1 5 Adicionar(Num2_Num1) 6
Multiplicação 1 5 Multiplicar(Num2_Num1) 5
Subtração 5 1 Subtrair(Num2_Num1) 4
Subtração 0 1 Subtrair(Num2_Num1) -1
Divisão 5 1 Dividir(Num2_Num1) 5
Divisão 1 0 Dividir(Num2_Num1) Infinito

Adicionar

Especifique as colunas de origem usando o Conjunto de colunas e, em seguida, adicione a esses valores um número especificado no Segundo argumento.

Para adicionar os valores em duas colunas, escolha uma coluna (ou colunas) usando o Conjunto de colunas e, em seguida, escolha uma segunda coluna usando o Segundo argumento.

Dividir

Divide os valores no Conjunto de colunas por uma constante ou pelos valores de coluna definidos no Segundo argumento. Ou seja, você escolhe o divisor primeiro e, em seguida, o dividendo. O valor de saída é o quociente.

Multiplicar

Multiplica os valores na Coluna definida pelos valores de constante ou coluna especificados.

Subtrair

Especifique a coluna de valores para operar (o minuendo), escolhendo uma coluna diferente com a opção Conjunto de colunas. Em seguida, especifique o número a ser subtraído (o subtraendo), usando a lista suspensa Segundo argumento. Você pode escolher uma constante ou coluna de valores.

Operações de arredondamento

O designer do Azure Machine Learning é compatível com uma variedade de operações de arredondamento. Para muitas operações, você deve especificar a medida de precisão a ser usada no arredondamento. Você pode usar um nível de precisão estática, especificado como uma constante, ou pode aplicar um valor de precisão dinâmica obtido de uma coluna de valores.

  • Se você usar uma constante, defina o Tipo de precisão como Constante e, em seguida, insira o número de dígitos como um inteiro na caixa de texto Precisão da constante. Se você inserir um número não inteiro, o módulo não gerará um erro, mas os resultados poderão ser inesperados.

  • Para usar um valor de precisão diferente para cada linha do conjunto de dados, defina Tipo de precisão como ColumnSet e escolha a coluna que contém os valores de precisão apropriados.

Ceiling

Retorna o teto para os valores na Coluna definida.

CeilingPower2

Retorna o teto quadrado para os valores na Coluna definida.

Piso

Retorna a base para os valores na Coluna definida, até a precisão especificada.

Mod

Retorna a parte fracionária dos valores na Coluna definida, até a precisão especificada.

Quociente

Retorna a parte fracionária dos valores na Coluna definida, até a precisão especificada.

Resto

Retorna o restante para os valores na Coluna definida.

RoundDigits

Retorna os valores na Coluna definida, arredondado pela regra de 4/5 para o número de dígitos especificado.

RoundDown

Retorna os valores na Coluna definida, arredondado para baixo até o número especificado de dígitos.

RoundUp

Retorna os valores na Coluna definida, arredondado para cima até o número especificado de dígitos.

ToEven

Retorna os valores na Coluna definida, arredondados para o próximo número inteiro par.

ToOdd

Retorna os valores na Coluna definida, arredondados para o próximo número inteiro ímpar.

Truncate

Trunca os valores na Coluna definida removendo todos os dígitos não permitidos pela precisão especificada.

Funções matemáticas especiais

Essa categoria inclui funções matemáticas especializadas, geralmente usadas em ciência de dados. Salvo indicação em contrário, a função é unária e retorna o cálculo especificado para cada valor na coluna ou colunas selecionadas.

Beta

Retorna o valor da função beta de Euler.

EllipticIntegralE

Retorna o valor da integral elíptica incompleta.

EllipticIntegralK

Retorna o valor da integral elíptica completa (K).

Erf

Retorna o valor da função de erro.

A função de erro (também chamada de função de erro Gauss) é uma função especial de forma sigmoide que é usada na probabilidade para descrever a difusão.

Erfc

Retorna o valor da função de erro complementar.

Erfc é definido como 1 – erf(x).

ErfScaled

Retorna o valor da função de erro dimensionada.

Uma versão dimensionada da função de erro pode ser usada para evitar estouro aritmético.

ErfInverse

Retorna o valor da função erf inversa.

ExponentialIntegralEin

Retorna o valor da integral exponencial (Ei).

Gama

Retorna o valor da função gama.

GammaLn

Retorna o logaritmo natural da função gama.

GammaRegularizedP

Retorna o valor da função gama incompleta regularizada.

Essa função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

GammaRegularizedPInverse

Retorna o valor da função gama incompleta regularizada inversa.

Essa função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

GammaRegularizedQ

Retorna o valor da função gama incompleta regularizada.

Essa função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

GammaRegularizedQInverse

Retorna o valor da função gama incompleta regularizada generalizada inversa.

Essa função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

PolyGamma

Retorna o valor da função poligama.

Essa função usa um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

Funções trigonométricas

Esta categoria inclui a maioria das funções trigonométricas e trigonométricas inversas importantes. Todas as funções trigonométricas são unárias e não requerem nenhum argumento adicional.

Acos

Calcula o arco cosseno para os valores de coluna.

AcosDegree

Calcula o arco cosseno dos valores da coluna, em graus.

Acosh

Calcula o arco cosseno hiperbólico dos valores da coluna.

Acot

Calcula o arco cotangente dos valores da coluna.

AcotDegrees

Calcula o arco cotangente dos valores de coluna, em graus.

Acoth

Calcula o arco cotangente hiperbólico dos valores de coluna.

Acsc

Calcula o arco secante dos valores da coluna.

AcscDegrees

Calcula o arco-secante dos valores da coluna, em graus.

Asec

Calcula o arco secante dos valores da coluna.

AsecDegrees

Calcula o arco secante dos valores da coluna, em graus.

Asech

Calcula o arco secante hiperbólico dos valores da coluna.

Asin

Calcula o arco seno dos valores da coluna.

AsinDegrees

Calcula o arco seno dos valores da coluna, em graus.

Asinh

Calcula o arco seno hiperbólico dos valores da coluna.

Atan

Calcula o arco tangente dos valores de coluna.

AtanDegrees

Calcula o arco tangente dos valores da coluna, em graus.

Atanh

Calcula o arco tangente hiperbólico dos valores da coluna.

Cos

Calcula o cosseno dos valores de coluna.

CosDegrees

Calcula o cosseno para os valores da coluna, em graus.

Cosh

Calcula o cosseno hiperbólico dos valores da coluna.

Cot

Calcula a cotangente para os valores de coluna.

CotDegrees

Calcula a cotangente dos valores da coluna, em graus.

Coth

Calcula a cotangente hiperbólica dos valores da coluna.

Csc

Calcula a cossecante para os valores de coluna.

CscDegrees

Calcula a cossecante dos valores da coluna, em graus.

Csch

Calcula a cossecante hiperbólica dos valores da coluna.

DegreesToRadians

Converte graus em radianos.

Sec

Calcula a secante dos valores da coluna.

aSecDegrees

Calcula a secante dos valores da coluna., em graus.

aSech

Calcula a secante hiperbólica dos valores da coluna.

Assinar

Retorna o sinal dos valores da coluna.

Sin

Calcula o seno dos valores da coluna.

Sinc

Calcula o valor seno-cosseno dos valores da coluna.

SinDegrees

Calcula o seno dos valores da coluna, em graus.

Sinh

Calcula o seno hiperbólico dos valores da coluna.

Tan

Calcula a tangente dos valores da coluna.

TanDegrees

Calcula a tangente do argumento, em graus.

Tanh

Calcula a tangente hiperbólica dos valores da coluna.

Observações técnicas

Tenha cuidado ao selecionar mais de uma coluna como o segundo operador. Os resultados são fáceis de entender se a operação for simples, como adicionar uma constante a todas as colunas.

Suponha que o conjunto de dados tenha várias colunas e você o adiciona a ele mesmo. Nos resultados, cada coluna é adicionada a si mesma, da seguinte maneira:

Núm1 Núm2 Num3 Adicionar(Num1_Num1) Adicionar(Num2_Num2) Adicionar(Num3_Num3)
1 5 2 2 10 4
2 3 -1 4 6 -2
0 1 -1 0 2 -2

Se você precisar executar cálculos mais complexos, poderá encadear várias instâncias de Aplicar operação matemática. Por exemplo, você pode adicionar duas colunas usando uma instância de Aplicar Operação Matemática e usar outra instância de Aplicar Operação Matemática para dividir a soma por uma constante para obter a média.

Como alternativa, use um dos seguintes módulos para fazer todos os cálculos de uma só vez, usando o script SQL, R ou Python:

Próximas etapas

Confira o conjunto de módulos disponíveis no Azure Machine Learning.