Stosowanie operacji matematycznej

W tym artykule opisano składnik projektanta usługi Azure Machine Learning.

Użyj operacji Zastosuj operację matematyczną, aby utworzyć obliczenia, które są stosowane do kolumn liczbowych w wejściowym zestawie danych.

Operacje matematyczne obejmują funkcje arytmetyczne, funkcje trygonometryczne, funkcje zaokrąglania i specjalne funkcje używane w nauce o danych, takie jak gamma i funkcje błędów.

Po zdefiniowaniu operacji i uruchomieniu potoku wartości zostaną dodane do zestawu danych. W zależności od sposobu konfigurowania składnika można wykonywać następujące czynności:

  • Dołącz wyniki do zestawu danych (przydatne podczas weryfikowania wyniku operacji).
  • Zastąp wartości kolumn nowymi, obliczonymi wartościami.
  • Wygeneruj nową kolumnę dla wyników i nie pokazuj oryginalnych danych.

Wyszukaj operację potrzebną w następujących kategoriach:

  • Podstawowa

    Funkcje w kategorii Podstawowa mogą służyć do manipulowania pojedynczą wartością lub kolumną wartości. Na przykład możesz uzyskać wartość bezwzględną wszystkich liczb w kolumnie lub obliczyć pierwiastek kwadratowy każdej wartości w kolumnie.

  • Porównaj

    Funkcje w kategorii Porównaj są używane do porównania: można wykonać porównanie parowe wartości w dwóch kolumnach lub porównać każdą wartość w kolumnie z określoną stałą. Można na przykład porównać kolumny, aby określić, czy wartości były takie same w dwóch zestawach danych. Możesz też użyć stałej, takiej jak maksymalna dozwolona wartość, aby znaleźć wartości odstające w kolumnie liczbowej.

  • Operacje

    Kategoria Operacje obejmuje podstawowe funkcje matematyczne: dodawanie, odejmowanie, mnożenie i dzielenie. Możesz pracować z kolumnami lub stałymi. Możesz na przykład dodać wartość w kolumnie A do wartości w kolumnie B. Możesz też odjąć stałą, taką jak wcześniej obliczona średnia, z każdej wartości w kolumnie A.

  • Zaokrąglanie

    Kategoria Zaokrąglanie obejmuje różne funkcje do wykonywania operacji, takich jak zaokrąglanie, sufit, podłoga i obcinanie do różnych poziomów precyzji. Można określić poziom dokładności dla liczb dziesiętnych i całkowitych.

  • Specjalne

    Kategoria Specjalna obejmuje funkcje matematyczne, które są szczególnie używane w nauce o danych, takie jak wielokropki i funkcja błędu Gaussiana.

  • Trygonometryczne

    Kategoria Trigonometric zawiera wszystkie standardowe funkcje trygonometryczne. Na przykład można przekonwertować radiany na stopnie lub funkcje obliczeniowe, takie jak tangens w radianach lub stopniach. Te funkcje są jednoargumentowe, co oznacza, że przyjmują pojedynczą kolumnę wartości jako dane wejściowe, stosują funkcję trygonometryczną i zwracają kolumnę wartości w wyniku. Upewnij się, że kolumna wejściowa jest odpowiednim typem i zawiera prawidłowy typ wartości dla określonej operacji.

Jak skonfigurować operację zastosuj operację matematyczną

Składnik Zastosuj operację matematyczną wymaga zestawu danych zawierającego co najmniej jedną kolumnę zawierającą tylko liczby. Liczby mogą być dyskretne lub ciągłe, ale muszą mieć typ danych liczbowych, a nie ciąg.

Tę samą operację można zastosować do wielu kolumn liczbowych, ale wszystkie kolumny muszą znajdować się w tym samym zestawie danych.

Każde wystąpienie tego składnika może wykonać tylko jeden typ operacji naraz. Aby wykonać złożone operacje matematyczne, może być konieczne łączenie kilku wystąpień składnika Apply Math Operation .

  1. Dodaj składnik Zastosuj operację matematyczną do potoku.

  2. Połącz zestaw danych zawierający co najmniej jedną kolumnę liczbową.

  3. Wybierz co najmniej jedną kolumnę źródłową, na której ma być wykonywane obliczenie.

    • Dowolna wybrana kolumna musi być typem danych liczbowych.
    • Zakres danych musi być prawidłowy dla wybranej operacji matematycznej. W przeciwnym razie może wystąpić błąd lub wynik NaN (nie liczba). Na przykład Ln(-1.0) jest nieprawidłową operacją i powoduje wartość NaN.
  4. Wybierz kategorię , aby wybrać typ operacji matematycznej do wykonania.

  5. Wybierz określoną operację z listy w tej kategorii.

  6. Ustaw dodatkowe parametry wymagane przez każdy typ operacji.

  7. Użyj opcji Tryb danych wyjściowych , aby wskazać sposób generowania operacji matematycznych:

    • Dołącz. Wszystkie kolumny używane jako dane wejściowe są uwzględniane w wyjściowym zestawie danych, a jedna dodatkowa kolumna jest dołączana, która zawiera wyniki operacji matematycznej.
    • Miejsce. Wartości w kolumnach używanych jako dane wejściowe są zastępowane nowymi wartościami obliczeniowymi.
    • ResultOnly. Zwracana jest pojedyncza kolumna zawierająca wyniki operacji matematycznej.
  8. Prześlij potok.

Wyniki

Jeśli wyniki są generowane przy użyciu opcji Dołącz lub ResultOnly , nagłówki kolumn zwróconego zestawu danych wskazują operację i użyte kolumny. Jeśli na przykład porównasz dwie kolumny przy użyciu operatora Equals , wyniki będą wyglądać następująco:

  • Equals(Col2_Col1), wskazując, że przetestowano kolumnę Col2 względem kolumny Col1.
  • Equals(Col2_$10), wskazując, że kolumna 2 porównała do stałej 10.

Nawet jeśli używasz opcji W miejscu , dane źródłowe nie są usuwane ani zmieniane; kolumna w oryginalnym zestawie danych jest nadal dostępna w projektancie. Aby wyświetlić oryginalne dane, możesz połączyć składnik Dodaj kolumny i dołączyć go do danych wyjściowych operacji zastosuj operację matematyczną.

Podstawowe operacje matematyczne

Funkcje w kategorii Podstawowa zwykle przyjmują pojedynczą wartość z kolumny, wykonują wstępnie zdefiniowaną operację i zwracają pojedynczą wartość. W przypadku niektórych funkcji można określić stałą lub kolumnę ustawioną jako drugi argument.

Usługa Azure Machine Learning obsługuje następujące funkcje w kategorii Podstawowa :

Abs

Zwraca wartość bezwzględną wybranych kolumn.

Atan2

Zwraca odwrotną tangens cztery ćwiartki.

Wybierz kolumny zawierające współrzędne punktu. Dla drugiego argumentu, który odpowiada współrzędnej x, można również określić stałą.

Odpowiada funkcji ATAN2 w narzędziu MATLAB.

Conj

Zwraca sprzężenie wartości w wybranej kolumnie.

CubeRoot

Oblicza katalog główny modułu dla wartości w wybranej kolumnie.

DoubleFactorial

Oblicza podwójny współczynnik wartości w wybranej kolumnie. Dwuskładnikowy jest rozszerzeniem normalnej funkcji czynnikowej i jest oznaczona jako x!!.

Eps

Zwraca rozmiar luki między bieżącą wartością a następną największą, podwójną dokładnością. Odpowiada funkcji EPS w programie MATLAB.

Exp

Zwraca wartość e podniesioną do potęgi wartości w wybranej kolumnie. Ta funkcja jest taka sama jak funkcja EXP programu Excel.

Exp2

Zwraca wykładnik base-2 argumentów, rozwiązując wartość y = x * 2t , gdzie t jest kolumną wartości zawierających wykładniki.

W obszarze Zestaw kolumn wybierz kolumnę zawierającą wartości wykładnicze t.

W polu Exp2 można określić drugi argument x, który może być stałą lub inną kolumną wartości. W polu Drugi typ argumentu wskaż, czy podasz mnożnik x jako stałą, czy wartość w kolumnie.

Jeśli na przykład wybierzesz kolumnę z wartościami {0,1,2,3,4,5} mnożnika i wykładnika, funkcja zwróci wartość {0, 2, 8, 24, 64 160).

ExpMinus1

Zwraca wykładnik ujemny dla wartości w wybranej kolumnie.

Silnia

Zwraca współczynnik wartości w wybranej kolumnie.

Hipotenuza

Oblicza hipotezę trójkąta, w którym długość jednej strony jest określona jako kolumna wartości, a długość drugiej strony jest określana jako stała lub dwie kolumny.

Logarytm naturalny

Zwraca logarytm naturalny dla wartości w wybranej kolumnie.

LnPlus1

Zwraca logarytm naturalny plus jeden dla wartości w wybranej kolumnie.

Dziennik

Zwraca dziennik wartości w wybranej kolumnie, biorąc pod uwagę określoną bazę.

Możesz określić bazę (drugi argument) jako stałą lub wybierając inną kolumnę wartości.

Log10

Zwraca podstawowe wartości 10-logarytmowe dla wybranej kolumny.

Dziennik2

Zwraca podstawowe wartości 2-logarytmowe dla wybranej kolumny.

NthRoot

Zwraca n-ty element główny wartości przy użyciu n, który został określony.

Wybierz kolumny, dla których chcesz obliczyć katalog główny przy użyciu opcji ColumnSet .

W polu Drugi typ argumentu wybierz inną kolumnę zawierającą katalog główny lub określ stałą, która ma być używana jako główny.

Jeśli drugi argument jest kolumną, każda wartość w kolumnie jest używana jako wartość n dla odpowiedniego wiersza. Jeśli drugi argument jest stałą, wpisz wartość n w polu tekstowym Drugi argument .

Pow

Oblicza wartość X podniesioną do potęgi Y dla każdej z wartości w wybranej kolumnie.

Najpierw wybierz kolumny zawierające bazę, która powinna być zmienną, przy użyciu opcji ColumnSet .

W polu Drugi typ argumentu wybierz kolumnę zawierającą wykładnik lub określ stałą, która ma być używana jako wykładnik.

Jeśli drugi argument jest kolumną, każda wartość w kolumnie jest używana jako wykładnik odpowiedniego wiersza. Jeśli drugi argument jest stałą, wpisz wartość wykładnika w polu tekstowym Drugi argument .

Sqrt

Zwraca pierwiastek kwadratowy wartości w wybranej kolumnie.

SqrtPi

Dla każdej wartości w wybranej kolumnie mnoży wartość pi, a następnie zwraca pierwiastek kwadratowy wyniku.

Square

Kwadraty wartości w wybranej kolumnie.

Operacje porównania

Użyj funkcji porównania w projektancie usługi Azure Machine Learning w dowolnym momencie, aby przetestować dwa zestawy wartości ze sobą. Na przykład w potoku może być konieczne wykonanie następujących operacji porównania:

  • Oceń kolumnę wyników prawdopodobieństwa model pod kątem wartości progowej.
  • Ustal, czy dwa zestawy wyników są takie same. Dla każdego wiersza, który jest inny, dodaj flagę FALSE, która może być używana do dalszego przetwarzania lub filtrowania.

EqualTo

Zwraca wartość True, jeśli wartości są takie same.

GreaterThan

Zwraca wartość True, jeśli wartości w zestawie kolumn są większe niż określona stała lub większa niż odpowiednie wartości w kolumnie porównania.

GreaterThanOrEqualTo

Zwraca wartość True, jeśli wartości w zestawie kolumn są większe lub równe określonej stałej lub większe niż lub równe odpowiadających im wartości w kolumnie porównania.

LessThan

Zwraca wartość True, jeśli wartości w zestawie kolumn są mniejsze niż określona stała lub mniejsza niż odpowiadające im wartości w kolumnie porównania.

LessThanOrEqualTo

Zwraca wartość True, jeśli wartości w zestawie kolumn są mniejsze lub równe określonej stałej lub mniejsze niż lub równe odpowiadających wartościom w kolumnie porównania.

NotEqualTo

Zwraca wartość True, jeśli wartości w zestawie kolumn nie są równe stałej lub kolumnie porównania, i zwraca wartość False, jeśli są równe.

PairMax

Zwraca wartość większą — wartość w polu Kolumna ustawiona lub wartość w kolumnie stałej lub porównania.

PairMin

Zwraca wartość mniejszą — wartość w polu Kolumna ustawiona lub wartość w kolumnie stałej lub porównania

Operacje arytmetyczne

Obejmuje podstawowe operacje arytmetyczne: dodawanie i odejmowanie, dzielenie i mnożenie. Ponieważ większość operacji jest binarnych, wymagając dwóch liczb, należy najpierw wybrać operację, a następnie wybrać kolumnę lub liczby do użycia w pierwszych i drugich argumentach.

Kolejność dzielenia i odejmowania jest następująca:

  • Odejmowanie(Arg1_Arg2) = Arg1 — Arg 2
  • Divide(Arg1_Arg2) = Arg1 / Arg 2

W poniższej tabeli przedstawiono kilka przykładów

Operacja Liczba1 Liczba2 Kolumna wyników Wartość wyniku
Znak dodawania 1 5 Add(Num2_Num1) 6
Znak mnożenia 1 5 Wiele (Num2_Num1) 5
Odejmowanie 5 1 Odejmowanie(Num2_Num1) 4
Odejmowanie 0 1 Odejmowanie(Num2_Num1) -1
Dział 5 1 Divide(Num2_Num1) 5
Dział 1 0 Divide(Num2_Num1) Nieskończoność

Dodaj

Określ kolumny źródłowe przy użyciu zestawu kolumn, a następnie dodaj do tych wartości liczbę określoną w drugim argumencie.

Aby dodać wartości w dwóch kolumnach, wybierz kolumnę lub kolumny przy użyciu zestawu kolumn, a następnie wybierz drugą kolumnę przy użyciu drugiego argumentu.

Dzielenie

Dzieli wartości w kolumnie ustawionej przez stałą lub według wartości kolumn zdefiniowanych w drugim argumencie. Innymi słowy, najpierw wybierasz dzielnika, a następnie dywidendę. Wartość wyjściowa jest ilorazem.

Mnożenie

Mnoży wartości w kolumnie ustawionej przez określoną stałą lub wartości kolumny.

Odejmowanie

Określ kolumnę wartości do działania ( minuend), wybierając inną kolumnę przy użyciu opcji Zestaw kolumn . Następnie określ liczbę do odejmowania ( odejmowanego) przy użyciu listy rozwijanej Drugi argument . Możesz wybrać stałą lub kolumnę wartości.

Operacje zaokrąglania

Projektant usługi Azure Machine Learning obsługuje różne operacje zaokrąglania. W przypadku wielu operacji należy określić ilość dokładności do użycia podczas zaokrąglania. Możesz użyć statycznego poziomu dokładności określonego jako stała lub zastosować dynamiczną wartość precyzji uzyskaną z kolumny wartości.

  • Jeśli używasz stałej, ustaw wartość Typ dokładności na Stałą , a następnie wpisz liczbę cyfr jako liczbę całkowitą w polu tekstowym Stała precyzja . Jeśli wpiszesz wartość nieintegrową, składnik nie zgłasza błędu, ale wyniki mogą być nieoczekiwane.

  • Aby użyć innej wartości dokładności dla każdego wiersza w zestawie danych, ustaw wartość Typ dokładności na KolumnaSet, a następnie wybierz kolumnę zawierającą odpowiednie wartości dokładności.

Ceiling

Zwraca limit wartości w zestawie kolumn.

CeilingPower2

Zwraca kwadratowy sufit dla wartości w zestawie kolumn.

Floor

Zwraca podłogę dla wartości w zestawie Kolumna do określonej precyzji.

Mod

Zwraca część ułamkową wartości w zestawie kolumn na określoną precyzję.

Iloraz

Zwraca część ułamkową wartości w zestawie kolumn na określoną precyzję.

Reszta

Zwraca resztę wartości w zestawie kolumn.

RoundDigits

Zwraca wartości w zestawie kolumn zaokrąglone przez regułę 4/5 do określonej liczby cyfr.

RoundDown

Zwraca wartości w zestawie kolumn, zaokrąglone w dół do określonej liczby cyfr.

RoundUp

Zwraca wartości w zestawie kolumn, zaokrąglone w górę do określonej liczby cyfr.

ToEven

Zwraca wartości w zestawie kolumn, zaokrąglone do najbliższej liczby całkowitej, parzysłej.

ToOdd

Zwraca wartości w zestawie kolumn, zaokrąglone do najbliższej liczby całkowitej, nieparzyste.

Truncate

Obcina wartości w kolumnie ustawionej przez usunięcie wszystkich cyfr niedozwolonych przez określoną precyzję.

Specjalne funkcje matematyczne

Ta kategoria obejmuje wyspecjalizowane funkcje matematyczne często używane w nauce o danych. Jeśli nie określono inaczej, funkcja jest jednoargumentowa i zwraca określone obliczenie dla każdej wartości w wybranej kolumnie lub kolumnach.

Beta

Zwraca wartość funkcji beta Eulera.

EllipticIntegralE

Zwraca wartość niekompletnej całki wielokropkowej.

EllipticIntegralK

Zwraca wartość pełnej wielokropkowej całkowitej (K).

Erf

Zwraca wartość funkcji error.

Funkcja błędu (nazywana również funkcją błędu Gauss) jest specjalną funkcją kształtu sigmoidu, który jest używany w prawdopodobieństwie do opisywania dyfuzji.

Erfc

Zwraca wartość funkcji błędu uzupełniającego.

Erfc jest definiowany jako 1 – erf(x).

ErfScaled

Zwraca wartość funkcji błędu skalowanego.

Skalowana wersja funkcji błędu może służyć do uniknięcia podpełnienia arytmetycznego.

ErfInverse

Zwraca wartość funkcji odwrotnej erf .

ExponentialIntegralEin

Zwraca wartość całkowitej liczby wykładniczej Ei.

Gamma

Zwraca wartość funkcji gamma.

GammaLn

Zwraca logarytm naturalny funkcji gamma.

GammaRegularizedP

Zwraca wartość nieu regularyzowanej niekompletnej funkcji gamma.

Ta funkcja przyjmuje drugi argument, który można podać jako stałą lub kolumnę wartości.

GammaRegularizedPInverse

Zwraca wartość odwrotnej, nieukończonej funkcji gamma.

Ta funkcja przyjmuje drugi argument, który można podać jako stałą lub kolumnę wartości.

GammaRegularizedQ

Zwraca wartość nieu regularyzowanej niekompletnej funkcji gamma.

Ta funkcja przyjmuje drugi argument, który można podać jako stałą lub kolumnę wartości.

GammaRegularizedQInverse

Zwraca wartość odwrotnej uogólnionej, nieukończonej funkcji gamma.

Ta funkcja przyjmuje drugi argument, który można podać jako stałą lub kolumnę wartości.

PolyGamma

Zwraca wartość funkcji polygamma.

Ta funkcja przyjmuje drugi argument, który można podać jako stałą lub kolumnę wartości.

Trygonometrycznych

Ta kategoria iIncludes najważniejsze funkcje trygonometryczne i odwrotne trygonometryczne. Wszystkie funkcje trygonometryczne są jednoargumentowe i nie wymagają dodatkowych argumentów.

Acos

Oblicza arckosinus dla wartości kolumn.

AcosDegree

Oblicza arckosinus wartości kolumn w stopniach.

Acosh

Oblicza arckosinus hiperboliczny wartości kolumn.

Acot

Oblicza arckotangent wartości kolumn.

AcotDegrees

Oblicza arckotangent wartości kolumn w stopniach.

Acoth

Oblicza arckotangent hiperboliczny wartości kolumn.

Acsc

Oblicza arckosecant wartości kolumn.

AcscDegrees

Oblicza arckosecant wartości kolumn w stopniach.

Asec

Oblicza arcsecant wartości kolumn.

AsecDegrees

Oblicza arcsecant wartości kolumn w stopniach.

Asech

Oblicza arcsecant hiperboliczny wartości kolumn.

Asin

Oblicza arcus sinus wartości kolumn.

AsinDegrees

Oblicza arcus sinus wartości kolumn w stopniach.

Asinh

Oblicza arcus sinus hiperboliczny dla wartości kolumn.

Atan

Oblicza arcus tangens wartości kolumn.

AtanDegrees

Oblicza arcus tangens wartości kolumn w stopniach.

Atanh

Oblicza arcus tangens hiperboliczny wartości kolumn.

Cos

Oblicza cosinus wartości kolumn.

CosDegrees

Oblicza cosinus dla wartości kolumn w stopniach.

Cosh

Oblicza cosinus hiperboliczny dla wartości kolumn.

Cot

Oblicza cotangent dla wartości kolumn.

CotDegrees

Oblicza cotangent dla wartości kolumn w stopniach.

Coth

Oblicza cotangent hiperboliczny dla wartości kolumn.

Csc

Oblicza cosecant dla wartości kolumn.

CscDegrees

Oblicza cosecant dla wartości kolumn w stopniach.

Csch

Oblicza cosecant hiperboliczny dla wartości kolumn.

DegreesToRadians

Konwertuje stopnie na radiany.

S

Oblicza secant wartości kolumn.

aSecDegrees

Oblicza secant wartości kolumn w stopniach.

aSech

Oblicza secant hiperboliczny wartości kolumn.

Znak

Zwraca znak wartości kolumny.

Sinus

Oblicza sinus wartości kolumn.

Sinc

Oblicza sinus cosinus wartości wartości kolumny.

SinDegrees

Oblicza sinus wartości kolumn w stopniach.

Sinh

Oblicza sinus hiperboliczny wartości kolumn.

Tan

Oblicza tangens wartości kolumn.

TanDegrees

Oblicza tangens argumentu w stopniach.

Tanh

Oblicza tangens hiperboliczny wartości kolumn.

Uwagi techniczne

Podczas wybierania więcej niż jednej kolumny jako drugiego operatora należy zachować ostrożność. Wyniki są łatwe do zrozumienia, czy operacja jest prosta, na przykład dodanie stałej do wszystkich kolumn.

Załóżmy, że zestaw danych ma wiele kolumn i dodasz zestaw danych do siebie. W wynikach każda kolumna jest dodawana do siebie w następujący sposób:

Liczba1 Liczba 2 Liczba 3 Add(Num1_Num1) Add(Num2_Num2) Add(Num3_Num3)
1 5 2 2 10 4
2 3 -1 4 6 -2
0 1 -1 0 2 -2

Jeśli musisz wykonać bardziej złożone obliczenia, możesz połączyć wiele wystąpień operacji zastosuj operację matematyczną. Możesz na przykład dodać dwie kolumny przy użyciu jednego wystąpienia operacji matematycznej Zastosuj, a następnie użyć innego wystąpienia operacji zastosuj operację matematyczną, aby podzielić sumę przez stałą w celu uzyskania średniej.

Alternatywnie użyj jednego z następujących składników, aby wykonać wszystkie obliczenia jednocześnie, używając skryptu SQL, R lub Python:

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.