Använda matematisk åtgärd

Använder en matematisk åtgärd på kolumn värden

Kategori: statistiska funktioner

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra och släpp-moduler har lagts till i Azure Machine Learning designer. Läs mer i den här artikeln om att jämföra de två versionerna.

Översikt över modul

Den här artikeln beskriver hur du använder modulen Använd matematik i Azure Machine Learning Studio (klassisk) för att skapa beräkningar som tillämpas på numeriska kolumner i data uppsättningen för indata.

Matematiska åtgärder som stöds är vanliga aritmetiska funktioner som multiplikation och division, trigonometriska funktioner, en mängd olika avrundnings funktioner och särskilda funktioner som används i data vetenskap, till exempel gamma-och fel funktioner.

När du har definierat en åtgärd och kört experimentet läggs värdena till i din data uppsättning. Beroende på hur du konfigurerar modulen kan du:

  • Lägg till resultaten i din data uppsättning. Detta är särskilt användbart när du verifierar resultatet av åtgärden.
  • Ersätt kolumn värden med de nya beräknade värdena.
  • Generera en ny kolumn för resultat och Visa inte originalet-data.

Tips

Den här modulen utför en enskild matematik åtgärd i taget. För komplexa matematiska åtgärder rekommenderar vi att du använder dessa moduler i stället:

Leta efter den åtgärd du behöver i följande kategorier:

  • Basic

    Funktionerna i kategorin Basic kan användas för att ändra ett enda värde eller en kolumn med värden. Du kan till exempel få det absoluta värdet för alla tal i en kolumn eller beräkna kvadratroten för varje värde i en kolumn.

  • Jämför

    Funktionerna i kategorin Jämför används för jämförelse: du kan göra en par jämförelse av värdena i två kolumner eller jämföra varje värde i en kolumn med en viss konstant. Du kan till exempel jämföra kolumner för att avgöra om värdena var samma i två data uppsättningar. Eller så kan du använda en konstant, till exempel ett maximalt tillåtet värde, för att hitta avvikande värden i en numerisk kolumn.

  • Åtgärder

    Den här kategorin innehåller de grundläggande matematiska funktionerna: addition, subtraktion, multiplikation och division. Du kan arbeta med antingen kolumner eller konstanter. Du kan till exempel lägga till värdet i kolumn A till värdet i kolumn B. Eller så kan du subtrahera en konstant, till exempel ett tidigare beräknat medelvärde, från varje värde i kolumn A.

  • Avrundning

    Den här kategorin innehåller en mängd funktioner för att utföra åtgärder, till exempel avrundning, tak, golv och trunkering till olika precisions nivåer. Du kan ange precisions nivån för både decimal tal och heltal.

  • Särskilda matematiska funktioner

    Kategorin Special innehåller matematiska funktioner som används särskilt i data vetenskap, till exempel Elliptic integraler och funktionen Gaussisk fel.

  • Trigonometriska funktioner

    Den här kategorin innehåller alla standardformade trigonometriska funktioner. Du kan till exempel konvertera radianer till grader eller beräkna funktioner som tangens i antingen radianer eller grader. Dessa funktioner är unära, vilket innebär att de tar en enda kolumn med värden som indatatyper, använder den trigonometriska funktionen och returnerar en kolumn med värden som resultatet. Därför måste du kontrol lera att kolumnen indatamängd är av lämplig typ och innehåller rätt typ av värden för den angivna åtgärden.

Exempel

Exempel på hur du använder Använd matematik-åtgärd finns i följande exempel experiment i Azure AI Gallery:

  • Färg kvantifieringsfel: en uppsättning kolumn värden subtraheras från en annan och sedan visas resultatet i kvadrat.

  • Kund Relations förutsägelse: konstant 1 läggs till i alla värden i en kolumn för att skilja mellan noll och saknade värden.

  • Avläsning av flyg fördröjning: visar olika åtgärder, inklusive avrundning och division.

  • Direkt marknadsföring: använder jämförelse åtgärder för att avgöra om sannolikhets poängen uppfyller ett värde som krävs.

Använda tillämpa matematik åtgärd

Använd modulen för matematik körning kräver en data uppsättning som innehåller minst en kolumn som endast innehåller siffror. Talen kan vara diskreta eller kontinuerliga men måste vara av en numerisk datatyp, inte en sträng.

Du kan tillämpa samma åtgärd på flera numeriska kolumner, men alla kolumner måste finnas i samma data uppsättning.

Varje instans av den här modulen kan bara utföra en typ av åtgärd i taget. Om du vill utföra komplexa matematiska åtgärder kan du behöva kedja samman flera instanser av modulen Använd matematik .

  1. Lägg till modulen Använd matematik i experimentet. Du hittar den här modulen i kategorin statistiska funktioner .

  2. Anslut en data uppsättning som innehåller minst en numerisk kolumn.

  3. Klicka på kategori för att välja vilken typ av matematik åtgärd som ska utföras.

    Om du till exempel vill utföra grundläggande aritmetiska kolumner väljer du åtgärder. Om du vill få en logaritm eller ett tak väljer du Basic. Använd jämförelse för att jämföra kolumner med värden.

    Tips

    Alla andra alternativ ändras beroende på vilken typ av matematisk åtgärd du väljer. Dessutom återställer alla andra alternativ ändringar i kategorin. Se därför till att välja från kategori först!

  4. Välj en viss åtgärd i listan i den kategorin.

  5. Välj en eller flera käll kolumner som beräkningen ska utföras på.

    • Alla kolumner som du väljer måste vara en numerisk datatyp.
    • Data området måste vara giltigt för den valda matematiska åtgärden. Annars kan ett fel eller NaN (inte ett tal) uppstå. Till exempel är ln (-1,0) en ogiltig åtgärd och resulterar i värdet NaN .
  6. Ange ytterligare parametrar som krävs av varje typ av åtgärd.

  7. Använd alternativet output mode för att ange hur du vill att matematik åtgärden ska genereras:

    • Lägg till. Alla kolumner som används som indata ingår i data uppsättningen för utdata, plus ytterligare en kolumn som innehåller resultatet av matematik åtgärden.
    • Inplats. Värdena i de kolumner som används som indata ersätts med de nya beräknade värdena.
    • ResultOnly. En enskild kolumn returneras som innehåller resultatet av matematik åtgärden.
  8. Kör experimentet eller högerklicka bara på modulen Använd matematik och välj Kör valda.

Resultat

Om du genererar resultaten med hjälp av tilläggs -eller ResultOnly -alternativen anger kolumn rubrikerna för den returnerade data uppsättningen den åtgärd och de kolumner som användes. Om du till exempel jämför två kolumner med operatorn Equals ser resultatet ut så här:

  • Lika med (Col2_Col1), som anger att du har testat Col2 mot Col1.
  • Lika med (Col2_ $10), vilket anger att du jämförde kolumn 2 med konstant 10.

Även om du använder alternativet InPlace , tas inte källdata bort eller ändras. kolumnen i den ursprungliga data uppsättningen är fortfarande tillgänglig i Studio (klassisk). Om du vill visa ursprungliga data kan du ansluta modulen Lägg till kolumner och koppla den till utdata från Använd matematik-åtgärd.

Grundläggande matematik åtgärder

Funktionerna i kategorin Basic tar vanligt vis ett enda värde från en kolumn, utför den fördefinierade åtgärden och returnerar ett enda värde. För vissa funktioner kan du ange en konstant som ett andra argument.

Azure Machine Learning stöder följande funktioner i kategorin Basic :

Abs

Returnerar det absoluta värdet för de markerade kolumnerna.

Atan2

Returnerar en omvänd tangens för fyra kvadranter.

Markera de kolumner som innehåller punkt koordinaterna. För det andra argumentet, som motsvarar x-koordinaten, kan du också ange en konstant.

Motsvarar funktionen ATAN2 i MATLAB.

Conj

Returnerar konjugatet för värdena i den markerade kolumnen.

CubeRoot

Beräknar kubens rot för värdena i den markerade kolumnen.

DoubleFactorial**

Beräknar den dubbla fakulteten för värden i den markerade kolumnen. Dubbel fakulteten är en utökning av funktionen normal fakultet och anges som x!!.

Per

Returnerar storleken på mellanrummet mellan det aktuella värdet och det näst högsta, dubbla precisions numret. Motsvarar EPS-funktionen i MATLAB.

Exp

Returnerar e upphöjt till kraften i värdet i den markerade kolumnen. Detta är samma som funktionen för EXP-funktionen i Excel.

Exp2

Returnerar bas 2 upphöjt till argumenten, lösning för y = x * 2t där t är en kolumn med värden som innehåller exponenter.

För Exp2 kan du ange ett andra argument x, som kan vara antingen en konstant eller en annan kolumn med värden

I den andra argument typen anger du om du vill ange multiplikatorn t som en konstant eller ett värde i en kolumn.

Du kan välja en enskild kolumn med exponent värden eller ange exponent svärdet i text rutan för det andra argumentet . I kolumn uppsättning väljer du sedan den kolumn som innehåller exponent värden.

Om du till exempel väljer en kolumn med värdena {0,1,2,3,4,5} för både multiplikatorn och exponenten returnerar funktionen {0, 2, 8, 24, 64 160).

ExpMinus1

Returnerar den negativa exponenten för värden i den markerade kolumnen.

Fakultet

Returnerar fakulteten för värdena i den markerade kolumnen.

Hypotenuse

Beräknar Hypotenuse för en triangel där längden på en sida har angetts som en kolumn med värden, och längden på den andra sidan anges antingen som en konstant eller som två kolumner.

ImaginaryPart

Returnerar den imaginära delen av värdena i den markerade kolumnen.

Ln

Returnerar den naturliga logaritmen för värdena i den markerade kolumnen.

LnPlus1

Returnerar den naturliga logaritmen plus en för värdena i den markerade kolumnen.

Loggas

Returnerar loggen för värdena i den markerade kolumnen, med angiven bas.

Du kan ange basen (det andra argumentet) antingen som en konstant eller genom att välja en annan kolumn med värden.

Log10

Returnerar 10-logaritmens värden i den markerade kolumnen.

Log2

Returnerar basen 2 logaritmen för värdena i den markerade kolumnen.

NthRoot

Returnerar den n:te roten av värdet med en n som du anger.

Välj de kolumner som du vill beräkna roten för, genom att använda alternativet ColumnSet .

I den andra argument typen väljer du en annan kolumn som innehåller roten eller anger en konstant som ska användas som rot.

Om det andra argumentet är en kolumn används varje värde i kolumnen som värdet n för motsvarande rad. Om det andra argumentet är en konstant skriver du värdet för n i text rutan för det andra argumentet .

POW

Beräknar X upphöjt till Y för varje värde i den markerade kolumnen.

Först väljer du de kolumner som innehåller basen, som ska vara ett flyttal, med alternativet ColumnSet .

I den andra argument typen väljer du den kolumn som innehåller exponenten eller anger en konstant som ska användas som exponent.

Om det andra argumentet är en kolumn, används varje värde i kolumnen som exponent för motsvarande rad. Om det andra argumentet är en konstant, anger du värdet för exponenten i text rutan för det andra argumentet .

RealPart

Returnerar den verkliga delen av värdena i den markerade kolumnen.

Sqrt

Returnerar kvadratroten ur värdena i den markerade kolumnen.

SqrtPi

För varje värde i den markerade kolumnen multipliceras värdet med Pi och Returnerar kvadratroten ur resultatet.

Square

Kvadraterar värdena i den markerade kolumnen.

Jämförelse åtgärder

Använd jämförelse funktionerna i Azure Machine Learning Studio (klassisk) när som helst när du behöver testa två uppsättningar värden mot varandra. I ett experiment kan du till exempel behöva utföra dessa jämförelse åtgärder:

  • Utvärdera en kolumn med sannolikhets Poäng modell mot ett tröskelvärde.
  • Kontrol lera om två resultat uppsättningar är desamma, och för varje rad som skiljer sig, lägger du till en falsk flagga som kan användas för vidare bearbetning eller filtrering.

EqualTo

Returnerar true om värdena är identiska.

GreaterThan

Returnerar true om värdena i kolumn uppsättningen är större än den angivna konstanten, eller större än motsvarande värden i jämförelse kolumnen.

GreaterThanOrEqualTo

Returnerar true om värdena i kolumn uppsättningen är större än eller lika med den angivna konstanten, eller större än eller lika med motsvarande värden i jämförelse kolumnen.

LessThan

Returnerar true om värdena i kolumn uppsättningen är mindre än den angivna konstanten, eller färre än motsvarande värden i jämförelse kolumnen.

LessThanOrEqualTo

Returnerar true om värdena i kolumn uppsättningen är mindre än eller lika med den angivna konstanten, eller mindre än eller lika med motsvarande värden i jämförelse kolumnen.

NotEqualTo

Returnerar true om värdena i kolumn uppsättningen inte är lika med konstanten eller jämförelse kolumnen och returnerar FALSE om de är lika.

PairMax

Returnerar värdet som är större – värdet i kolumn uppsättningen eller värdet i kolumnen konstant eller jämförelse.

PairMin

Returnerar värdet som är mindre – värdet i kolumn uppsättningen eller värdet i kolumnen konstant eller jämförelse

Aritmetiska åtgärder

Innehåller de grundläggande aritmetiska åtgärderna: addition och subtraktion, Division och multiplikation. Eftersom de flesta åtgärder är binära och kräver två siffror väljer du först åtgärden och väljer sedan den kolumn eller de tal som ska användas i de första och andra argumenten.

Ordningen i vilken du väljer kolumner för Division och subtraktion kan verka counterintuitive; men för att göra det lättare att förstå resultaten, innehåller kolumn rubriken åtgärds namnet och i vilken ordning kolumnerna användes.

Åtgärd Num1 Num2 Resultat kolumn Resultat värde
Addition 1 5 Lägg till (Num2_Num1) 4
Multiplikation 1 5 Flera (Num2_Num1) 5
Subtraktion 1 5 Subtrahera (Num2_Num1) 4
Subtraktion 0 1 Subtrahera (Num2_Num1) 0
Division 1 5 Dividera (Num2_Num1) 5
Division 0 1 Dividera (Num2_Num1) Infinity

Lägg till

Ange käll kolumnerna med hjälp av kolumn uppsättning och Lägg sedan till dessa värden ett tal som anges i argumentet konstant åtgärd.

Om du vill lägga till värden i två kolumner väljer du en kolumn eller kolumner med kolumn uppsättning och väljer sedan en andra kolumn med Åtgärds argumentet.

Dividera

Dividerar värdena i en kolumn uppsättning med en konstant eller av kolumnvärdena som definierats i Åtgärds argumentet. Med andra ord väljer du först divisorn och sedan utdelning. Värdet output är kvoten.

Multiplicera

Multiplicerar värdena i kolumn uppsättningen med de angivna konstant-eller kolumn värden.

Subtrahera

Ange det tal som ska subtraheras ( SUBTRAHEND) med hjälp av instruktions argumentet List Rute lista. Du kan välja antingen en konstant eller en kolumn med värden. Ange sedan kolumnen med värden som ska användas ( MINUEND) genom att välja en annan kolumn med hjälp av det andra kolumn uppsättnings alternativet.

Du kan subtrahera en konstant från varje värde i en kolumn med värden, men inte den motsatta åtgärden. Använd addition i stället.

Avrundnings åtgärder

Studio (klassisk) stöder olika avrundnings åtgärder. För många åtgärder måste du ange hur mycket precision som ska användas vid avrundning. Du kan antingen använda en statisk precisions nivå, anges som en konstant, eller så kan du använda ett dynamiskt precisions värde som hämtats från en kolumn med värden.

  • Om du använder en konstant anger du precisions typen konstant och skriver sedan antalet siffror som ett heltal i text rutan konstant precision . Om du anger ett icke-heltal, genererar modulen inget fel, men det kan vara oväntade resultat.

  • Om du vill använda ett annat precisions värde för varje rad i data uppsättningen anger du precisions typen till ColumnSet och väljer sedan den kolumn som innehåller lämpliga precisions värden.

Ceiling

Returnerar taket för värdena i kolumn uppsättningen.

CeilingPower2

Returnerar taket i fyrkant för värdena i kolumn uppsättningen.

Floor

Returnerar golvet för värdena i kolumn uppsättningen till den angivna precisionen.

Mod

Returnerar decimal delen av värdena i kolumn uppsättningen till den angivna precisionen.

Kvot

Returnerar decimal delen av värdena i kolumn uppsättningen till den angivna precisionen.

Rest

Returnerar resten av värdena i kolumn uppsättningen.

RoundDigits

Returnerar värdena i kolumn uppsättningen, avrundade av regeln 4/5 till det angivna antalet siffror.

RoundDown

Returnerar värdena i kolumn uppsättningen, avrundade nedåt till det angivna antalet siffror.

RoundUp

Returnerar värdena i kolumn uppsättningen, avrundade uppåt till det angivna antalet siffror.

ToEven

Returnerar värdena i kolumn uppsättningen, avrundat till närmaste heltal, jämna tal.

ToOdd

Returnerar värdena i kolumn uppsättningen, avrundade till närmaste hela, udda tal.

Truncate

Trunkerar värdena i kolumn uppsättningen genom att ta bort alla siffror som inte tillåts av den angivna precisionen.

Särskilda matematiska funktioner

Den här kategorin innehåller specialiserade matematiska funktioner som ofta används i data vetenskap. Om inget annat anges är funktionen enställig och returnerar den angivna beräkningen för varje värde i den markerade kolumnen eller kolumnerna.

Beta

Returnerar värdet för Eulers beta funktion.

EllipticIntegralE

Returnerar värdet för den ofullständiga Elliptic-integralen.

EllipticIntegralK

Returnerar värdet för den fullständiga Elliptic-integralen (K).

FELF

Returnerar värdet för fel funktionen.

Fel funktionen (som även kallas Gauss-felfunktionen) är en särskild funktion i sigmoid-formen som används i sannolikheten för att beskriva diffusionen.

Erfc

Returnerar värdet för funktionen kompletterande fel.

ERFC definieras som 1 – FELF (x).

ErfScaled

Returnerar värdet för funktionen scaleed error.

Den skalade versionen av error-funktionen kan användas för att undvika aritmetiskt underskott.

ErfInverse

Returnerar värdet för den inverterade FELF-funktionen.

ExponentialIntegralEin

Returnerar värdet för den exponentiella integral-ei.

Gamma

Returnerar värdet för gamma funktionen.

Gammal

Returnerar den naturliga logaritmen för gamma funktionen.

GammaRegularizedP

Returnerar värdet för den vanliga ofullständiga gamma funktionen.

Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.

GammaRegularizedPInverse

Returnerar värdet för den inverterade reguljära gamma funktionen.

Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.

GammaRegularizedQ

Returnerar värdet för den vanliga ofullständiga gamma funktionen.

Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.

GammaRegularizedQInverse

Returnerar värdet för den inverterade generaliserade, normala gamma funktionen.

Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.

Polygamma

Returnerar värdet för polygamma-funktionen.

Den här funktionen tar ett andra argument, som kan anges antingen som en konstant eller en kolumn med värden.

Trigonometriska funktioner

Den här kategorin iIncludes de flesta av de viktiga trigonometriska och inversna trigonometriska funktionerna. Alla trigonometriska funktioner är unära och kräver inga ytterligare argument.

Acos

Beräknar arcus cosinus för kolumnvärdena.

AcosDegree

Beräknar arcus cosinus för kolumnvärdena i grader.

Acosh

Beräknar hyperboliskt arcus cosinus för kolumn värden.

Acot

Beräknar cotangens för kolumn värden.

AcotDegrees

Beräknar cotangens för kolumnvärdena i grader.

Acoth

Beräknar de hyperboliska cotangens för kolumn värden.

ACSC

Beräknar arccosecant för kolumn värden.

AcscDegrees

Beräknar arccosecant för kolumnvärdena i grader.

Asec

Beräknar arcsecant för kolumn värden.

AsecDegrees

Beräknar arcsecant för kolumnvärdena i grader.

Asech

Beräknar de hyperboliska arcsecant för kolumn värden.

Asin

Beräknar arcus sinus för kolumn värden.

AsinDegrees

Beräknar arcus sinus för kolumnvärdena i grader.

Asinh

Beräknar hyperbolisk arcus sinus för kolumnvärdena.

Atan

Beräknar arcus tangens för kolumnvärdena.

AtanDegrees

Beräknar arcus tangens för kolumnvärdena i grader.

Atanh

Beräknar kolumn värdets hyperboliska arcus tangens.

CIS

Returnerar en komplex värdes funktion som har gjorts från sinus och cosinus med definitionen CIS-θ = cos θ + ISIN θ.

Cos

Beräknar cosinus för kolumn värden.

CosDegrees

Beräknar cosinus för kolumnvärdena i grader.

Cosh

Beräknar hyperbolisk cosinus för kolumnvärdena.

Cot

Beräknar cotangens för kolumnvärdena.

CotDegrees

Beräknar cotangens för kolumnvärdena i grader.

Coth

Beräknar hyperbolisk cotangens för kolumn värden.

CSC

Beräknar cosekant för kolumnvärdena.

CscDegrees

Beräknar cosekant för kolumnvärdena i grader.

Csch

Beräknar hyperbolisk cosekant för kolumnvärdena.

DegreesToRadians

Konverterar grader till radianer.

SEC

Beräknar sekant för kolumn värden.

aSecDegrees

Beräknar sekant för kolumnvärdena i grader.

aSech

Beräknar hyperbolisk sekant för kolumn värden.

Tecken

Returnerar tecknet för kolumn värden.

Sin

Beräknar sinus för kolumn värden.

Sinc

Beräknar sinus-cosinus-värdet för kolumn värden.

SinDegrees

Beräknar sinus för kolumnvärdena i grader.

Sinh

Beräknar kolumn värdets hyperboliska sinus.

Tan

Beräknar tangens för kolumnvärdena.

TanDegrees

Beräknar tangens för argumentet i grader.

Tanh

Beräknar kolumn värdens hyperboliska tangens.

Tekniska anteckningar

Det här avsnittet innehåller implementerings information, tips och svar på vanliga frågor.

Åtgärder på flera kolumner

Var försiktig när du väljer mer än en kolumn som den andra operatorn. Resultaten är lätta att förstå om åtgärden är enkel, till exempel att lägga till en konstant i alla kolumner.

Anta att din data uppsättning har flera kolumner och att du lägger till data uppsättningen till sig själv. I resultaten läggs varje kolumn till i sig själv enligt följande:

Num1 Num2 Num3 Lägg till (Num1_Num1) Lägg till (Num2_Num2) Lägg till (Num3_Num3)
1 5 2 2 10 4
2 3 -1 4 6 -2
0 1 -1 0 2 -2

Om du behöver utföra mer komplexa beräkningar kan du kedja flera instanser av Använd matematik-åtgärd. Du kan till exempel lägga till två kolumner genom att använda en instans av Använd matematik-åtgärd och sedan använda en annan instans av Använd matematik-åtgärd för att dividera summan med en konstant för att få medelvärdet.

Du kan också använda en av följande moduler för att utföra alla beräkningar samtidigt, med SQL, R eller Python-skript:

Unära och binära funktioner

I en unär åtgärd skapar du beräkningar baserat på kolumn värden utan att referera till andra kolumner eller konstanter.

Du kan till exempel trunkera kolumnens värden till en viss precisions grad, avrunda värden uppåt eller nedåt, eller hitta tak-eller golv värden.

Ett exempel på en unär åtgärd är Abs(X) , där X är den kolumn som anges som indata.

I en binär åtgärd anger du två uppsättningar med värden. Det första argumentet måste alltid vara en kolumn eller kolumn uppsättning, medan det andra argumentet kan vara ett tal som du anger som en konstant eller en annan kolumn.

Ett exempel på en binär åtgärd som använder två kolumner är Subtract(X,Y) , där X är den första kolumnen som du väljer och Y är den andra kolumnen.

Ett exempel på att använda en binär åtgärd som kombinerar en kolumn och en konstant kan vara Subtract(X,mean) , där du skriver in kolumnens medelvärde som en konstant och subtraherar den från varje värde i kolumn X.

Hantering av tal i kategoriska-kolumner

Stöd för kategoriska-värden som visas som siffror beror på funktionen och hur många argument funktionen tar.

  • Om åtgärden innehåller tal som har angetts som kategoriska-kolumner kan en unär åtgärd tillämpas på kategoriska-datavärden.

  • Om en unär åtgärd används för en kategoriska-kolumn kan kategoriska-datavärdena för kolumnen transformeras till samma associerade kategoriska-datavärden i kolumnen utdata. I det här fallet slås värdena samman, så att antalet kategoriska-datavärden i utdata alltid är mindre än antalet värden i indata.

  • Om en binär åtgärd tillämpas på en kategoriska kolumn och någon annan kolumn, är det förväntade beteendet följande:

    • Om den andra kolumnen är tätare är kolumnen utdata kategoriska.

      Kategoriska data värden som visas i indata går förlorade.

      Kolumnen utdata innehåller bara de värden som finns i data för kolumnen utdata.

    • Om den andra kolumnen är sparse är kolumnen utdata sparse.

    • Om båda argumenten för en binär åtgärd är null-optimerade kolumner, innehåller den resulterande kolumnen bakgrunds nollor i alla lägen där båda kolumnerna innehåller bakgrunds nollor.

Bearbetning av null-optimerade kolumner

I unära åtgärder lämnas alla element i null-optimerade kolumner som motsvarar bakgrunds nollor i bakgrunden obearbetade.

I binära åtgärder, om ett argument är en null-optimerad kolumn och det andra argumentet är en kompakt kolumn, är den resulterande kolumnen sparse med alla bakgrunds nollor som sprids från indatamängdar från den sparse-kolumnen.

Förväntade indata

Namn Typ Description
Datamängd Data tabell Indata-datauppsättning

Utdata

Namn Typ Description
Resultat data uppsättning Data tabell Resultat data uppsättning

Se även

Statistiska funktioner
En-ö-modul lista