Condividi tramite


Applicare operazioni matematiche

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Applica un'operazione matematica a valori di colonna

Categoria: Funzioni statistiche

Nota

Si applica a: Machine Learning Studio (versione classica)

Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.

Panoramica del modulo

Questo articolo descrive come usare il modulo Applica operazione matematica in Machine Learning Studio (versione classica) per creare calcoli applicati alle colonne numeriche nel set di dati di input.

Le operazioni matematiche supportate includono funzioni aritmetiche comuni, ad esempio moltiplicazione e divisione, funzioni trigonometriche, un'ampia gamma di funzioni di arrotondamento e funzioni speciali usate in data science come le funzioni gamma ed error.

Dopo aver definito un'operazione ed eseguito l'esperimento, i valori vengono aggiunti al set di dati. A seconda della modalità di configurazione del modulo, è possibile:

  • Aggiungere i risultati al set di dati. Ciò è particolarmente utile quando si verifica il risultato dell'operazione.
  • Sostituire i valori delle colonne con i nuovi valori calcolati.
  • Generare una nuova colonna per i risultati e non visualizzare i dati originali.

Suggerimento

Questo modulo esegue una singola operazione matematica alla volta. Per operazioni matematiche complesse, è consigliabile usare questi moduli:

Cercare l'operazione necessaria nelle categorie seguenti:

  • Base

    Le funzioni nella categoria Basic possono essere usate per modificare un singolo valore o colonna di valori. Ad esempio, è possibile ottenere il valore assoluto di tutti i numeri in una colonna o calcolare la radice quadrata di ogni valore in una colonna.

  • Confronta

    Le funzioni nella categoria Confronta vengono tutte usate per il confronto: è possibile eseguire un confronto a coppie tra i valori in due colonne oppure è possibile confrontare ogni valore in una colonna con una costante specificata. Ad esempio, è possibile confrontare le colonne per determinare se i valori sono uguali in due set di dati. In caso contrario, è possibile usare una costante, ad esempio un valore massimo consentito, per trovare gli outlier in una colonna numerica.

  • Operazioni

    Questa categoria include le funzioni matematiche di base: addizione, sottrazione, moltiplicazione e divisione. È possibile usare colonne o costanti. Ad esempio, è possibile aggiungere il valore nella colonna A al valore nella colonna B. In caso contrario, è possibile sottrarre una costante, ad esempio una media calcolata in precedenza, da ogni valore nella colonna A.

  • Rounding

    Questa categoria include un'ampia gamma di funzioni per l'esecuzione di operazioni quali arrotondamento, controsoffitto, piano e troncamento a vari livelli di precisione. È possibile specificare il livello di precisione sia per i numeri decimali che per i numeri interi.

  • Funzioni matematiche speciali

    La categoria Special include funzioni matematiche particolarmente usate in data science, ad esempio gli integrali ellittici e la funzione di errore gaussiana.

  • Funzioni trigonometriche

    Questa categoria include tutte le funzioni trigonometriche standard. Ad esempio, è possibile convertire i radianti in gradi o funzioni di calcolo come tangente in radianti o gradi. Queste funzioni sono unarie, ovvero accettano una singola colonna di valori come input, applicano la funzione trigonometrica e restituiscono una colonna di valori come risultato. È quindi necessario assicurarsi che la colonna di input sia del tipo appropriato e contenga il tipo corretto di valori per l'operazione specificata.

Esempio

Per esempi su come usare Applica operazione matematica, vedere questi esperimenti di esempio nel Azure AI Gallery:

  • Quantizzazione dei colori: un set di valori di colonna viene sottratto da un altro e quindi i risultati vengono quadrati.

  • Stima della relazione tra clienti: la costante 1 viene aggiunta a tutti i valori di una colonna per distinguere tra zeri e valori mancanti.

  • Stima del ritardo dei voli: illustra varie operazioni, tra cui arrotondamento e divisione.

  • Marketing diretto: usa le operazioni di confronto per determinare se i punteggi di probabilità soddisfano un valore obbligatorio.

Come usare Apply Math Operation

Il modulo Applica operazione matematica richiede un set di dati che contiene almeno una colonna contenente solo numeri. I numeri possono essere discreti o continui, ma devono essere di tipo numerico, non di stringa.

È possibile applicare la stessa operazione a più colonne numeriche, ma tutte le colonne devono essere nello stesso set di dati.

Ogni istanza di questo modulo può eseguire un solo tipo di operazione alla volta. Per eseguire operazioni matematiche complesse, potrebbe essere necessario concatenare diverse istanze del modulo Applica operazione matematica .

  1. Aggiungere il modulo Applica operazione matematica all'esperimento. È possibile trovare questo modulo nella categoria Funzioni statistiche .

  2. Connessione un set di dati che contiene almeno una colonna numerica.

  3. Fare clic su Categoria per selezionare il tipo di operazione matematica da eseguire.

    Ad esempio, per eseguire operazioni aritmetiche di base sulle colonne, scegliere Operazioni. Per ottenere un logaritmo o un controsoffitto, scegliere Basic. Per confrontare colonne di valori, usare Confronto.

    Suggerimento

    Tutte le altre opzioni cambiano a seconda del tipo di operazione matematica scelta. Inoltre, qualsiasi modifica apportata alla categoria reimposta tutte le altre opzioni. Assicurarsi quindi di selezionare prima Categoria .

  4. Scegliere un'operazione specifica dall'elenco in tale categoria.

  5. Selezionare una o più colonne di origine in cui eseguire il calcolo.

    • Qualsiasi colonna scelta deve essere un tipo di dati numerico.
    • L'intervallo di dati deve essere valido per l'operazione matematica selezionata. In caso contrario, può verificarsi un errore o un risultato NaN (non un numero). Ad esempio, Ln(-1.0) è un'operazione non valida e ha come risultato il valore NaN.
  6. Impostare parametri aggiuntivi richiesti da ogni tipo di operazione.

  7. Usare l'opzione Modalità di output per indicare come generare l'operazione matematica:

    • Append. Tutte le colonne usate come input vengono incluse nel set di dati di output, oltre a una colonna aggiuntiva che contiene i risultati dell'operazione matematica.
    • In luogo. I valori nelle colonne usate come input vengono sostituiti con i nuovi valori calcolati.
    • ResultOnly. Viene restituita una singola colonna contenente i risultati dell'operazione matematica.
  8. Eseguire l'esperimento oppure fare clic con il pulsante destro del mouse sul modulo Applica operazione matematica e scegliere Esegui selezionato.

Risultati

Se si generano i risultati usando le opzioni Append o ResultOnly , le intestazioni di colonna del set di dati restituito indicano l'operazione e le colonne usate. Ad esempio, se si confrontano due colonne usando l'operatore Equals , i risultati sono simili ai seguenti:

  • Equals(Col2_Col1), che indica che è stato testato Col2 rispetto a Col1.
  • Equals(Col2_$10), a indicare che la colonna 2 è stata confrontata con la costante 10.

Anche se si usa l'opzione Inplace , i dati di origine non vengono eliminati o modificati. la colonna nel set di dati originale è ancora disponibile in Studio (versione classica). Per visualizzare i dati originali, è possibile connettere il modulo Aggiungi colonne e unirlo all'output di Applica operazione matematica.

Operazioni matematiche di base

Le funzioni nella categoria Basic in genere accettano un singolo valore da una colonna, eseguono l'operazione predefinita e restituiscono un singolo valore. Per alcune funzioni è possibile specificare una costante come secondo argomento.

Machine Learning supporta le funzioni seguenti nella categoria Basic:

Abs

Restituisce il valore assoluto delle colonne selezionate.

Atan2

Restituisce una tangente inversa a quattro quadranti.

Selezionare le colonne che contengono le coordinate del punto. Per il secondo argomento, che corrisponde alla coordinata x, è anche possibile specificare una costante.

Corrisponde alla funzione ATAN2 in Matlab.

Conj

Restituisce il coniugato per i valori nella colonna selezionata.

CubeRoot

Calcola la radice del cubo per i valori nella colonna selezionata.

DoubleFactorial**

Calcola il fattoriale doppio per i valori nella colonna selezionata. Il fattoriale doppio è un'estensione della funzione fattoriale normale e viene denotato come x!!.

Eps

Restituisce la dimensione del gap tra il valore corrente e il successivo numero a precisione doppia più alto. Corrisponde alla funzione EPS in Matlab.

Exp

Restituisce e elevato alla potenza del valore nella colonna selezionata. Corrisponde alla funzione EXP Excel EXP.

Exp2

Restituisce l'esponenziale in base 2 degli argomenti, risolvendo per y = x * 2t dove t è una colonna di valori contenenti esponenti.

Per Exp2 è possibile specificare un secondo argomento x, che può essere una costante o un'altra colonna di valori

In Secondo tipo di argomento indicare se si fornirà il moltiplicatore t come costante o un valore in una colonna.

È possibile selezionare una singola colonna con i valori esponenti o digitare il valore dell'esponente nella casella di testo Costante secondo argomento. In Set di colonne selezionare quindi la colonna che contiene i valori esponenti.

Ad esempio, se {0,1,2,3,4,5} si seleziona una colonna con i valori sia per il moltiplicatore che per l'esponente, la funzione restituisce {0, 2, 8, 24, 64 160).

ExpMinus1

Restituisce l'esponente negativo per i valori nella colonna selezionata.

Fattoriale

Restituisce il fattoriale per i valori nella colonna selezionata.

Hypotenuse

Calcola l'ipotenusa per un triangolo in cui la lunghezza di un lato viene specificata come colonna di valori e la lunghezza del secondo lato viene specificata come costante o come due colonne.

ImaginaryPart

Restituisce la parte immaginaria dei valori nella colonna selezionata.

Ri

Restituisce il logaritmo naturale per i valori nella colonna selezionata.

LnPlus1

Restituisce il logaritmo naturale più uno per i valori nella colonna selezionata.

Log

Restituisce il logaritmo dei valori nella colonna selezionata secondo la base specificata.

È possibile specificare la base (il secondo argomento) come costante o selezionando un'altra colonna di valori.

Log10

Restituisce il logaritmo in base 10 dei valori nella colonna selezionata.

Log2

Restituisce il logaritmo in base 2 per i valori nella colonna selezionata.

NthRoot

Restituisce l'esima radice del valore, usando un n specificato.

Selezionare le colonne per cui si vuole calcolare la radice usando l'opzione ColumnSet .

In Secondo tipo di argomento selezionare un'altra colonna che contiene la radice o specificare una costante da usare come radice.

Se il secondo argomento è una colonna, ogni valore nella colonna viene usato come valore di n per la riga corrispondente. Se il secondo argomento è una costante, digitare il valore per n nella casella di testo Constant second argument (Secondo argomento costante).

Pow

Calcola X elevato alla potenza di Y per ognuno dei valori nella colonna selezionata.

Per prima cosa, selezionare le colonne che contengono la base, che deve essere un valore float, usando l'opzione ColumnSet .

In Secondo tipo di argomento selezionare la colonna che contiene l'esponente o specificare una costante da usare come esponente.

Se il secondo argomento è una colonna, ogni valore della colonna viene usato come esponente per la riga corrispondente. Se il secondo argomento è una costante, digitare il valore dell'esponente nella casella di testo Constant second argument.

RealPart

Restituisce la parte reale dei valori nella colonna selezionata.

Sqrt

Restituisce la radice quadrata dei valori nella colonna selezionata.

SqrtPi

Per ogni valore nella colonna selezionata, moltiplica il valore per pi greco e quindi restituisce la radice quadrata del risultato.

Square

Quadra i valori nella colonna selezionata.

Operazioni di confronto

Usare le funzioni di confronto in Machine Learning Studio (versione classica) ogni volta che è necessario testare due set di valori l'uno sull'altro. Ad esempio, in un esperimento potrebbe essere necessario eseguire queste operazioni di confronto:

  • Valutare un modello di colonna di punteggi di probabilità rispetto a un valore soglia.
  • Determinare se due set di risultati sono uguali e per ogni riga diversa aggiungere un flag FALSE che può essere usato per ulteriori elaborazioni o filtri.

EqualTo

Restituisce True se i valori sono uguali.

GreaterThan

Restituisce True se i valori nel set di colonne sono maggiori della costante specificata o maggiori dei valori corrispondenti nella colonna di confronto.

GreaterThanOrEqualTo

Restituisce True se i valori nel set di colonne sono maggiori o uguali alla costante specificata oppure maggiore o uguale ai valori corrispondenti nella colonna di confronto.

LessThan

Restituisce True se i valori nel set di colonne sono minori della costante specificata o minori dei valori corrispondenti nella colonna di confronto.

LessThanOrEqualTo

Restituisce True se i valori nel set di colonne sono minori o uguali alla costante specificata oppure minore o uguale ai valori corrispondenti nella colonna di confronto.

NotEqualTo

Restituisce True se i valori in Column set non sono uguali alla costante o alla colonna di confronto, altrimenti restituisce False.

PairMax

Restituisce il valore maggiore: il valore in Column set oppure il valore nella costante o nella colonna di confronto.

PairMin

Restituisce il valore minore, ovvero il valore in Set di colonne o il valore nella colonna costante o di confronto

Operazioni aritmetiche

Include le operazioni aritmetiche di base: addizione e sottrazione, divisione e moltiplicazione. Poiché la maggior parte delle operazioni è binaria e richiede due numeri, è prima di tutto necessario scegliere l'operazione e quindi la colonna o i numeri da usare nel primo e nel secondo argomento.

L'ordine in cui si scelgono le colonne per la divisione e la sottrazione potrebbe sembrare controintuitivo; Tuttavia, per semplificare la comprensione dei risultati, l'intestazione di colonna fornisce il nome dell'operazione e l'ordine in cui sono state usate le colonne.

Operazione Num1 Num2 Colonna dei risultati Valore del risultato
Addizione 1 5 Add(Num2_Num1) 4
Moltiplicazione 1 5 Multiple(Num2_Num1) 5
Sottrazione 1 5 Subtract(Num2_Num1) 4
Sottrazione 0 1 Subtract(Num2_Num1) 0
Divisione 1 5 Divide(Num2_Num1) 5
Divisione 0 1 Divide(Num2_Num1) Infinito

Add

Specificare le colonne di origine usando Set di colonne e quindi aggiungere a tali valori un numero specificato nell'argomento Dell'operazione costante.

Per aggiungere i valori in due colonne, scegliere una o più colonne usando Set di colonne e quindi scegliere una seconda colonna usando l'argomento Operazione.

Divisione

Divide i valori di Column set per una costante o per i valori di colonna definiti in Operation argument. In altre parole, si sceglie prima il divisore e quindi il dividendo. Il valore di output è il quoziente.

Moltiplicazione

Moltiplica i valori di Column set per la costante o i valori di colonna specificati.

Sottrazione

Specificare il numero da sottrarre ( sottraendo) usando l'elenco a discesa dell'argomento Operation. È possibile scegliere una costante o una colonna di valori. Specificare quindi la colonna di valori su cui operare ( minuend), scegliendo una colonna diversa, usando la seconda opzione Set di colonne.

È possibile sottrarre una costante da ogni valore in una colonna di valori, ma non dall'operazione inversa. A tale scopo, usare l'addizione.

Operazioni di arrotondamento

Studio (versione classica) supporta un'ampia gamma di operazioni di arrotondamento. Per molte operazioni, è necessario specificare la quantità di precisione da utilizzare durante l'arrotondamento. È possibile usare un livello di precisione statico, specificato come costante, oppure applicare un valore di precisione dinamica ottenuto da una colonna di valori.

  • Se si usa una costante, impostare Tipo di precisione su Costante e quindi digitare il numero di cifre come numero intero nella casella di testo Precisione costante . Se si digita un valore diverso da integer, il modulo non genera un errore, ma i risultati possono essere imprevisti.

  • Per usare un valore di precisione diverso per ogni riga del set di dati, impostare Tipo di precisione su ColumnSet, quindi scegliere la colonna che contiene i valori di precisione appropriati.

Ceiling

Restituisce il limite massimo per i valori in Column set.

CeilingPower2

Restituisce il limite massimo al quadrato per i valori in Column set.

Piano

Restituisce il limite minimo per i valori in Column set con la precisione specificata.

Mod

Restituisce la parte frazionaria dei valori in Column set con la precisione specificata.

Quoziente

Restituisce la parte frazionaria dei valori in Column set con la precisione specificata.

Resto

Restituisce il resto per i valori in Column set.

RoundDigits

Restituisce i valori in Column set, arrotondati per la regola 4/5 al numero di cifre specificato.

RoundDown

Restituisce i valori in Column set, arrotondati per difetto al numero di cifre specificato.

RoundUp

Restituisce i valori in Column set, arrotondati per eccesso al numero di cifre specificato.

ToEven

Restituisce i valori in Column set, arrotondati al numero pari intero più vicino.

ToOdd

Restituisce i valori in Column set, arrotondati al numero dispari intero più vicino.

Truncate

Tronca i valori in Column set rimuovendo tutte le cifre per difetto non consentite dalla precisione specificata.

Funzioni matematiche speciali

Questa categoria include funzioni matematiche specializzate spesso usate in data science. Se non specificato diversamente, la funzione è unaria e restituisce il calcolo specificato per ogni valore nella colonna o nelle colonne selezionate.

Beta

Restituisce il valore della funzione beta di Eulero.

EllipticIntegralE

Restituisce il valore dell'integrale ellittico incompleto.

EllipticIntegralK

Restituisce il valore dell'integrale ellittico completo (K).

Erf

Restituisce il valore della funzione di errore.

La funzione di errore (denominata anche funzione di errore di Gauss) è una funzione speciale di forma sigmoide usata nella probabilità per descrivere la diffusione.

Erfc

Restituisce il valore della funzione di errore complementare.

Erfc è definito come 1 - erf(x).

ErfScaled

Restituisce il valore della funzione di errore in scala.

La versione in scala della funzione di errore consente di evitare l'underflow aritmetico.

ErfInverse

Restituisce il valore della funzione inversa di erf.

ExponentialIntegralEin

Restituisce il valore dell'integrale esponenziale Ei.

Gamma

Restituisce il valore della funzione gamma.

GammaLn

Restituisce il logaritmo naturale della funzione gamma.

GammaRegularizedP

Restituisce il valore della funzione gamma incompleta regolarizzata.

Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.

GammaRegularizedPInverse

Restituisce il valore della funzione gamma incompleta regolarizzata inversa.

Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.

GammaRegularizedQ

Restituisce il valore della funzione gamma incompleta regolarizzata.

Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.

GammaRegularizedQInverse

Restituisce il valore della funzione gamma incompleta regolarizzata generalizzata inversa.

Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.

PolyGamma

Restituisce il valore della funzione poligamma.

Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.

Funzioni trigonometriche

Questa categoria iInclud la maggior parte delle importanti funzioni trigonometriche e inverse. Tutte le funzioni trigonometriche sono unarie e non richiedono argomenti aggiuntivi.

Acos

Calcola l'arcocoseno per i valori di colonna.

AcosDegree

Calcola l'arcocoseno dei valori di colonna, in gradi.

Acosh

Calcola l'arcocoseno iperbolico dei valori di colonna.

Acot

Calcola l'arcocotangente dei valori di colonna.

AcotDegrees

Calcola l'arcocotangente dei valori di colonna, in gradi.

Acoth

Calcola l'arcocotangente iperbolico dei valori di colonna.

Acsc

Calcola l'arcocosecante dei valori di colonna.

AcscDegrees

Calcola l'arcocosecante dei valori di colonna, in gradi.

Asec

Calcola l'arcosecante dei valori di colonna.

AsecDegrees

Calcola l'arcosecante dei valori di colonna, in gradi.

Asech

Calcola l'arcosecante iperbolico dei valori di colonna.

Asin

Calcola l'arcoseno dei valori di colonna.

AsinDegrees

Calcola l'arcoseno dei valori di colonna, in gradi.

Asinh

Calcola l'arcoseno iperbolico per i valori della colonna.

Atan

Calcola l'arcotangente dei valori di colonna.

AtanDegrees

Calcola l'arcotangente dei valori di colonna, in gradi.

Atanh

Calcola l'arcotangente iperbolico dei valori di colonna.

Cis

Restituisce una funzione con valori complessi fatta di seno e coseno con la definizione cis θ = cos θ + isin θ.

Cos

Calcola il coseno dei valori di colonna.

CosDegrees

Calcola il coseno per i valori della colonna, in gradi.

Cosh

Calcola il coseno iperbolico per i valori della colonna.

Cot

Calcola la cotangente per i valori di colonna.

CotDegrees

Calcola la cotangente per i valori di colonna, in gradi.

Coth

Calcola la cotangente iperbolica per i valori di colonna.

Csc

Calcola il cosecanere per i valori di colonna.

CscDegrees

Calcola il cosecanere per i valori di colonna, in gradi.

Csch

Calcola il cosecane iperbolico per i valori di colonna.

DegreesToRadians

Converte i gradi in radianti.

Sec

Calcola la secante dei valori di colonna.

aSecDegrees

Calcola la secante per i valori di colonna, in gradi.

aSech

Calcola il seme iperbolico dei valori di colonna.

Sign

Restituisce il segno dei valori di colonna.

Sin

Calcola il seno dei valori della colonna.

Sinc

Calcola il valore seno-coseno dei valori della colonna.

SinDegrees

Calcola il seno per i valori della colonna, in gradi.

Sinh

Calcola il seno iperbolico dei valori della colonna.

Tan

Calcola la tangente dei valori di colonna.

TanDegrees

Calcola la tangente per l'argomento, in gradi.

Tanh

Calcola la tangente iperbolica dei valori di colonna.

Note tecniche

Questa sezione contiene informazioni dettagliate sull'implementazione, suggerimenti e risposte alle domande frequenti.

Operazioni su più colonne

Prestare attenzione quando si seleziona più di una colonna come secondo operatore. I risultati sono facili da comprendere se l'operazione è semplice, ad esempio aggiungendo una costante a tutte le colonne.

Si supponga che il set di dati abbia più colonne e che il set di dati sia stato aggiunto a se stesso. Nei risultati ogni colonna viene aggiunta a se stessa, come indicato di seguito:

Num1 Num2 Num3 Add(Num1_Num1) Add(Num2_Num2) Add(Num3_Num3)
1 5 2 2 10 4
2 3 -1 4 6 -2
0 1 -1 0 2 -2

Se è necessario eseguire calcoli più complessi, è possibile concatenare più istanze di Applica operazione matematica. È possibile ad esempio aggiungere due colonne tramite un'istanza di Apply Math Operation, quindi usare un'altra istanza di Apply Math Operation per dividere la somma per una costante in modo da ottenere la media.

In alternativa, usare uno dei moduli seguenti per eseguire tutti i calcoli contemporaneamente, usando uno script SQL, R o Python:

Funzioni unarie e binarie

In un'operazione unaria si creano calcoli basati sui valori di colonna senza fare riferimento ad altre colonne o costanti.

Ad esempio, è possibile troncare i valori della colonna in base a un determinato grado di precisione, arrotondare i valori per eccesso o per difetto o trovare valori limite massimi o minimi.

Un esempio di un'operazione unaria è rappresentato da Abs(X), dove X è la colonna fornita come input.

In un'operazione binaria si specificano due set di valori. Il primo argomento deve essere sempre una colonna o un set di colonne, mentre il secondo argomento può essere un numero specificato come costante o un'altra colonna.

Un esempio di operazione binaria che usa due colonne è rappresentato da Subtract(X,Y), dove X è la prima colonna selezionata e Y è la seconda colonna.

Un esempio di uso di operazione binaria che combina una colonna e una costante è rappresentato da Subtract(X,mean), dove si digita la media della colonna come costante sottraendola poi da ogni valore della colonna X.

Gestione dei numeri nelle colonne categoriche

Il supporto per i valori categorici presentati come numeri dipende dalla funzione e dal numero di argomenti accettati dalla funzione.

  • Se l'operazione include numeri designati come colonne categoriche, è possibile applicare un'operazione unaria ai valori di dati categorici.

  • Se a una colonna di categoria viene applicata un'operazione unaria, i valori dei dati categorici della colonna di input possono essere trasformati in valori di dati categorici uguali associati della colonna di output. In questo caso, i valori vengono uniti, in modo che il numero di valori di dati categorici nell'output sia sempre minore del numero di valori nell'input.

  • Se un'operazione binaria viene applicata a una colonna categorica e a un'altra colonna, il comportamento previsto è il seguente:

    • Se l'altra colonna è di tipo dense, la colonna di output è categorica.

      I valori di dati categorici presentati nell'input vengono persi.

      La colonna di output include solo i valori presenti nei dati della colonna di output.

    • Se l'altra colonna è di tipo sparse, la colonna di output è sparse.

    • Se entrambi gli argomenti di un'operazione binaria sono colonne di tipo sparse, la colonna risultante contiene zeri in background in tutte le posizioni in cui entrambe le colonne di input contengono zeri in background.

Elaborazione di colonne di tipo sparse

Nelle operazioni unarie, tutti gli elementi delle colonne di tipo sparse che corrispondono agli zeri di sfondo vengono lasciati non elaborati.

Nelle operazioni binarie, se un argomento è una colonna di tipo sparse e l'altro argomento è una colonna densa, la colonna risultante è di tipo sparse con tutti gli zeri di sfondo propagati dall'input della colonna di tipo sparse.

Input previsti

Nome Tipo Descrizione
Set di dati Tabella dati Set di dati di input

Output

Nome Tipo Descrizione
Set di dati di risultati Tabella dati Set di dati di risultati

Vedi anche

Funzioni statistiche
Elenco moduli A-Z