Partager via


AggregatorTop Classe

Définit une agrégation qui obtient les N premiers en fonction des clés de jointure.

Initialiser avec les nombres les plus élevés.

Héritage
AggregatorTop

Constructeur

AggregatorTop(n: int = 1)

Paramètres

n
valeur par défaut: 1

Remarques

Généralement, les agrégateurs ne sont pas instanciés directement. À la place, spécifiez le type d’agrégateur quand vous utilisez un enrichisseur tel que l’objet HolidayEnricher.

La méthode process_public_dataset(env, _public_dataset, cols, join_keys) obtient la valeur maximale.

Méthodes

get_log_property

Permet d’obtenir le tuple de propriété de journal, None en l’absence de propriété.

process_public_dataset

Obtient les valeurs N maximales basées sur les clés de jointure d’entrée.

get_log_property

Permet d’obtenir le tuple de propriété de journal, None en l’absence de propriété.

get_log_property()

process_public_dataset

Obtient les valeurs N maximales basées sur les clés de jointure d’entrée.

process_public_dataset(env: SparkEnv | PandasEnv, _public_dataset: object, cols: object, join_keys: list)

Paramètres

env
RuntimeEnv
Obligatoire

Environnement d’exécution.

_public_dataset
PublicData
Obligatoire

Jeu de données public d’entrée.

cols
list
Obligatoire

Liste des noms de colonnes à récupérer.

join_keys
list
Obligatoire

Liste de paires de clés de jointure.

Retours

Jeu de données public agrégé.