Configurer le modèle Fréquemment achetés ensemble (version préliminaire)

Article
02/23/2024

Important

Tout ou partie de cette fonctionnalité est accessible dans le cadre d’une version préliminaire. Le contenu et la fonctionnalité sont susceptibles d’être modifiés.

Après avoir déployé avec succès Fréquemment acheté ensemble, vous devez :

Configurez l’authentification pour l’exemple Contoso jeu de données.
Configurez le modèle pour générer des informations sur les données disponibles dans Lakehouse.

Configurer l'authentification du exemple de jeu de données

Pour configurer l’exemple Contoso jeu de données avec authentification, effectuez les étapes suivantes :

Ouvrez le panneau des artefacts déployés et sélectionnez l’exemple Contoso jeu de données, RDS_FBT_xxx_Dataset. Vous pouvez afficher les détails du jeu de données, qui comprend le rapport, l’analyse SQL point de terminaison et Lakehouse. Sélectionnez Fichier/Paramètres pour vérifier les paramètres du modèle sémantique.
Sélectionner Modèles sémantiques languette. Sous la section des informations d’identification source de données, il y a une alerte indiquant Échec du test de la connexion à votre source de données. Veuillez réessayer vos informations d’identification. Sélectionner Modifier les identifiants.
Une fenêtre s’ouvre. Sélectionner OAuth2 comme méthode d’authentification, entrez un niveau de confidentialité facultatif et sélectionnez se connecter pour vous connecter avec cette authentification.

Important

Si vous essayez d’afficher le rapport Fréquemment achetés ensemble avant de configurer l’authentification pour le jeu de données, vous verrez une erreur dans la fenêtre du rapport indiquant "Une exception s’est produite en raison d’un problème de service sur site".

Configurer le modèle pour générer des informations

Le bloc-notes se compose des cellules suivantes qui racontent la manière dont les données sont traitées pour fournir le résultat requis.

Avertissement

Les cellules suivantes sont utilisées dans l’ordre spécifique recommandé. S’ils sont utilisés dans un ordre différent, le bloc-notes échoue.

1. Importer les Bibliothèques

Cette étape importe les bibliothèques nécessaires pour le notebook. Vous n’avez aucune modifier à faire à cette étape.

2. Initialisez les configurations Spark, Enregistreur automatique et point de contrôle

Cette étape initialise les objets configuration Spark, Enregistreur automatique et point de contrôle qui sont utilisés pour l’exécution du notebook.

Le Enregistreur automatique peut être initialisé de deux manières différentes :

Configurer pour écrire des journaux sur les sorties des cellules du bloc-notes. C’est le comportement par défaut.
Si vous êtes configuré pour écrire des journaux dans un espace de travail Azure Application Insights , la chaîne de connexion de l’espace de travail Application Insights serait nécessaire. En outre, un ID d’exécution serait généré et affiché dans la sortie de la cellule et pourrait être utilisé pour interroger les journaux dans l’espace de travail Application Insights .

Le point de contrôle est utilisé pour synchroniser l’exécution de Spark et éviter la génération potentielle de clés dupliquées. Vous devez fournir un chemin utilisé comme répertoire de travail. checkpoint_dir est le nom de la variable. Le répertoire doit se trouver dans la section fichiers de Lakehouse. Autrement dit, il doit commencer par « Fichiers/ ».

3. Connectez-vous à Lakehouse et lisez les tableaux d’entrée

Cette étape se connecte à Lakehouse et lit les tables d’entrée requises pour le modèle. Les tables d’entrée sont lues à partir de l’une des trois options répertoriées :

Le Lakehouse épinglé du bloc-notes, qui contient les exemples de données. Il s’agit de l’option par défaut.
N’importe lequel des lakehouses connectés au notebook. Vous pouvez sélectionner le lakehouse dans un menu déroulante.
Un autre Lakehouse non connecté au portable. Vous devez fournir le chemin complet vers Lakehouse.

Pour plus de détails sur les tableaux d’entrée, consultez Données d’entrée pour Fréquemment achetés ensemble.

Le bloc-notes vous permet d’exécuter le modèle sur plusieurs périodes, ce qui peut vous aider à capturer la saisonnalité et les changements de comportement des clients, de portefeuille de produits et de positionnement des produits au fil du temps. Vous pouvez également comparer les résultats de différentes périodes à l’aide du tableau de bord prêt à l’emploi.

Pour définir une période de temps, utilisez la fonction add_analysis_period . Assurez-vous de définir les périodes d’analyse dans la durée des données d’entrée. La durée des données d’entrée (horodatage des transactions max et min) est enregistrée dans la sortie de la cellule. Vous pouvez définir jusqu’à cinq périodes. Les clés de référence des périodes sont stockées dans la table TimePeriods .

4. Prétraiter les données d’entrée

Cette étape rejoint les trames de données d’entrée pour créer un jeu de données POS, qui est utilisé par le modèle pour générer les informations. Vous n’avez aucune modifier à faire à cette étape.

Le résultat de cette étape est les trames de données suivantes :

purchases : la trame de données POS des achats contient des informations sur les achats effectués par les clients, comme l’ID de l’entité de vente au détail, l’ID du produit, le montant du prix de la liste de produits, la quantité et l’horodatage de la visite. Cette trame de données est créée en joignant les tables Visit, Order, Transaction et TransactionLineItem.
time_periods : cette trame de données contient les périodes d’analyse que vous avez définies à l’étape précédente. Ces périodes sont utilisées pour diviser les données et exécuter le modèle sur chaque période.
retail_entities : cette trame de données contient les identifiants des entités de vente au détail et leurs informations. Une entité de vente au détail peut être soit un magasin individuel, soit un détaillant. Ces entités sont utilisées pour exécuter le modèle au niveau du magasin ou du détaillant.

5. Définir les paramètres du modèle et exécuter le modèle

Les paramètres de modèle suivants peuvent être définis pour affiner les résultats du modèle :

Nom du paramètre : min_itemset_frequency
- Description : Nombre minimal d’achats d’ensembles d’articles (collection de deux produits achetés ensemble) à prendre en compte dans l’analyse du modèle.
- Type de Valeur : entier
- Valeur par défaut : 3
- Obligatoire : vrai.
- Valeurs autorisées: >=1
Le nom du paramètre: max_basket_size
- Description : Nombre maximum d’articles dans un panier. Si le nombre d’articles dans le panier dépasse la valeur par défaut, le panier est tronqué. Le produit avec les ventes les plus faibles dans le jeu de données est coupé en premier.
- Type de Valeur : entier
- Valeur par défaut : 20
- Obligatoire : vrai.
- Valeurs autorisées: >=1
Nom du paramètre : chi_2_alpha
- Description: Paramètre de signification statistique. Utilisé pour déterminer si une paire de produits associés est significatif et statistiquement significatif. Si une paire de produits obtient un score inférieur à la valeur du paramètre, ils sont signalés dans le champ Chi2IsSignificant de la table RuleAttributes.
- Type de valeur : flottant
- Obligatoire: FAUX
- Valeur par défaut : 0,05 centile
- Plage de valeurs autorisées : 0-1

Lors de l’exécution, les données sont écrites dans les tables de sortie. Vous disposez de trois options pour définir à quel Lakehouse écrire.

6 : Créer des tables de tableau de bord Power BI

Vous pouvez utiliser le paramètre num_top_associated_products pour configurer le nombre de produits principaux associés à afficher dans le tableau de bord Power BI pour chaque produit.

Description: Nombre maximum de produits associés pour chaque produit à afficher dans le tableau de bord Power BI. Renvoie les meilleurs produits triés par le champ CombinationRank
Type de Valeur : entier
Obligatoire: FAUX
Valeur par défaut : 5
Plage de valeurs autorisées : 1-10

Lors de l’exécution, les données sont écrites dans lakehouse. Pour plus de détails sur les tableaux de sortie, consultez Données de sortie pour Fréquemment achetés ensemble.

Semblable à la Connectez-vous à Lakehouse et lisez la section des tableaux d’entrée, il existe trois méthodes d’écriture des sorties dans Fabric.