Das Modell „Wird oft zusammen gekauft“ konfigurieren (Vorschauversion)

Wichtig

Einige oder alle dieser Funktionen sind als Teil einer Vorschauversion verfügbar. Inhalt und Funktionalität können sich ändern.

Nachdem Sie häufig zusammen gekaufte Produkte erfolgreich bereitgestellt haben, müssen Sie Folgendes tun:

  • Konfigurieren Sie die Authentifizierung für das Contoso-Beispiel DataSet.

  • Konfigurieren Sie das Modell, um Erkenntnisse über die im Lakehouse verfügbaren Daten zu generieren.

Konfigurieren von Stichproben-DataSet-Authentifizierungen

Führen Sie die folgenden Schritte aus, um das Contoso-Stichproben-DataSet mit Authentifizierung zu konfigurieren:

  1. Öffnen Sie den Bereich bereitgestellte Artefakte und wählen Sie das Contoso-Stichproben-DataSet aus. RDS_FBT_xxx_Dataset. Sie können Details zum DataSet anzeigen, das den Bericht, die SQL-Analyse Endpunkt und das Lakehouse umfasst. Wählen Sie Datei/Einstellungen, um die Einstellungen für das semantische Modell zu überprüfen.

    Der Screenshot zeigt das Contoso-Stichproben-DataSet.

  2. Wählen Sie die Registerkarte Semantische Modelle. Im Abschnitt Datenquelle-Anmeldeinformationen gibt es eine Warnung mit der Meldung Die Verbindung zu Ihrem Datenquelle konnte nicht getestet werden. Bitte versuchen Sie es erneut mit Ihren Anmeldeinformationen.. Wählen Sie Anmeldeinformationen bearbeiten.

    Screenshot zeigt Warnung für Datenquelle-Anmeldeinformationen.

  3. Es öffnet sich ein Fenster. Wählen Sie OAuth2 als Authentifizierungsmethode aus, geben Sie eine optionale Datenschutzstufe ein und wählen Sie Anmeldung aus, um sich mit dieser Authentifizierung anzumelden.

    Screenshot, der zeigt, wie die DataSet-Authentifizierungsmethode konfiguriert wird

Wichtig

Wenn Sie versuchen, den Bericht Häufig zusammengekauft anzuzeigen, bevor Sie die Authentifizierung für DataSet konfigurieren, wird im Berichtsfenster eine Fehlermeldung mit der Meldung Aufgrund eines Problems mit dem lokalen Dienst ist eine Ausnahme aufgetreten angezeigt.

Konfigurieren Sie das Modell, um Erkenntnisse zu generieren

Das Notebook besteht aus den folgenden Zellen, die beschreiben, wie Daten verarbeitet werden, um die erforderliche Ausgabe bereitzustellen.

Vorsicht

Die folgenden Zellen werden in der empfohlenen Reihenfolge verwendet. Wenn sie in einer anderen Reihenfolge verwendet werden, schlägt das Notebook fehl.

1. Bibliotheken importieren

In diesem Schritt werden die erforderlichen Bibliotheken für das Notebook importiert. In diesem Schritt müssen Sie keinerlei Änderungen vornehmen.

2. Spark-Konfigurationen, Protokollierung und Checkpointer initialisieren

Dieser Schritt initialisiert die Spark-Konfigurationen, Protokollierungs- und Checkpointerobjekte, die für die Notebook-Ausführung verwendet werden.

Die Protokollierung kann auf zwei verschiedene Arten initialisiert werden:

  • Richten Sie sie so ein, dass Protokolle in die Ausgaben der Notebookzelle geschrieben werden. Dies ist die Standardeinstellung.

  • Wenn die Protokolle in einen Azure Application Insights-Arbeitsbereich geschrieben werden sollen, brauchen Sie der „connection_string“ des Application Insights-Arbeitsbereichs. Außerdem wird eine Ausführungs-ID generiert und in der Ausgabe der Zelle angezeigt. Diese kann zum Abfragen von Protokollen im Application Insights-Arbeitsbereich verwendet werden.

Der Checkpointer wird verwendet, um die Spark-Ausführung zu synchronisieren und zu verhindern, dass womöglich doppelte Schlüssel generiert werden. Sie müssen einen Pfad angeben, der als Arbeitsverzeichnis verwendet wird. Der Name der Variablen ist checkpoint_dir. Das Verzeichnis muss sich im Dateibereich des Lakehouse befinden. Das heißt, es muss mit „Files/“ beginnen.

3. Eine Verbindung zu Lakehouse herstellen und die Eingabetabellen lesen

Dieser Schritt stellt eine Verbindung zum Lakehouse her und liest die Eingabetabellen, die für das Modell erforderlich sind. Die Eingabetabellen werden aus einer der drei genannten Optionen gelesen:

  • Das angeheftete Lakehouse des Notebooks, das die Beispieldaten enthält. Dies ist die Standardoption.

  • Jedes Lakehouse, das mit dem Notebook verbunden ist. Sie können das Lakehouse aus dem Dropdownmenü auswählen.

  • Ein anderes Lakehouse, das nicht mit dem Notebook verbunden ist. Sie müssen den vollständigen Pfad zum Lakehouse angeben.

Einzelheiten zu Eingabetabellen finden Sie unter Eingabedaten für „Wird oft zusammen gekauft“.

Mit dem Notebook können Sie das Modell über mehrere Zeiträume hinweg ausführen. Dies kann Ihnen dabei helfen, die Saisonalität und Veränderungen im Kundenverhalten, im Produktportfolio und in der Produktpositionierung im Zeitverlauf zu erfassen. Sie können die Ergebnisse verschiedener Zeiträume auch mit dem sofort einsatzbereiten Dashboard vergleichen.

Um einen Zeitraum festzulegen, verwenden Sie die Funktion add_analysis_period. Legen Sie die Analysezeiträume unbedingt innerhalb der Dauer der Eingabedaten fest. Die Dauer der Eingabedaten (maximaler und minimaler Zeitstempel der Transaktionen) wird in der Ausgabe der Zelle protokolliert. Sie können bis zu fünf Zeiträume festlegen. Die Referenzschlüssel für die Zeiträume werden in der Tabelle TimePeriods gespeichert.

4. Eingabedaten vorverarbeiten

Dieser Schritt verbindet die Eingabe-DataFrame, um ein POS-Dataset zu erstellen, welches das Modell zum Generieren der Erkenntnisse verwendet. In diesem Schritt müssen Sie keinerlei Änderungen vornehmen.

Die Ausgabe dieses Schritts sind die folgenden DataFrame:

  • Käufe: Der POS-DataFrame Käufe enthält Informationen über die von Kundschaft getätigten Käufe, z. B. Einzelhandelsentitäts-ID, Produkt-ID, Produktlistenpreis, Menge und Besuchszeitstempel. Dieser DataFrame wird durch die Verknüpfung der Visit-, Order-, Transaction- und TransactionLineItem-Tabellen erstellt.

  • Time_periods: Dieser DataFrame enthält die von Ihnen im vorherigen Schritt festgelegten Analysezeiträume. Diese Zeiträume werden verwendet, um die Daten aufzuteilen und das Modell für jeden Zeitraum auszuführen.

  • Retail_entities: Dieser DataFrame enthält die IDs der Einzelhandelsentitäten und ihre Informationen. Eine Einzelhandelsentität kann entweder ein einzelnes Geschäft oder ein Einzelhändler sein. Diese Entitäten werden verwendet, um das Modell auf Geschäfts- oder Einzelhändlerebene auszuführen.

5. Modellparameter festlegen und Modell ausführen

Zur Feinabstimmung der Modellergebnisse können die folgenden Modellparameter eingestellt werden:

  • Parametername: min_itemset_frequency

    • Beschreibung: Mindestanzahl der Käufe von Artikelsätzen (Sammlung von zwei zusammen gekauften Produkten), die bei der Analyse des Modells berücksichtigt werden sollen.

    • Wertetyp: Integer

    • Standardwert: 3

    • Erforderlich: wahr.

    • Zulässige Werte: >=1

  • Parametername: max_basket_size

    • Beschreibung: Maximale Anzahl an Artikeln in einem Warenkorb. Wenn die Anzahl der Artikel im Warenkorb den Standardwert überschreitet, wird der Warenkorb eingeschränkt. Das Produkt mit den niedrigsten Umsätzen im Dataset wird zuerst eingeschränkt.

    • Wertetyp: Integer

    • Standardwert: 20

    • Erforderlich: wahr.

    • Zulässige Werte: >=1

  • Parametername: chi_2_alpha

    • Beschreibung: Statistischer Signifikanzparameter. Wird verwendet, um zu bestimmen, ob ein einander zugeordnetes Produktpaar aussagekräftig und statistisch signifikant ist. Wenn die Punktzahl eines Produktpaars unter dem Parameterwert liegt, werden die Produkte im Feld „Chi2IsSignificant“ der Tabelle „RuleAttributes“ gekennzeichnet.

    • Wertetyp: Gleichkomma

    • Erforderlich: falsch

    • Standardwert: 0,05 Perzentil

    • Zulässiger Wertebereich: 0 bis 1

Bei der Ausführung werden Daten in die Ausgabetabellen geschrieben. Sie haben drei Möglichkeiten, um festzulegen, an welches Lakehouse geschrieben werden soll.

6. Power BI-Dashboard-Tabellen erstellen

Sie können den Parameter num_top_associated_products verwenden, um die Anzahl der Top-assoziierten Produkte zu konfigurieren, die im Power BI Dashboard für jedes Produkt angezeigt werden sollen.

  • Beschreibung: Maximale Anzahl zugeordneter Produkte für jedes Produkt, die im Power BI-Dashboard angezeigt werden soll. Gibt die wichtigsten Produkte sortiert nach dem Feld „CombinationRank“ zurück

  • Wertetyp: Integer

  • Erforderlich: falsch

  • Standardwert: 5

  • Zulässiger Wertebereich: 1 bis 10

Bei der Ausführung werden Daten in das Lakehouse geschrieben. Einzelheiten zu Ausgabetabellen finden Sie unter Ausgabedaten für „Wird oft zusammen gekauft“.

Ähnlich wie bei Eine Verbindung zum Lakehouse herstellen und den Eingabetabellenabschnitt lesen gibt es drei Methoden zum Schreiben von Ausgaben in Fabric.