Freigeben über


Microsoft Graph-Connector für Unternehmenswebsites

Mit dem Microsoft Graph-Connector für Unternehmenswebsites können Ihre organization Artikel und Inhalte von Ihren unternehmenseigenen Websites indizieren. Nachdem Sie den Connector konfiguriert und Inhalte von der Website synchronisiert haben, können Endbenutzer auf jedem Microsoft Search-Client nach diesen Inhalten suchen.

Hinweis

Lesen Sie den Artikel Einrichten von Microsoft Graph-Connectors im Microsoft 365 Admin Center Artikel, um die allgemeinen Anweisungen zum Einrichten von Connectors zu verstehen.

Dieser Artikel richtet sich an alle Benutzer, die einen Connector für Unternehmenswebsites konfigurieren, ausführen und überwachen. Es ergänzt den allgemeinen Einrichtungsprozess und zeigt Anweisungen, die nur für den Connector für Unternehmenswebsites gelten. Dieser Artikel enthält auch Informationen zur Problembehandlung.

Schritt 1: Hinzufügen eines Connectors im Microsoft 365 Admin Center

Hinzufügen eines Enterprise-Websiteconnectors

(Weitere Informationen finden Sie in den allgemeinen Setupanweisungen .)

Schritt 2: Benennen der Verbindung

Geben Sie die folgenden Attribute an:

  • Name (erforderlich)
  • Verbindungs-ID (erforderlich)
  • Beschreibung (optional)
  • Kontrollkästchen aktivieren (erforderlich)

Die Verbindungs-ID erstellt implizite Eigenschaften für Ihren Connector. Sie muss eindeutig sein und darf nur maximal 32 alphanumerische Zeichen enthalten. Um die ID zu ändern, wechseln Sie zu Erweiterte Einstellungen.

Schritt 3: Konfigurieren der Verbindungseinstellungen

Um eine Verbindung mit Ihrer Datenquelle herzustellen, geben Sie die Stamm-URL der Website ein, und wählen Sie eine benutzerdefinierte Vertikale für die Ergebnisse aus. Nachdem Sie diese Informationen ausgefüllt haben, wählen Sie Verbindung testen aus, um Ihre Einstellungen zu überprüfen.

Website-URL

Geben Sie den Stamm der Website an, die Sie durchforsten möchten. Der Connector für Unternehmenswebsites verwendet diese URL als Ausgangspunkt und folgt allen Links dieser URL für die Durchforstung.

Hinweis

Sie können bis zu 50 verschiedene Website-URLs in einer einzigen Verbindung indizieren. Geben Sie im Feld URLs die Durch Kommas (,) getrennten Website-URLs ein. Beispiel: https://www.contoso.com,https://www.contosoelectronics.com.

Verwenden der Sitemap zum Durchforsten

Bei Auswahl durchforstet der Connector nur die in der Sitemap aufgeführten URLs. Dadurch können Sie auch die inkrementelle Durchforstung während eines späteren Schritts konfigurieren. Wenn nicht ausgewählt oder keine Websiteübersicht gefunden wird, führt der Connector eine umfassende Durchforstung aller Links aus, die in der Stamm-URL der Website gefunden werden.

Dynamische Standortkonfiguration

Wenn Ihre Website dynamische Inhalte enthält, z. B. Webseiten, die sich in Content Management-Systemen wie Confluence oder Unily befinden, können Sie einen dynamischen Crawler aktivieren. Wählen Sie Zum Aktivieren der Option Durchforstung für dynamische Websites aktivieren aus. Der Crawler wartet, bis dynamische Inhalte gerendert werden, bevor er mit der Durchforstung beginnt.

Screenshot des Bereichs

Zusätzlich zum Kontrollkästchen stehen drei optionale Felder zur Verfügung:

  1. DOM-Bereit: Geben Sie das DOM-Element ein, das der Crawler verwenden soll, um zu signalisieren, dass der Inhalt vollständig gerendert wird und die Durchforstung beginnen soll.
  2. Hinzuzufügende Header: Geben Sie an, welche HTTP-Header der Crawler beim Senden dieser spezifischen Web-URL enthalten soll. Sie können mehrere Header für verschiedene Websites festlegen. Es wird empfohlen, Authentifizierungstokenwerte einzuordnen.
  3. Zu überspringende Header: Geben Sie alle unnötigen Header an, die von dynamischen Durchforstungsanforderungen ausgeschlossen werden sollen.

Header sollten in der folgenden Syntax hinzugefügt werden: {"Root-URL":["TKey=TValue"]}

Beispiel: {"https://www.contoso.com":["Token=Value","Type=Value2"]}

Hinweis

Dynamisches Durchforsten wird nur für den Agent-Durchforstungsmodus unterstützt.

Durchforstungsmodus: Cloud oder lokal

Der Durchforstungsmodus bestimmt den Typ der Websites, die Sie indizieren möchten, entweder in der Cloud oder lokal. Wählen Sie für Ihre Cloudwebsites Cloud als Durchforstungsmodus aus.

Außerdem unterstützt der Connector jetzt das Durchforsten lokaler Websites. Für den Zugriff auf Ihre lokalen Daten müssen Sie zuerst den Connector-Agent installieren und konfigurieren. Weitere Informationen finden Sie unter Microsoft Graph-Connector-Agent.

Wählen Sie für Ihre lokalen Websites Agent als Durchforstungsmodus und im Feld Lokaler Agent den Graph-Connector-Agent aus, den Sie zuvor installiert und konfiguriert haben.

Authentifizierung

None erfordert keine Authentifizierung

Basic erfordert einen Benutzernamen und ein Kennwort.

OAuth 2.0 mit Microsoft Entra ID erfordert eine Ressourcen-ID, eine Client-ID und einen geheimen Clientschlüssel.

Die Werte für Ressourcen-ID, Client-ID und geheimer Clientschlüssel hängen davon ab, wie Sie die Einrichtung für Microsoft Entra ID-basierte Authentifizierung für Ihre Website ausgeführt haben:

  1. Wenn Sie eine Anwendung sowohl als Identitätsanbieter als auch als Client-App für den Zugriff auf die Website verwenden, sind die Client-ID und die Ressourcen-ID die Anwendungs-ID der App, und der geheime Clientschlüssel ist das Geheimnis, das Sie in der App generiert haben.

    Nachdem die Client-App konfiguriert wurde, stellen Sie sicher, dass Sie einen neuen geheimen Clientschlüssel erstellen, indem Sie zum Abschnitt Zertifikate & Geheimnisse der App wechseln. Kopieren Sie den wert des geheimen Clientschlüssels, der auf der Seite angezeigt wird, da er nicht erneut angezeigt wird.

    In den folgenden Screenshots sehen Sie die Schritte zum Abrufen der Client-ID und des geheimen Clientschlüssels sowie zum Einrichten der App, wenn Sie die App selbst erstellen.

    • Ansicht der Einstellungen im Abschnitt "Branding":

      Abbildung des Abschnitts

    • Ansicht der Einstellungen für die Authentifizierung:

      Abbildung des Abschnitts

      Hinweis

      Es ist nicht erforderlich, die oben angegebene Route für den Umleitungs-URI auf Ihrer Website zu haben. Nur wenn Sie das von Azure auf Ihrer Website gesendete Benutzertoken für die Authentifizierung verwenden, benötigen Sie die Route.

    • Ansicht der Client-ID im Abschnitt Essentials :

      Abbildung der Client-ID im Abschnitt

    • Ansicht des geheimen Clientschlüssels im Abschnitt Zertifikate & Geheimnisse :

      Abbildung des geheimen Clientschlüssels.

  2. Wenn Sie eine Anwendung als Identitätsanbieter für Ihre Website als Ressource und eine andere Anwendung für den Zugriff auf die Website verwenden, ist die Client-ID die Anwendungs-ID Ihrer zweiten App, und der geheime Clientschlüssel ist das in der zweiten App konfigurierte Geheimnis. Die Ressourcen-ID ist jedoch die ID Ihrer ersten App.

    Sie müssen in dieser Anwendung keinen geheimen Clientschlüssel konfigurieren, aber Sie müssen im Abschnitt App-Rollen eine App-Rolle hinzufügen, die später Ihrer Clientanwendung zugewiesen wird. Informationen zum Hinzufügen einer App-Rolle finden Sie in den Bildern.

    • Erstellen einer neuen App-Rolle:

      Abbildung der Option zum Erstellen einer App-Rolle.

    • Bearbeiten der neuen App-Rolle:

      Abbildung des Abschnitts zum Bearbeiten einer App-Rolle.

      Nachdem Sie die Ressourcen-App konfiguriert haben, erstellen Sie die Client-App, und erteilen Sie ihr Berechtigungen für den Zugriff auf die Ressourcen-App, indem Sie die oben konfigurierte App-Rolle in den API-Berechtigungen der Client-App hinzufügen.

      Hinweis

      Informationen zum Erteilen von Berechtigungen für die Client-App finden Sie unter Schnellstart: Konfigurieren einer Clientanwendung für den Zugriff auf eine Web-API.

    Die folgenden Screenshots zeigen den Abschnitt zum Erteilen von Berechtigungen für die Client-App.

    • Hinzufügen einer Berechtigung:

      Abbildung der Option zum Hinzufügen einer Berechtigung.

    • Auswählen der Berechtigungen:

      Abbildung des Abschnitts zum Auswählen einer API.

    • Hinzufügen der Berechtigungen:

      Abbildung der ausgewählten Berechtigungen.

    Nachdem die Berechtigungen zugewiesen wurden, müssen Sie einen neuen geheimen Clientschlüssel für diese Anwendung erstellen, indem Sie zum Abschnitt Zertifikate & Geheimnisse wechseln. Kopieren Sie den wert des geheimen Clientschlüssels, der auf der Seite angezeigt wird, da er nicht mehr angezeigt wird. Verwenden Sie die Anwendungs-ID aus dieser App als Client-ID, das Geheimnis dieser App als geheimen Clientschlüssel und die Anwendungs-ID der ersten App als Ressourcen-ID.

SiteMinder erfordert eine ordnungsgemäß formatierte URL, https://custom_siteminder_hostname/smapi/rest/createsmsessioneinen Benutzernamen und ein Kennwort.

Die Windows-Authentifizierung ist nur im Agent-Modus verfügbar. Hierfür sind Benutzername, Domäne und Kennwort erforderlich. Sie müssen den Benutzernamen und die Domäne im Feld Benutzername in einem der folgenden Formate angeben: Domäne\Benutzername oder username@domain. Im Feld Kennwort muss ein Kennwort eingegeben werden. Für Windows-Authentifizierung muss der angegebene Benutzername auch ein Administrator auf dem Server sein, auf dem der Agent installiert ist.

Schritt 4: Metatageinstellungen

Der Connector ruft alle Metatags ihrer Stamm-URLs ab und zeigt sie an. Sie können auswählen, welche Tags für die Durchforstung eingeschlossen werden sollen.

Metatageinstellungen mit ausgewähltem Autor, Gebietsschema und anderen Tags.

Ausgewählte Metatags können verwendet werden, um benutzerdefinierte Eigenschaften zu erstellen. Außerdem können Sie sie auf der Seite Schema weiter verwalten (Abfragbar, Durchsuchbar, Abrufbar, Einschränkbar).

Schritt 5: Benutzerdefinierte Eigenschafteneinstellungen

Sie können Ihre indizierten Daten anreichern, indem Sie benutzerdefinierte Eigenschaften für die ausgewählten Metatags oder die Standardeigenschaften des Connectors erstellen.

Benutzerdefinierte Eigenschaft mit einer Regel für Teammetadaten eingerichtet.

So fügen Sie eine benutzerdefinierte Eigenschaft hinzu:

  1. Geben Sie einen Eigenschaftsnamen ein. Dieser Name wird in den Suchergebnissen dieses Connectors angezeigt.
  2. Wählen Sie für den Wert Statisch oder Zeichenfolgen-/RegEx-Zuordnung aus. Ein statischer Wert wird in allen Suchergebnissen dieses Connectors enthalten. Ein Zeichenfolgen-/RegEx-Wert variiert je nach den regeln, die Sie hinzufügen.
  3. Wählen Sie Wert bearbeiten aus.
  4. Wenn Sie einen statischen Wert ausgewählt haben, geben Sie die Zeichenfolge ein, die angezeigt werden soll.
  5. Wenn Sie einen Zeichenfolgen-/RegEx-Wert ausgewählt haben:
    • Wählen Sie im Abschnitt Ausdrücke hinzufügen in der Liste Eigenschaft eine Standardeigenschaft oder ein Metatag aus der Liste aus.
    • Geben Sie unter Beispielwert eine Zeichenfolge ein, die den Typ der Werte darstellt, die angezeigt werden können. Dieses Beispiel wird verwendet, wenn Sie eine Vorschau Ihrer Regel anzeigen.
    • Geben Sie unter Ausdruck einen RegEx-Ausdruck ein, um den Teil des Eigenschaftswerts zu definieren, der in den Suchergebnissen angezeigt werden soll. Sie können bis zu drei Ausdrücke hinzufügen. Weitere Informationen zu regulären Ausdrücken finden Sie unter Reguläre .NET-Ausdrücke , oder suchen Sie im Web nach einer Referenzanleitung für RegEx-Ausdrücke.
    • Geben Sie im Abschnitt Formel erstellen eine Formel ein, um die aus den Ausdrücken extrahierten Werte zu kombinieren.

Schritt 6: Hinzufügen von auszuschließenden URLs (optionale Durchforstungseinschränkungen)

Es gibt zwei Möglichkeiten, zu verhindern, dass Seiten durchforstet werden: Sie können sie in Ihrer robots.txt-Datei nicht zulassen oder sie der Ausschlussliste hinzufügen.

Unterstützung für robots.txt

Der Connector überprüft, ob eine robots.txt-Datei für Ihre Stammwebsite vorhanden ist. Wenn eine vorhanden ist, werden die Anweisungen in dieser Datei befolgt und eingehalten. Wenn der Connector bestimmte Seiten oder Verzeichnisse auf Ihrer Website nicht durchforsten soll, schließen Sie die Seiten oder Verzeichnisse in die Deklarationen "Nicht zulassen" in Ihre robots.txt-Datei ein.

Auszuschließende URLs hinzufügen

Sie können optional eine Ausschlussliste erstellen, um einige URLs von der Durchforstung auszuschließen, wenn diese Inhalte vertraulich sind oder sich nicht durchforsten lassen. Um eine Ausschlussliste zu erstellen, durchsuchen Sie die Stamm-URL. Sie können die ausgeschlossenen URLs während des Konfigurationsvorgangs der Liste hinzufügen.

Schritt 7: Zuweisen von Eigenschaftenbezeichnungen

Sie können jeder Bezeichnung eine Quelleigenschaft zuweisen, indem Sie aus einem Menü mit Optionen auswählen. Obwohl dieser Schritt nicht zwingend erforderlich ist, verbessert die Verwendung einiger Eigenschaftenbezeichnungen die Suchrelevanz und stellt genauere Suchergebnisse für Endbenutzer sicher.

Schritt 8: Verwalten des Schemas

Auf dem Bildschirm Schema verwalten können Sie die Schemaattribute (die Optionen sind Abfrage, Suche, Abrufen und Verfeinern) ändern, die den Standard- oder benutzerdefinierten Eigenschaften zugeordnet sind, optionale Aliase hinzufügen und die Content-Eigenschaft auswählen.

Schritt 9: Verwalten von Suchberechtigungen

Der Connector für Unternehmenswebsites unterstützt nur Suchberechtigungen, die für Alle sichtbar sind. Indizierte Daten werden in den Suchergebnissen angezeigt und sind für alle Benutzer im organization sichtbar.

Schritt 10: Festlegen des Aktualisierungszeitplans

Der Connector für Unternehmenswebsites unterstützt vollständige und inkrementelle Durchforstung. Inkrementelles Durchforsten wird nur für Verbindungen unterstützt, die mit aktiviertem Sitemap-Crawling eingerichtet wurden. Sitemap für Crawling kann in Schritt 3 ausgewählt werden.

Während eines inkrementellen Aktualisierungsintervalls werden nur URLs durchforstet, die seit der letzten inkrementellen Aktualisierung geändert wurden. In einem vollständigen Aktualisierungsintervall durchforstet der Connector alle Inhalte der Website erneut. Für eine vollständige Aktualisierung empfiehlt es sich, ein großes Aktualisierungszeitplanintervall zwischen einer und zwei Wochen festzulegen, um sicherzustellen, dass der Connector genügend Zeit hat, um die Durchforstung abzuschließen. Wir empfehlen eine geplante Aktualisierung.

Schritt 11: Überprüfen der Verbindung

Befolgen Sie die allgemeinen Setupanweisungen.

Problembehandlung

Beim Lesen des Inhalts der Website kann bei der Durchforstung einige Quellfehler auftreten, die durch die unten aufgeführten detaillierten Fehlercodes dargestellt werden. Weitere Informationen zu den Fehlertypen finden Sie auf der Seite mit den Fehlerdetails , nachdem Sie die Verbindung ausgewählt haben. Wählen Sie den Fehlercode aus, um ausführlichere Fehler anzuzeigen. Weitere Informationen finden Sie auch unter Überwachen Ihrer Verbindungen .

Detaillierter Fehlercode Fehlermeldung
6001 Die Website, die versucht wird, zu indizieren, ist nicht erreichbar.
6005 Die Quellseite, die versucht wird, zu indizieren, wurde gemäß robots.txt Konfiguration blockiert.
6008 Dns kann nicht aufgelöst werden
6009 Ausführliche Informationen zu allen clientseitigen Fehlern (außer HTTP 404, 408) finden Sie unter HTTP 4xx-Fehlercodes.
6013 Die Quellseite, die indiziert werden soll, konnte nicht gefunden werden. (HTTP 404-Fehler)
6018 Die Quellseite reagiert nicht, und für die Anforderung ist ein Timeout aufgetreten. (HTTP 408-Fehler)
6021 Die Quellseite, deren Indizierung versucht wird, weist keinen Textinhalt auf der Seite auf.
6023 Die Quellseite, die indiziert werden soll, wird nicht unterstützt (keine HTML-Seite).
6024 Die Quellseite, auf der versucht wird, zu indizieren, weist nicht unterstützte Inhalte auf.
  • Fehler 6001-6013 treten auf, wenn die Datenquelle aufgrund eines Netzwerkproblems nicht erreichbar ist oder wenn die Datenquelle selbst gelöscht, verschoben oder umbenannt wird. Überprüfen Sie, ob die angegebenen Datenquellendetails noch gültig sind.
  • Fehler 6021-6024 treten auf, wenn die Datenquelle nicht textuelle Inhalte auf der Seite enthält oder wenn die Seite kein HTML-Code ist. Überprüfen Sie die Datenquelle, und fügen Sie diese Seite der Ausschlussliste hinzu, oder ignorieren Sie den Fehler.