Enterprise-Websites-ConnectorEnterprise websites connector

Mit dem Enterprise-Website-Konnektor kann Ihre Organisation Artikel und Inhalte von den internen Websites aus indizieren.With the Enterprise websites connector, your organization can index articles and content from its internal-facing websites. Nachdem Sie den Connector konfiguriert und Inhalte von der Website synchronisiert haben, können Endbenutzer nach diesen Inhalten von einem beliebigen Microsoft Search-Client aus suchen.After you configure the connector and sync content from the website, end users can search for that content from any Microsoft Search client.

Dieser Artikel richtet sich an Microsoft 365 -Administratoren oder Personen, die einen Connector für Unternehmenswebsites konfigurieren, ausführen und überwachen.This article is for Microsoft 365 administrators or anyone who configures, runs, and monitors an Enterprise websites connector. Es wird erläutert, wie Sie die Connector-und connectorfunktionen, Einschränkungen und Techniken zur Problembehandlung konfigurieren.It explains how to configure your connector and connector capabilities, limitations, and troubleshooting techniques.

Herstellen einer Verbindung mit einer DatenquelleConnect to a data source

Um eine Verbindung mit Ihrer Datenquelle herzustellen, müssen Sie die Stamm-URL der Website und die Art der Authentifizierung ausfüllen, die Sie verwenden möchten: keine, Standardauthentifizierung oder OAuth 2,0 mit Azure Active Directory (Azure AD).To connect to your data source, you need to fill in the root URL of the website and the type of authentication you'd like to use: None, Basic Authentication, or OAuth 2.0 with Azure Active Directory (Azure AD).

URLURL

Verwenden Sie das Feld URL, um den Stamm der Website anzugeben, die Sie crawlen möchten.Use the URL field to specify the root of the website that you'd like to crawl. Der Connector für Unternehmenswebsites verwendet diese URL als Ausgangspunkt und befolgt alle Links von dieser URL für die Durchforstung.The enterprise websites connector will use this URL as the starting point and follow all the links from this URL for its crawl.

AuthentifizierungAuthentication

Für die Standardauthentifizierung ist ein Benutzername und ein Kennwort erforderlich.Basic Authentication requires a username and password. Erstellen Sie dieses bot-Konto mithilfe des Microsoft 365 Admin Center.Create this bot account by using the Microsoft 365 admin center.

OAuth 2,0 mit Azure AD erfordert eine Ressourcen-ID, eine Client-ID und einen geheimen Client Schlüssel.OAuth 2.0 with Azure AD requires a resource ID, Client ID, and Client Secret.

Weitere Informationen finden Sie unter Autorisieren des Zugriffs auf Azure Active Directory Webanwendungen mithilfe des OAuth 2,0-Code Zuteilungs Flusses.For more information, see Authorize access to Azure Active Directory web applications using OAuth 2.0 code grant flow. Registrieren Sie sich mit den folgenden Werten:Register with the following values:

Name: Microsoft-SucheName: Microsoft Search
Redirect_URI:https://gcs.office.com/v1.0/admin/oauth/callbackRedirect_URI: https://gcs.office.com/v1.0/admin/oauth/callback

Um die Werte für die Ressource, client_id und client_secret abzurufen, wechseln Sie zum Anfordern eines Zugriffstokens mithilfe des Autorisierungscodes auf der Webseite der Umleitungs-URL.To get the values for the resource, client_id, and client_secret, go to Use the authorization code to request an access token on the redirect URL webpage.

Weitere Informationen finden Sie unter Quick Start: Registrieren einer Anwendung mit der Microsoft Identity-Plattform.For even more information, see Quickstart: Register an application with the Microsoft identity platform.

Hinzufügen von URLs zum AusschließenAdd URLs to exclude

Sie können optional eine Ausschlussliste erstellen, um einige URLs von der Durchforstung auszuschließen, wenn dieser Inhalt vertraulich ist oder nicht durchforstet werden sollte.You can optionally create an Exclusion list to exclude some URLs from getting crawled if that content is sensitive or not worth crawling. Um eine Ausschlussliste zu erstellen, navigieren Sie durch die Stamm-URL.To create an exclusion list, browse through the root URL. Sie haben die Möglichkeit, die ausgeschlossenen URLs während des Konfigurationsprozesses der Liste hinzuzufügen.You have the option to add the excluded URLs to the list during the configuration process.

Verwalten von SuchberechtigungenManage search permissions

Der Connector für Unternehmenswebsites unterstützt nur Suchberechtigungen, die für alle sichtbar sind.The Enterprise websites connector only supports search permissions visible to Everyone. Indizierte Daten werden in den Suchergebnissen angezeigt und sind für alle Benutzer in der Organisation sichtbar.Indexed data appears in the search results and is visible to all users in the organization.

Zuweisen von Eigenschaften BezeichnungenAssign property labels

Sie können jeder Beschriftung eine Source-Eigenschaft zuweisen, indem Sie in einem Menü mit Optionen auswählen.You can assign a source property to each label by choosing from a menu of options. Dieser Schritt ist zwar nicht zwingend erforderlich, aber einige Eigenschaften Bezeichnungen verbessern die Suchrelevanz und stellen genauere Suchergebnisse für Endbenutzer sicher.While this step is not mandatory, having some property labels will improve the search relevance and ensure more accurate search results for end users.

Schema verwaltenManage schema

Auf dem Bildschirm " Schema verwalten " haben Sie die Möglichkeit, die den Eigenschaften zugeordneten Schema Attribute ( abfragbar, durchsuchbar, abrufbar und verfeinernd) zu ändern, optionale Aliase hinzuzufügen und die Content -Eigenschaft auszuwählen.On the Manage Schema screen, you have the option to change the schema attributes (queryable, searchable, retrievable, and refinable) associated with the properties, add optional aliases, and choose the Content property.

Festlegen des AktualisierungszeitplansSet the refresh schedule

Der Connector für Unternehmenswebsites unterstützt nur eine vollständige Aktualisierung.The Enterprise websites connector only supports a full refresh. Dies bedeutet, dass der Connector während jeder Aktualisierung alle Inhalte der Website erneut crawlt.This means that the connector will recrawl all the website's content during every refresh. Um sicherzustellen, dass der Connector genügend Zeit zum durchforsten des Inhalts erhält, wird empfohlen, ein Intervall für eine große Aktualisierungsplanung festzulegen.To make sure the connector gets enough time to crawl the content, we recommend that you set a large refresh schedule interval. Wir empfehlen eine geplante Aktualisierung zwischen einer und zwei Wochen.We recommend a scheduled refresh between one and two weeks.

ProblembehandlungTroubleshooting

Beim Lesen des Inhalts der Website kann bei der Durchforstung einige Quellfehler auftreten, die durch die detaillierten Fehlercodes unten dargestellt werden.When reading the website's content, the crawl may encounter some source errors which are represented by the detailed error codes below. Wenn Sie weitere Informationen zu den Fehlertypen erhalten möchten, wechseln Sie zur Seite Fehlerdetails , nachdem Sie die Verbindung ausgewählt haben.To get more information on the types of errors, go to the error details page after selecting the connection. Klicken Sie auf den Fehlercode , um ausführlichere Fehler anzuzeigen.Click on the error code to see more detailed errors. Weitere Informationen finden Sie auch unter Manage Your Connector .Also refer to Manage your connector to learn more.

Detaillierter FehlercodeDetailed Error code FehlermeldungError message
60016001 Die Website, die zum Indizieren versucht wird, ist nicht erreichbarThe site that is being tried to index is not reachable
60056005 Die Quellseite, die versucht wird, den Index zu indizieren, wurde gemäß robots.txt Konfiguration blockiert.The source page that is being tried to index has been blocked by as per robots.txt configuration.
60086008 DNS konnte nicht aufgelöst werdenUnable to resolve the DNS
60096009 Für alle clientseitigen Fehler (mit Ausnahme von HTTP 404, 408) finden Sie weitere Informationen unter http 4xx-Fehlercodes.For all client side errors (Except HTTP 404, 408), please refer to HTTP 4xx error codes for details.
60136013 Die Quellseite, die zum Indizieren versucht wird, konnte nicht gefunden werden.The source page that is being tried to index could not be found. (HTTP 404-Fehler)(HTTP 404 error)
60186018 Die Quellseite reagiert nicht, und für die Anforderung ist ein Timeout aufgetreten. (Http 408-Fehler)The source page is not responding, and the request has timed out. (HTTP 408 error)
60216021 Auf der Quellseite, die versucht wird, zu indizieren, sind keine Textinhalte auf der Seite zu finden.The source page that is being tried to index has no textual content on the page.
60236023 Die Quellseite, die versucht wird, zu indizieren, wird nicht unterstützt (keine HTML-Seite)The source page that is being tried to index is unsupported (not a HTML page)
60246024 Die Quellseite, die versucht wird, zu indizieren, enthält nicht unterstützte Inhalte.The source page that is being tried to index has unsupported content.
  • Fehler 6001-6013 tritt auf, wenn die Datenquelle aufgrund eines Netzwerkproblems nicht erreichbar ist oder wenn die Datenquelle selbst gelöscht, verschoben oder umbenannt wird.Errors 6001-6013 occur when the data source is not reachable due to a network issue or when the data source itself is deleted, moved, or renamed. Überprüfen, ob die bereitgestellten Datenquellendetails noch gültig sind.Check if the data source details provided are still valid.
  • Fehler 6021-6024 Fehler tritt auf, wenn die Datenquelle nicht textliche Inhalte auf der Seite enthält oder wenn es sich bei der Seite nicht um einen HTML-Code handelt.Errors 6021-6024 error occur when the data source contains non-textual content on the page or when the page is not an HTML. Überprüfen Sie die Datenquelle, und fügen Sie diese Seite in Ausschlussliste hinzu, oder ignorieren Sie den Fehler.Please check the data source and add this page in exclusion list or ignore the error.

EinschränkungenLimitations

Der Connector für Unternehmenswebsites unterstützt die Suche von Daten auf dynamischen Webseiten nicht.The Enterprise websites connector doesn't support searching data on dynamic webpages. Beispiele für diese Webseiten Leben in Inhaltsverwaltungssystemen wie Confluence und Unily oder in Datenbanken, in denen Websiteinhalte gespeichert sind.Examples of those webpages live in content management systems like Confluence and Unily or databases that store website content.