Azure Bilişsel Arama Dizin oluşturucularIndexers in Azure Cognitive Search

Azure Bilişsel Arama 'de bir Dizin Oluşturucu , bir dış Azure veri kaynağından aranabilir verileri ve meta verileri çıkaran ve dizin ile veri kaynağınız arasındaki alandan alana eşlemeleri temel alan bir gezgin.An indexer in Azure Cognitive Search is a crawler that extracts searchable data and metadata from an external Azure data source and populates an index based on field-to-field mappings between the index and your data source. Bu yaklaşım bazen ' çekme modeli ' olarak adlandırılır, çünkü hizmet verileri bir dizine ekleyen herhangi bir kod yazmak zorunda kalmadan içine veri çeker.This approach is sometimes referred to as a 'pull model' because the service pulls data in without you having to write any code that adds data to an index.

Dizin oluşturucular, Azure, Cosmos DB, Azure Tablo depolama ve BLOB depolama alanı SQL Server bireysel dizin oluşturucular ile veri kaynağı türlerini veya platformları temel alır.Indexers are based on data source types or platforms, with individual indexers for SQL Server on Azure, Cosmos DB, Azure Table Storage and Blob Storage. BLOB depolama Dizin oluşturucular, blob içerik türlerine özgü ek özelliklere sahiptir.Blob storage indexers have additional properties specific to blob content types.

Bir dizin oluşturucusunu yalnızca veri alımı amacıyla kullanabilir veya dizininize alanların yalnızca bazılarını yüklemek için bir dizin oluşturucu kullanımını içeren bir teknikler birleşimini kullanabilirsiniz.You can use an indexer as the sole means for data ingestion, or use a combination of techniques that include the use of an indexer for loading just some of the fields in your index.

Dizin oluşturucularını isteğe bağlı olarak veya her beş dakikada bir çalışan yinelenen bir veri yenileme zamanlaması üzerinde çalıştırabilirsiniz.You can run indexers on demand or on a recurring data refresh schedule that runs as often as every five minutes. Daha sık güncellemeler, hem Azure Bilişsel Arama hem de dış veri kaynağınızdaki verileri eşzamanlı olarak güncelleştiren bir anında iletme modeli gerektirir.More frequent updates require a push model that simultaneously updates data in both Azure Cognitive Search and your external data source.

Dizin oluşturucular oluşturma ve yönetme yaklaşımlarıApproaches for creating and managing indexers

Dizin oluşturucuları aşağıdaki yaklaşımlarla oluşturabilir ve yönetebilirsiniz:You can create and manage indexers using these approaches:

Başlangıçta, yeni bir dizin oluşturucu bir önizleme özelliği olarak duyurulur.Initially, a new indexer is announced as a preview feature. Önizleme özellikleri API'lere (REST ve .NET) eklenir ve ardından genel kullanıma açık hale geldiklerinde portala entegre edilir.Preview features are introduced in APIs (REST and .NET) and then integrated into the portal after graduating to general availability. Yeni bir dizin oluşturucuyu değerlendiriyorsanız kod yazmayı planlamanız gerekir.If you're evaluating a new indexer, you should plan on writing code.

İzinlerPermissions

Durum ve tanımlar için istekleri al da dahil olmak üzere dizin oluşturucularla ilgili tüm işlemler, yönetici API anahtarıgerektirir.All operations related to indexers, including GET requests for status or definitions, require an admin api-key.

Desteklenen veri kaynaklarıSupported data sources

Dizin oluşturucular Azure 'da veri depolarında gezinme.Indexers crawl data stores on Azure.

Temel yapılandırma adımlarıBasic configuration steps

Dizin oluşturucular veri kaynağına özgü özellikler sunabilir.Indexers can offer features that are unique to the data source. Bu bakımdan, dizin oluşturucu veya veri kaynağı yapılandırmasının bazı boyutları dizin oluşturucu türüne göre farklılık gösterir.In this respect, some aspects of indexer or data source configuration will vary by indexer type. Bununla birlikte, tüm dizin oluşturucuların temel birleşimi ve gereksinimleri aynıdır.However, all indexers share the same basic composition and requirements. Tüm dizin oluşturucularda ortak olan adımlar aşağıda ele alınmıştır.Steps that are common to all indexers are covered below.

1. Adım: Veri kaynağı oluşturmaStep 1: Create a data source

Bir dizin Oluşturucu veri kaynağı nesnesinden veri kaynağı bağlantısı edinir.An indexer obtains data source connection from a data source object. Veri kaynağı tanımı, bir bağlantı dizesi ve muhtemelen kimlik bilgileri sağlar.The data source definition provides a connection string and possibly credentials. Kaynağı oluşturmak için Create Datasource REST API veya DataSource sınıfını çağırın.Call the Create Datasource REST API or DataSource class to create the resource.

Veri kaynakları, bunları kullanan dizin oluşturuculardan bağımsız olarak yapılandırılır ve yönetilir. Bu da bir veri kaynağının, bir seferde birden çok dizin yüklemek amacıyla birden çok dizin oluşturucu tarafından kullanılabileceği anlamına gelir.Data sources are configured and managed independently of the indexers that use them, which means a data source can be used by multiple indexers to load more than one index at a time.

2. Adım: Dizin oluşturmaStep 2: Create an index

Dizin oluşturucu veri alımıyla ilgili bazı görevleri otomatikleştirir, ancak dizin oluşturma genellikle bu görevlerden biri değildir.An indexer will automate some tasks related to data ingestion, but creating an index is generally not one of them. Bir önkoşul olarak dış veri kaynağınızdaki alanlarla eşleşen alanlara sahip önceden tanımlı bir dizininiz olmalıdır.As a prerequisite, you must have a predefined index with fields that match those in your external data source. Alanların ad ve veri türüyle eşleşmesi gerekir.Fields need to match by name and data type. Dizini yapılandırma hakkında daha fazla bilgi için bkz. Dizin oluşturma (Azure Bilişsel Arama REST API) veya Dizin sınıfı.For more information about structuring an index, see Create an Index (Azure Cognitive Search REST API) or Index class. Alan ilişkilendirmelerinde yardım için bkz. Azure bilişsel arama Dizin oluşturucularda alan eşlemeleri.For help with field associations, see Field mappings in Azure Cognitive Search indexers.

İpucu

Dizin oluşturucular sizin için dizin oluşturamasa da, portaldaki Verileri içeri aktarma sihirbazı bu işlem için size yardımcı olabilir.Although indexers cannot generate an index for you, the Import data wizard in the portal can help. Çoğu durumda, sihirbaz, kaynaktaki mevcut meta verilerden dizin şeması çıkarsayarak, sihirbaz etkin olduğunda satır içinde düzenleyebileceğiniz geçici bir dizin şeması sunar.In most cases, the wizard can infer an index schema from existing metadata in the source, presenting a preliminary index schema which you can edit in-line while the wizard is active. Hizmet için sihirbaz oluşturulduğunda, portalda yapılabilecek ayrıntılı düzenlemeler, genellikle yeni alanlar eklemeyle sınırlıdır.Once the index is created on the service, further edits in the portal are mostly limited to adding new fields. Sihirbaz dizin oluşturmak için uygun olsa da, düzenlemek için uygun değildir.Consider the wizard for creating, but not revising, an index. Uygulama yaparak öğrenmek için, portal kılavuzundaki adımları izleyin.For hands-on learning, step through the portal walkthrough.

3. Adım: Dizin oluşturucuyu oluşturma ve zamanlamaStep 3: Create and schedule the indexer

Dizin Oluşturucu tanımı, veri alımı ile ilgili tüm öğeleri birlikte getiren bir yapıdır.The indexer definition is a construct that brings together all of the elements related to data ingestion. Gerekli öğeler bir veri kaynağı ve dizin içerir.Required elements include a data source and index. İsteğe bağlı öğeler bir zamanlama ve alan eşlemeleri içerir.Optional elements include a schedule and field mappings. Alan eşleme yalnızca kaynak alanları ve dizin alanları açıkça karşılık geliyorsa isteğe bağlıdır.Field mapping are only optional if source fields and index fields clearly correspond. Bir dizin oluşturucu, aynı abonelikten olduğu sürece başka bir hizmetteki bir veri kaynağına başvurabilir.An indexer can reference a data source from another service, as long as that data source is from the same subscription. Dizin oluşturucuyu yapılandırma hakkında daha fazla bilgi için bkz. Dizin Oluşturucu oluşturma (Azure Bilişsel Arama REST API).For more information about structuring an indexer, see Create Indexer (Azure Cognitive Search REST API).

Dizin oluşturucuyu isteğe bağlı olarak çalıştırRun indexers on-demand

Dizin oluşturma zamanlaması yaygın olsa da, Çalıştır komutukullanılarak bir Dizin Oluşturucu da isteğe bağlı olarak çağrılabilir:While it's common to schedule indexing, an indexer can also be invoked on demand using the Run command:

POST https://[service name].search.windows.net/indexers/[indexer name]/run?api-version=2019-05-06
api-key: [Search service admin key]

Not

Run API 'SI başarıyla döndüğünde, Dizin Oluşturucu çağrısı zamanlandı, ancak gerçek işlem zaman uyumsuz olarak gerçekleşir.When Run API returns successfully, the indexer invocation has been scheduled, but the actual processing happens asynchronously.

Dizin Oluşturucu durumunu portalda veya Dizin Oluşturucu durumunu Al API 'SI aracılığıyla izleyebilirsiniz.You can monitor the indexer status in the portal or through Get Indexer Status API.

Dizin Oluşturucu durumunu alGet indexer status

Bir dizin oluşturucunun durum ve yürütme geçmişini Get Indexer durum komutuylaalabilirsiniz:You can retrieve the status and execution history of an indexer through the Get Indexer Status command:

GET https://[service name].search.windows.net/indexers/[indexer name]/status?api-version=2019-05-06
api-key: [Search service admin key]

Yanıt genel Dizin Oluşturucu durumunu, son (veya sürmekte olan) Dizin Oluşturucu çağrısını ve son Dizin Oluşturucu etkinleştirmeleri geçmişini içerir.The response contains overall indexer status, the last (or in-progress) indexer invocation, and the history of recent indexer invocations.

{
    "status":"running",
    "lastResult": {
        "status":"success",
        "errorMessage":null,
        "startTime":"2018-11-26T03:37:18.853Z",
        "endTime":"2018-11-26T03:37:19.012Z",
        "errors":[],
        "itemsProcessed":11,
        "itemsFailed":0,
        "initialTrackingState":null,
        "finalTrackingState":null
     },
    "executionHistory":[ {
        "status":"success",
         "errorMessage":null,
        "startTime":"2018-11-26T03:37:18.853Z",
        "endTime":"2018-11-26T03:37:19.012Z",
        "errors":[],
        "itemsProcessed":11,
        "itemsFailed":0,
        "initialTrackingState":null,
        "finalTrackingState":null
    }]
}

Yürütme geçmişi, geriye doğru kronolojik düzende sıralanan en son tamamlanan yürütme sayısı olan 50 ' i içerir (Bu nedenle, en son yürütme yanıtta ilk kez gelir).Execution history contains up to the 50 most recent completed executions, which are sorted in reverse chronological order (so the latest execution comes first in the response).

Sonraki adımlarNext steps

Artık temel fikri anladığınıza göre, atmanız gereken bir sonraki adım her bir veri kaynağı türüne özgü gereksinimleri ve görevleri incelemektir.Now that you have the basic idea, the next step is to review requirements and tasks specific to each data source type.