Azure Bilişsel Arama 'de AI 'ye girişIntroduction to AI in Azure Cognitive Search

AI zenginleştirme, görüntülerden, Blobların ve diğer yapılandırılmamış veri kaynaklarından metin ayıklamak için kullanılan Azure Bilişsel Arama Dizin oluşturma olanağından bir dizin veya bilgi deposunda daha aranabilir olmasını sağlamak için içeriği zenginleştirir.AI enrichment is a capability of Azure Cognitive Search indexing used to extract text from images, blobs, and other unstructured data sources - enriching the content to make it more searchable in an index or knowledge store. Ayıklama ve zenginleştirme, bir dizin oluşturma işlem hattına eklenen bilişsel yetenekler aracılığıyla uygulanır.Extraction and enrichment are implemented through cognitive skills attached to an indexing pipeline. Hizmette yerleşik olarak bulunan bilişsel yetenekler şu kategorilere ayrılır:Cognitive skills built into the service fall into these categories:

  • Doğal dil işleme becerileri varlık tanıma, dil algılama, anahtar tümceciği ayıklama, metin işleme ve yaklaşım algılamayıiçerir.Natural language processing skills include entity recognition, language detection, key phrase extraction, text manipulation, and sentiment detection. Bu becerilerle, yapılandırılmamış metin, bir dizinde aranabilir ve filtrelenebilir alanlar olarak eşlenmiş yeni formları kabul edebilir.With these skills, unstructured text can assume new forms, mapped as searchable and filterable fields in an index.

  • Görüntü işleme becerileri, optik karakter tanıma (OCR) ve yüz algılama, görüntü yorumu, görüntü tanıma (sık sık insanlar ve yer işaretleri) veya gibi özellikler gibi Görsel özelliklerintanımlanmasını içerir. renkler veya resim yönü.Image processing skills include Optical Character Recognition (OCR) and identification of visual features, such as facial detection, image interpretation, image recognition (famous people and landmarks) or attributes like colors or image orientation. Azure Bilişsel Arama 'in tüm sorgu yeteneklerini kullanarak aranabilir görüntü içeriğinin metin sunumlarını oluşturabilirsiniz.You can create text-representations of image content, searchable using all the query capabilities of Azure Cognitive Search.

Zenginleştirme ardışık düzen diyagramıEnrichment pipeline diagram

Azure Bilişsel Arama bilişsel yetenekler, Bilişsel Hizmetler API'si: görüntü işleme ve metin analiziiçin önceden eğitilen makine öğrenimi modellerini temel alır.Cognitive skills in Azure Cognitive Search are based on pre-trained machine learning models in Cognitive Services APIs: Computer Vision and Text Analysis.

Doğal dil ve görüntü işleme, veri alma aşaması sırasında, Azure Bilişsel Arama 'te aranabilir bir dizinde belge kompozisyonunun bir parçası haline gelmesine neden olacak şekilde uygulanır.Natural language and image processing is applied during the data ingestion phase, with results becoming part of a document's composition in a searchable index in Azure Cognitive Search. Verilerin bir Azure veri kümesi olarak kaynağı oluşturulur ve ardından ihtiyacınız olan yerleşik becerileri kullanarak bir dizin oluşturma işlem hattı üzerinden gönderilir.Data is sourced as an Azure data set and then pushed through an indexing pipeline using whichever built-in skills you need. Mimaride, yerleşik yetenekler yeterli değilse, özel işlemeyi bütünleştirmek için özel yetenekler oluşturup iliştirebilirsiniz.The architecture is extensible so if the built-in skills are not sufficient, you can create and attach custom skills to integrate custom processing. Örnekler, finans, bilimsel yayınlar veya ilaç gibi belirli bir etki alanını hedefleyen özel bir varlık modülü veya belge Sınıflandırıcısı olabilir.Examples might be a custom entity module or document classifier targeting a specific domain such as finance, scientific publications, or medicine.

Not

İşlem sıklığını artırarak, daha fazla belge ekleyerek veya daha fazla AI algoritması ekleyerek kapsamı genişlettikten sonra faturalandırılabilir bilişsel Hizmetler kaynağıeklemeniz gerekir.As you expand scope by increasing the frequency of processing, adding more documents, or adding more AI algorithms, you will need to attach a billable Cognitive Services resource. Bilişsel hizmetlerde API 'Leri çağırırken ve Azure Bilişsel Arama belge çözme aşamasının bir parçası olarak görüntü ayıklama için ücretler tahakkuk eder.Charges accrue when calling APIs in Cognitive Services, and for image extraction as part of the document-cracking stage in Azure Cognitive Search. Belgelerden metin ayıklama için herhangi bir ücret alınmaz.There are no charges for text extraction from documents.

Yerleşik yeteneklerin yürütülmesi, mevcut bilişsel Hizmetler Kullandıkça Öde fiyatıüzerinden ücretlendirilir.Execution of built-in skills is charged at the existing Cognitive Services pay-as-you go price. Görüntü ayıklama fiyatlandırması, Azure bilişsel arama fiyatlandırma sayfasındaaçıklanmaktadır.Image extraction pricing is described on the Azure Cognitive Search pricing page.

Bilişsel yetenekler ne zaman kullanılır?When to use cognitive skills

Ham içeriğiniz yapılandırılmamış metin, görüntü içeriği veya dil algılama ve çeviri gerektiren içerikler ise, yerleşik bilişsel yetenekler kullanmayı göz önünde bulundurmanız gerekir.You should consider using built-in cognitive skills if your raw content is unstructured text, image content, or content that needs language detection and translation. Yerleşik bilişsel yetenekler aracılığıyla AI uygulamak, bu içeriğin kilidini açabilir ve arama ve veri bilimi uygulamalarınızda değerini ve yardımcı programını artırır.Applying AI through the built-in cognitive skills can unlock this content, increasing its value and utility in your search and data science apps.

Ayrıca, ardışık düzen ile birleştirmek istediğiniz açık kaynaklı, üçüncü taraf veya birinci taraf kodunuz varsa, özel bir yetenek eklemeyi de düşünebilirsiniz.Additionally, you might consider adding a custom skill if you have open-source, third-party, or first-party code that you'd like to integrate into the pipeline. Çeşitli belge türlerinin salgörüme özelliklerini tanımlayan sınıflandırma modelleri bu kategoriye girer, ancak içeriğinize değer ekleyen herhangi bir paket de kullanılabilir.Classification models that identify salient characteristics of various document types fall into this category, but any package that adds value to your content could also be used.

Yerleşik yetenekler hakkında daha fazla bilgiMore about built-in skills

Yerleşik yetenekler kullanılarak derlenen bir beceri, aşağıdaki uygulama senaryolarında iyi şekilde uygundur:A skillset that's assembled using built-in skills is well suited for the following application scenarios:

  • Tam metin araması yapmak istediğiniz taranmış belgeler (JPEG).Scanned documents (JPEG) that you want to make full-text searchable. JPEG dosyalarından metin tanımlamak, ayıklamak ve almak için bir optik karakter tanıma (OCR) yeteneği ekleyebilirsiniz.You can attach an optical character recognition (OCR) skill to identify, extract, and ingest text from JPEG files.

  • Birleştirilmiş görüntü ve metin içeren PDF 'Ler.PDFs with combined image and text. PDF 'Lerdeki metin, enzenginleştirme adımlarının kullanımı olmadan dizin oluşturma sırasında ayıklanabilir, ancak görüntü ve doğal dil işlemenin eklenmesi genellikle standart bir dizin oluşturma işleminin sağladığı daha iyi bir sonuç üretebilir.Text in PDFs can be extracted during indexing without the use of enrichment steps, but the addition of image and natural language processing can often produce a better outcome than a standard indexing provides.

  • Dil algılamayı ve muhtemelen metin çevirisini uygulamak istediğiniz çok dilli içerik.Multi-lingual content against which you want to apply language detection and possibly text translation.

  • Büyük bir belgede gizli bir anlamı veya bağlamı olan içerik içeren yapılandırılmamış veya yarı yapılandırılmış belgeler.Unstructured or semi-structured documents containing content that has inherent meaning or context that is hidden in the larger document.

    Genellikle, tek bir "alan" ile paketlenmiş büyük bir içerik gövdesini içeren bloblardır.Blobs in particular often contain a large body of content that is packed into a singled "field". Bir dizin oluşturucuya görüntü ve doğal dil işleme becerileri ekleyerek, ham içerikte yer alan yeni bilgiler oluşturabilir, aksi takdirde ayrı alanlar olarak ortaya çıkmış olursunuz.By attaching image and natural language processing skills to an indexer, you can create new information that is extant in the raw content, but not otherwise surfaced as distinct fields. Kullanıma hazır kullanıma hazır yerleşik bilişsel yetenekler: anahtar tümceciği ayıklama, yaklaşım Analizi ve varlık tanıma (kişiler, kuruluşlar ve konumlar).Some ready-to-use built-in cognitive skills that can help: key phrase extraction, sentiment analysis, and entity recognition (people, organizations, and locations).

    Ayrıca, yerleşik yetenekler metin bölünmüş, birleştirme ve şekil işlemleri aracılığıyla içeriği yeniden yapılandırmak için de kullanılabilir.Additionally, built-in skills can also be used restructure content through text split, merge, and shape operations.

Özel yetenekler hakkında daha fazla bilgiMore about custom skills

Özel yetenekler, formları tanıma gibi daha karmaşık senaryoları veya özel Beceri Web arabiriminesağladığınız ve kaydırabileceğiniz bir modeli kullanarak özel varlık algılamayı destekleyebilir.Custom skills can support more complex scenarios, such as recognizing forms, or custom entity detection using a model that you provide and wrap in the custom skill web interface. Özel yeteneklerin çeşitli örnekleri, form tanıyıcı, Bing varlık arama API'sitümleştirmesi ve özel varlık tanımaiçerir.Several examples of custom skills include Forms Recognizer, integration of the Bing Entity Search API, and custom entity recognition.

Zenginleştirme işlem hattının bileşenleriComponents of an enrichment pipeline

Zenginleştirme işlem hattı, veri kaynaklarını gezinen ve uçtan uca Dizin işleme sağlayan dizin oluşturucularının temel alır.An enrichment pipeline is based on indexers that crawl data sources and provide end-to-end index processing. Yetenekler artık, tanımladığınız beceri göre belgeleri kesintiye uğratan ve zenginleştirmektedir.Skills are now attached to indexers, intercepting and enriching documents according to the skillset you define. Dizin oluşturulduktan sonra, Azure bilişsel arama tarafından desteklenen tüm sorgu türleriaracılığıyla arama istekleri aracılığıyla içeriğe erişebilirsiniz.Once indexed, you can access content via search requests through all query types supported by Azure Cognitive Search. Dizin oluşturuculardan yeni olduğunuzda, bu bölüm adımlarda size yol gösterir.If you are new to indexers, this section walks you through the steps.

1. Adım: bağlantı ve belge çözme aşamasıStep 1: Connection and document cracking phase

İşlem hattının başlangıcında, yapılandırılmamış metin veya metin olmayan içerik (örneğin, görüntü ve taranmış belge JPEG dosyaları) vardır.At the start of the pipeline, you have unstructured text or non-text content (such as image and scanned document JPEG files). Verilerin bir Dizin Oluşturucu tarafından erişilebilen bir Azure veri depolama hizmetinde bulunması gerekir.Data must exist in an Azure data storage service that can be accessed by an indexer. Dizin oluşturucular, kaynak verilerden metin ayıklamak için kaynak belgeleri "çözebilir".Indexers can "crack" source documents to extract text from source data.

Belge çözme aşamasıDocument cracking phase

Desteklenen kaynaklar Azure Blob depolama, Azure Tablo depolama, Azure SQL veritabanı ve Azure Cosmos DB içerir.Supported sources include Azure blob storage, Azure table storage, Azure SQL Database, and Azure Cosmos DB. Metin tabanlı içerik şu dosya türlerinden ayıklanabilir: PDF 'Ler, Word, PowerPoint, CSV dosyaları.Text-based content can be extracted from the following file types: PDFs, Word, PowerPoint, CSV files. Tam liste için bkz. desteklenen biçimler.For the full list, see Supported formats.

2. Adım: bilişsel beceriler ve zenginleştirme aşamasıStep 2: Cognitive skills and enrichment phase

Zenginleştirme, Atomik işlemler gerçekleştirirken bilişsel yetenekler aracılığıyla yapılır.Enrichment is through cognitive skills performing atomic operations. Örneğin, bir PDF 'den metin içeriğine sahip olduktan sonra, dizinde yerel olarak kullanılamayan yeni alanlar oluşturmak için varlık tanıma dil algılamayı veya anahtar tümceciği ayıklama uygulayabilirsiniz.For example, once you have text content from a PDF, you can apply entity recognition language detection, or key phrase extraction to produce new fields in your index that are not available natively in the source. Tamamen, işlem hattınızda kullanılan yeteneklerin koleksiyonuna bir beceridenir.Altogether, the collection of skills used in your pipeline is called a skillset.

Zenginleştirme aşamasıEnrichment phase

Bir beceri, sağladığınız yerleşik bilişsel becerileri veya özel becerileri temel alır ve beceri 'e bağlanırsınız.A skillset is based on built-in cognitive skills or custom skills you provide and connect to the skillset. Bir beceri, en düşük veya çok karmaşık olabilir ve yalnızca işleme türü değil, işlem sırasını da belirler.A skillset can be minimal or highly complex, and determines not only the type of processing, but also the order of operations. Bir beceri ve bir dizin oluşturucunun parçası olarak tanımlanan alan eşlemeleri, zenginleştirme işlem hattını tam olarak belirtir.A skillset plus the field mappings defined as part of an indexer fully specifies the enrichment pipeline. Tüm bu parçaları birlikte çekme hakkında daha fazla bilgi için bkz. beceri tanımlama.For more information about pulling all of these pieces together, see Define a skillset.

Dahili olarak, işlem hattı zenginleştirilmiş bir belge koleksiyonu oluşturur.Internally, the pipeline generates a collection of enriched documents. Zenginleştirilmiş belgelerin hangi bölümlerinin arama dizininizdeki dizinlenebilir alanlarla eşlenmeli olduğuna karar verebilirsiniz.You can decide which parts of the enriched documents should be mapped to indexable fields in your search index. Örneğin, anahtar tümceleri ayıklama ve varlık tanıma becerileri uyguladıysanız, bu yeni alanlar zenginleştirilmiş belgenin bir parçası haline gelir ve dizininizdeki alanlarla eşleştirilebilir.For example, if you applied the key phrases extraction and the entity recognition skills, then those new fields would become part of the enriched document, and they can be mapped to fields on your index. Giriş/çıkış formaları hakkında daha fazla bilgi için bkz. ek açıklamalar .See Annotations to learn more about input/output formations.

Zenginleştirmelerin kaydedileceği bir knowledgeStore öğesi eklemeAdd a knowledgeStore element to save enrichments

Arama Rest api-Version = 2019-05 -06-Preview , becerileri ' i genişleterek, Azure depolama bağlantısı ve zenginlerin nasıl depolandığını betimleyen projeksiyonlar sağlayan bir knowledgeStore tanımıyla genişletilir.Search REST api-version=2019-05-06-Preview extends skillsets with a knowledgeStore definition that provides an Azure storage connection and projections that describe how the enrichments are stored.

Bir beceri bilgi deposu eklemek, tam metin arama dışındaki senaryolar için kendi zenginleştirmelerinin bir temsilini proje olanağı sağlar.Adding a knowledge store to a skillset gives you the ability to project a representation of your enrichments for scenarios other than full text search. Daha fazla bilgi için bkz. bilgi deposu (Önizleme).For more information, see Knowledge store (preview).

3. Adım: arama dizini ve sorgu tabanlı erişimStep 3: Search index and query-based access

İşlem tamamlandığında, Azure Bilişsel Arama 'de tam metin araması yapılan, zenginleştirilmiş belgelerden oluşan bir arama dizinine sahip olursunuz.When processing is finished, you have a search index consisting of enriched documents, fully text-searchable in Azure Cognitive Search. Dizin sorgulama , geliştiricilerin ve kullanıcıların işlem hattı tarafından oluşturulan zenginleştirilmiş içeriğe nasıl erişmesinden oluşur.Querying the index is how developers and users access the enriched content generated by the pipeline.

Arama simgesiyle DizinIndex with search icon

Dizin, Azure Bilişsel Arama için oluşturabileceğiniz herhangi bir diğer benzer: özel çözümleyiciler ile destekleyebilirsiniz, benzer arama sorgularını çağırabilir, filtrelenmiş arama ekleyebilir veya arama sonuçlarını yeniden şekillendirmek için Puanlama profilleriyle denemeler yapabilirsiniz.The index is like any other you might create for Azure Cognitive Search: you can supplement with custom analyzers, invoke fuzzy search queries, add filtered search, or experiment with scoring profiles to reshape the search results.

Dizinler, Puanlama profilleri ve eş anlamlı haritalar gibi belirli bir dizine iliştirilmiş alanları, öznitelikleri ve diğer yapıları tanımlayan bir dizin şemasından oluşturulur.Indexes are generated from an index schema that defines the fields, attributes, and other constructs attached to a specific index, such as scoring profiles and synonym maps. Bir dizin tanımlandıktan ve doldurulduktan sonra, yeni ve güncelleştirilmiş kaynak belgeleri almak için artımlı olarak dizin oluşturabilirsiniz.Once an index is defined and populated, you can index incrementally to pick up new and updated source documents. Belirli değişiklikler tam yeniden oluşturma gerektirir.Certain modifications require a full rebuild. Şema tasarımı kararlı olana kadar küçük bir veri kümesi kullanmanız gerekir.You should use a small data set until the schema design is stable. Daha fazla bilgi için bkz. Yeniden dizin derleme.For more information, see How to rebuild an index.

Önemli özellikler ve kavramlarKey features and concepts

KavramConcept AçıklamaDescription BağlantılarLinks
BeceriSkillset Beceri koleksiyonu içeren bir üst düzey adlandırılmış kaynak.A top-level named resource containing a collection of skills. Bir beceri, enzenginleştirme ardışık düzeni.A skillset is the enrichment pipeline. Dizin Oluşturucu tarafından dizin oluşturma sırasında çağrılır.It is invoked during indexing by an indexer. Bkz. beceri tanımlamaSee Define a skillset
Bilişsel BeceriCognitive skill Zenginleştirme ardışık düzeninde atomik bir dönüşüm.An atomic transformation in an enrichment pipeline. Genellikle, yapısını çıkaran veya veren ve bu nedenle giriş verilerini kavramak için bir bileşendir.Often, it is a component that extracts or infers structure, and therefore augments your understanding of the input data. Neredeyse her zaman, çıktı metin tabanlıdır ve işleme, görüntü girişlerinden metin çıkaran veya üreten doğal dil işleme veya görüntü işleme olur.Almost always, the output is text-based and the processing is natural language processing or image processing that extracts or generates text from image inputs. Bir beceriye ait çıkış, dizindeki bir alanla eşleştirilebilir veya bir aşağı akış zenginleştirme için giriş olarak kullanılabilir.Output from a skill can be mapped to a field in an index, or used as an input for a downstream enrichment. Bir yetenek önceden tanımlanmış ve Microsoft tarafından sağlanıyor ya da özel: sizin tarafınızdan oluşturulup dağıtılır.A skill is either predefined and provided by Microsoft, or custom: created and deployed by you. Yerleşik bilişsel yeteneklerBuilt-in cognitive skills
Veri ayıklamaData extraction Geniş kapsamlı bir işleme sahiptir, ancak AI zenginleştirmesiyle ilgili olarak, varlık tanıma yeteneği genellikle bu bilgileri yerel olarak sağlamayan bir kaynaktaki verileri (varlık) ayıklamak için kullanılır.Covers a broad range of processing, but pertaining to AI enrichment, the entity recognition skill is most typically used to extract data (an entity) from a source that doesn't provide that information natively. Bkz. varlık tanıma becerisi ve belge ayıklama becerisi (Önizleme)See Entity Recognition Skill and Document Extraction Skill (preview)
Görüntü işlemeImage processing Bir yer işareti tanıma veya bir görüntüden metin çıkaran gibi bir görüntüden metin alır.Infers text from an image, such as the ability to recognize a landmark, or extracts text from an image. Yaygın örneklerde, taranmış bir belge (JPEG) dosyasından karakter kaldırma için OCR veya sokak işareti içeren bir fotoğrafta cadde adı tanıma gösterilebilir.Common examples include OCR for lifting characters from a scanned document (JPEG) file, or recognizing a street name in a photograph containing a street sign. Bkz. görüntü analizi beceri veya OCR becerisiSee Image Analysis Skill or OCR Skill
Doğal dil işlemeNatural language processing Öngörüler ve metin girişleri hakkındaki bilgiler için metin işleme.Text processing for insights and information about text inputs. Dil algılama, yaklaşım Analizi ve anahtar tümceciği ayıklama, doğal dil işleme altına giren yeteneklerdir.Language detection, sentiment analysis, and key phrase extraction are skills that fall under natural language processing. Bkz. anahtar ifade ayıklama yetenek, dil algılama beceri, metin çevirisi becerisi (Önizleme), yaklaşım Analizi beceriSee Key Phrase Extraction Skill, Language Detection Skill, Text Translation Skill (preview), Sentiment Analysis Skill
Belge çözmeDocument cracking Dizin oluşturma sırasında metin olmayan kaynaklardaki metin içeriğini ayıklama veya oluşturma işlemi.The process of extracting or creating text content from non-text sources during indexing. Optik karakter tanıma (OCR) bir örnektir, ancak genellikle Dizin Oluşturucu uygulama dosyalarından içerik çıkaran için temel Dizin Oluşturucu işlevselliğine başvurur.Optical character recognition (OCR) is an example, but generally it refers to core indexer functionality as the indexer extracts content from application files. Kaynak dosya konumu sağlayan veri kaynağı ve alan eşlemeleri sağlayan Dizin Oluşturucu tanımı, belge çözme içindeki anahtar faktörlerdir.The data source providing source file location, and the indexer definition providing field mappings, are both key factors in document cracking. Bkz. Dizin oluşturuculara genel bakışSee Indexers overview
BiçimlendirmesiniShaping Metin parçalarını daha büyük bir yapıda birleştirin veya daha büyük bir şekilde daha fazla aşağı akış işleme için daha büyük metin öbeklerini yönetilebilir bir boyuta bölün.Consolidate text fragments into a larger structure, or conversely break down larger text chunks into a manageable size for further downstream processing. Bkz. bağımsız yetenek, metin birleşme yeteneği, metin bölünmüş yetenekSee Shaper Skill, Text Merger Skill, Text Split Skill
Zenginleştirilmiş belgelerEnriched documents İşlem sırasında oluşturulan, son çıktı bir arama dizinine yansıtılmış bir geçişli iç yapı.A transitory internal structure, generated during processing, with final output reflected in a search index. Bir beceri, hangi enzenginlerin gerçekleştirileceğini belirler.A skillset determines which enrichments are performed. Alan eşlemeleri dizine hangi veri öğelerinin ekleneceğini belirleme.Field mappings determine which data elements are added to the index. İsteğe bağlı olarak, Depolama Gezgini, Power BI veya Azure Blob depolama alanına bağlanan herhangi bir araçla ilgili araçları kullanarak zenginleştirilmiş belgeleri kalıcı hale getirmek ve incelemek için bir bilgi deposu oluşturabilirsiniz.Optionally, you can create a knowledge store to persist and explore enriched documents using tools like Storage Explorer, Power BI, or any other tool that connects to Azure Blob storage. Bilgi deposuna bakın (Önizleme)See Knowledge store (preview)
DizinleyiciIndexer Bir dış veri kaynağından aranabilir verileri ve meta verileri çıkaran ve belge çözme için dizin ve veri kaynağınız arasındaki alan eşlemelerine göre bir dizini dolduran bir gezgin.A crawler that extracts searchable data and metadata from an external data source and populates an index based on field-to-field mappings between the index and your data source for document cracking. AI zenginleştirmelerinde, Dizin Oluşturucu bir beceri çağırır ve zenginleştirme çıktısını dizindeki hedef alanlarla ilişkilendirirken alan eşlemelerini içerir.For AI enrichments, the indexer invokes a skillset, and contains the field mappings associating enrichment output to target fields in the index. Dizin Oluşturucu tanımı, işlem hattı işlemlerine yönelik tüm yönergeleri ve başvuruları içerir ve Dizin oluşturucuyu çalıştırdığınızda işlem hattı çağrılır.The indexer definition contains all of the instructions and references for pipeline operations, and the pipeline is invoked when you run the indexer. Ek yapılandırma ile, var olan işlemeyi yeniden kullanabilir ve yalnızca değiştirilen adımları ve becerileri çalıştırabilirsiniz.With additional configuration, you can re-use existing processing and execute only those steps and skills that are changed. Bkz. Dizin oluşturucular ve artımlı dizin oluşturma (Önizleme).See Indexers and Incremental indexing (preview).
Veri kaynağıData Source Azure üzerinde desteklenen türlerin dış veri kaynağına bağlanmak için bir Dizin Oluşturucu tarafından kullanılan nesne.An object used by an indexer to connect to an external data source of supported types on Azure. Bkz. Dizin oluşturuculara genel bakışSee Indexers overview
Dizin oluşturmaIndex Alan yapısını ve kullanımını tanımlayan bir dizin şemasından oluşturulan Azure Bilişsel Arama kalıcı arama dizini.A persisted search index in Azure Cognitive Search, built from an index schema that defines field structure and usage. Bkz. temel dizin oluşturmaSee Create a basic index

Nereden başlamalıyım?Where do I start?

1. Adım: Azure bilişsel arama kaynağı oluşturmaStep 1: Create an Azure Cognitive Search resource

2. Adım: bazı hızlı başlangıçlara ve uygulamalı deneyim için örneklere deneme yapınStep 2: Try some quickstarts and examples for hands-on experience

Ücretsiz hizmetin öğrenme amacıyla önerilmesini öneririz, ancak ücretsiz işlem sayısı günde 20 belge ile sınırlıdır.We recommend the Free service for learning purposes, however the number of free transactions is limited to 20 documents per day. Hem hızlı başlangıç hem de Öğreticiyi bir gün içinde çalıştırmak için, her iki alıştırmada de sığdırabilmeniz için daha küçük bir dosya kümesi (10 belge) kullanın veya bir sayacı sıfıra geri almak için hızlı başlangıçta veya öğreticide kullandığınız dizin oluşturucuyu silebilirsiniz.To run both the quickstart and tutorial in one day, use a smaller file set (10 documents) so that you can fit in both exercises, or delete the indexer you used in the quickstart or tutorial to rest the counter to zero.

3. Adım: API 'YI gözden geçirmeStep 3: Review the API

REST api-version=2019-05-06 istekleri veya .NET SDK 'sını kullanabilirsiniz.You can use REST api-version=2019-05-06 on requests or the .NET SDK. Bilgi deposunu araştırıyorsanız, bunun yerine önizleme REST API kullanın (api-version=2019-05-06-Preview).If you are exploring knowledge store, use the preview REST API instead (api-version=2019-05-06-Preview).

Bu adım, bir AI zenginleştirme çözümü oluşturmak için REST API 'Lerini kullanır.This step uses the REST APIs to build an AI enrichment solution. AI zenginleştirme için yalnızca iki API eklenir veya genişletilir.Only two APIs are added or extended for AI enrichment. Diğer API 'Ler, genel olarak kullanılabilen sürümlerle aynı söz dizimine sahiptir.Other APIs have the same syntax as the generally available versions.

REST APIREST API AçıklamaDescription
Veri Kaynağı OluşturmaCreate Data Source Zenginleştirilmiş belgeler oluşturmak için kullanılan kaynak verileri sağlayan bir dış veri kaynağını tanımlayan kaynak.A resource identifying an external data source providing source data used to create enriched documents.
Beceri oluşturma (api-Version = 2019-05-06)Create Skillset (api-version=2019-05-06) Bu API AI zenginleştirme 'ya özeldir.This API is specific to AI enrichment. Dizin oluşturma sırasında bir zenginleştirme ardışık düzeninde kullanılan yerleşik yeteneklerin ve özel bilişsel yeteneklerin kullanımını koordine eden bir kaynaktır.It is a resource coordinating the use of built-in skills and custom cognitive skills used in an enrichment pipeline during indexing.
Dizin OluşturCreate Index Azure Bilişsel Arama dizinini ifade eden bir şema.A schema expressing an Azure Cognitive Search index. Dizindeki alanlar, kaynak verilerdeki alanlara veya zenginleştirme aşamasında üretilen alanlara (örneğin, varlık tanıma tarafından oluşturulan kuruluş adları için bir alan) eşlenir.Fields in the index map to fields in source data or to fields manufactured during the enrichment phase (for example, a field for organization names created by entity recognition).
Dizin Oluşturucu oluştur (api-Version = 2019-05-06)Create Indexer (api-version=2019-05-06) Dizin oluşturma sırasında kullanılan bileşenleri tanımlayan kaynak: veri kaynağı, Beceri, kaynak ve ara veri yapılarından hedef dizine ve dizinin kendisi de dahil olmak üzere.A resource defining components used during indexing: including a data source, a skillset, field associations from source and intermediary data structures to target index, and the index itself. Dizin oluşturucuyu çalıştırmak, veri alımı ve zenginleştirme için tetikleyiciydi.Running the indexer is the trigger for data ingestion and enrichment. Çıktı, kaynak verilerle doldurulan, becerileri aracılığıyla zenginleştirilmiş, Dizin şemasını temel alan bir arama dizinidir.The output is a search index based on the index schema, populated with source data, enriched through skillsets. Bu var olan API, Beceri özelliği dahil olmak üzere bilişsel arama senaryolarında genişletilir.This existing API is extended for cognitive search scenarios with the inclusion of a skillset property.

Denetim listesi: tipik bir iş akışıChecklist: A typical workflow

  1. Azure Kaynak verilerinizi bir temsili örneğine alt küme haline koyun.Subset your Azure source data into a representative sample. Dizin oluşturma zaman alır, bu nedenle küçük, temsili bir veri kümesiyle başlar ve sonra çözüm malarınız kadar artımlı olarak oluşturun.Indexing takes time so start with a small, representative data set and then build it up incrementally as your solution matures.

  2. Veri alımı için bir bağlantı dizesi sağlamak üzere Azure Bilişsel Arama 'de bir veri kaynağı nesnesi oluşturun.Create a data source object in Azure Cognitive Search to provide a connection string for data retrieval.

  3. Zenginleştirme adımları ile bir beceri oluşturun.Create a skillset with enrichment steps.

  4. Dizin şemasınıtanımlayın.Define the index schema. Alanlar koleksiyonu, kaynak verilerden alanlar içerir.The Fields collection includes fields from source data. Ayrıca, zenginleştirme sırasında oluşturulan içerikler için oluşturulan değerleri tutmak üzere ek alanlar da saplama yapmanız gerekir.You should also stub out additional fields to hold generated values for content created during enrichment.

  5. Veri kaynağına, beceri ve dizine başvuran Dizin oluşturucuyu tanımlayın.Define the indexer referencing the data source, skillset, and index.

  6. Dizin Oluşturucu içinde Outputfieldmappingsekleyin.Within the indexer, add outputFieldMappings. Bu bölüm, Beceri (adım 3 ' te) çıktısını Dizin şemasındaki (adım 4 ' te) giriş alanlarına eşler.This section maps output from the skillset (in step 3) to the inputs fields in the index schema (in step 4).

  7. Azure Bilişsel Arama Dizin oluşturucuyu ifade etmek için az önce oluşturduğunuz (istek gövdesinde bir Dizin Oluşturucu tanımına sahip bir POST isteği) Create Indexer isteği gönderin.Send Create Indexer request you just created (a POST request with an indexer definition in the request body) to express the indexer in Azure Cognitive Search. Bu adım, işlem hattını çağırarak Dizin oluşturucuyu nasıl çalıştıracağınızı açıklamaktadır.This step is how you run the indexer, invoking the pipeline.

  8. Sonuçları değerlendirmek için sorguları çalıştırın ve becerileri, şema veya Dizin Oluşturucu yapılandırmasını güncelleştirmek için kodu değiştirin.Run queries to evaluate results and modify code to update skillsets, schema, or indexer configuration.

  9. İşlem hattını yeniden oluşturmadan önce Dizin oluşturucuyu sıfırlayın .Reset the indexer before rebuilding the pipeline.

Belirli sorular veya sorunlar hakkında daha fazla bilgi için bkz. sorun giderme ipuçları.For more information about specific questions or problems, see Troubleshooting tips.

Sonraki adımlarNext steps