Azure Bilişsel Arama için veri içeri aktarma SihirbazıImport data wizard for Azure Cognitive Search

Azure portal, prototip yazmak ve bir dizin yüklemek için Azure Bilişsel Arama panosu 'nda veri Içeri aktarma Sihirbazı sağlar.The Azure portal provides an Import data wizard on the Azure Cognitive Search dashboard for prototyping and loading an index. Bu makalede, Sihirbazı, girişleri ve çıkışları ve bazı kullanım bilgilerini kullanma avantajları ve sınırlamaları ele alınmaktadır.This article covers advantages and limitations of using the wizard, inputs and outputs, and some usage information. Yerleşik örnek verileri kullanarak sihirbazda adım adım yönergeler için Azure portal hızlı başlangıcı kullanılarak Azure bilişsel arama dizini oluşturma bölümüne bakın.For hands-on guidance in stepping through the wizard using built-in sample data, see the Create an Azure Cognitive Search index using the Azure portal quickstart.

Bu sihirbazın gerçekleştirdiği işlemler şunlardır:Operations that this wizard performs include:

1-desteklenen bir Azure veri kaynağına bağlanın.1 - Connect to a supported Azure data source.

2-kaynak verileri örnekleyerek çıkartılan bir dizin şeması oluşturun.2 - Create an index schema, inferred by sampling source data.

3-isteğe bağlı olarak, içerik ve yapıyı ayıklamak veya oluşturmak için AI zenginleştirmelerinin ekleyin.3 - Optionally, add AI enrichments to extract or generate content and structure.

4-nesneleri oluşturmak, verileri içeri aktarmak, bir zamanlama ve diğer yapılandırma seçeneklerini ayarlamak için Sihirbazı çalıştırın.4 - Run the wizard to create objects, import data, set a schedule and other configuration options.

Sihirbaz, arama hizmetinize kaydedilen, program aracılığıyla veya diğer araçlara erişebileceğiniz birçok nesne çıkarır.The wizard outputs a number of objects that are saved to your search service, which you can access programatically or in other tools.

Avantajlar ve sınırlamalarAdvantages and limitations

Herhangi bir kod yazmadan önce, prototip oluşturma ve kavram kanıtı testi için Sihirbazı kullanabilirsiniz.Before you write any code, you can use the wizard for prototyping and proof-of-concept testing. Sihirbaz dış veri kaynaklarına bağlanır, ilk dizin oluşturmak için verileri örnekler ve sonra verileri JSON belgeleri olarak Azure Bilişsel Arama bir dizine aktarır.The wizard connects to external data sources, samples the data to create an initial index, and then imports the data as JSON documents into an index on Azure Cognitive Search.

Örnekleme, bir dizin şemasının Çıkarsanan ve bazı sınırlamaları olan bir işlemdir.Sampling is the process by which an index schema is inferred and it has some limitations. Veri kaynağı oluşturulduğunda, sihirbaz, veri kaynağının bir parçası olan sütunları belirlemek için bir belge örneği seçer.When the data source is created, the wizard picks a sample of documents to decide what columns are part of the data source. Çok büyük veri kaynakları için saat sürebileceği için tüm dosyalar okunmaz.Not all files are read, as this could potentially take hours for very large data sources. Belge seçimi verildiğinde, alan adı veya türü gibi kaynak meta veriler dizin şemasında bir alan koleksiyonu oluşturmak için kullanılır.Given a selection of documents, source metadata, such as field name or type, is used to create a fields collection in an index schema. Kaynak verilerin karmaşıklığına bağlı olarak, ilk şemayı doğruluk için düzenlemeniz veya daha fazla işlem için uzatmanız gerekebilir.Depending on the complexity of source data, you might need to edit the initial schema for accuracy, or extend it for completeness. Değişikliklerinizi Dizin tanımı sayfasında satır içi yapabilirsiniz.You can make your changes inline on the index definition page.

Genel olarak, Sihirbazı kullanmanın avantajları net değildir: gereksinimler karşılandığında, birkaç dakika içinde bir sorgulanabilir Dizin prototipi oluşturabilirsiniz.Overall, the advantages of using the wizard are clear: as long as requirements are met, you can prototype a queryable index within minutes. Verilerin JSON belgeleri olarak sağlanması gibi bazı karmaşıklıklardan bazıları sihirbaz tarafından işlenir.Some of the complexities of indexing, such as providing data as JSON documents, are handled by the wizard.

Bilinen sınırlamalar aşağıdaki gibi özetlenir:Known limitations are summarized as follows:

  • Sihirbaz yinelemeyi veya yeniden kullanmayı desteklemez.The wizard does not support iteration or reuse. Sihirbaz aracılığıyla geçen her geçişte yeni bir dizin, beceri ve Dizin Oluşturucu yapılandırması oluşturulur.Each pass through the wizard creates a new index, skillset, and indexer configuration. Yalnızca veri kaynakları kalıcı hale getirilir ve sihirbaz içinde yeniden kullanılabilir.Only data sources can be persisted and reused within the wizard. Diğer nesneleri düzenlemek veya iyileştirmek için, yapıları almak ve değiştirmek için REST API 'Lerini veya .NET SDK 'sını kullanmanız gerekir.To edit or refine other objects, you have to use the REST APIs or .NET SDK to retrieve and modify the structures.

  • Kaynak içeriğin desteklenen bir Azure veri kaynağında bulunması gerekir.Source content must reside in a supported Azure data source.

  • Örnekleme, kaynak verilerinin bir alt kümesi üzerinde.Sampling is over a subset of source data. Büyük veri kaynakları için sihirbazın alanları kaçırmak mümkündür.For large data sources, it's possible for the wizard to miss fields. Örnekleme yetersizse şemayı genişletmeniz veya çıkarılan veri türlerini düzeltmeniz gerekebilir.You might need to extend the schema, or correct the inferred data types, if sampling is insufficient.

  • Portalda kullanıma sunulan AI zenginleştirme, birkaç yerleşik becerilerle sınırlıdır.AI enrichment, as exposed in the portal, is limited to a few built-in skills.

  • Sihirbaz tarafından oluşturulabilen bir bilgi deposu, birkaç varsayılan yansıtmayı sınırlamalıdır.A knowledge store, which can be created by the wizard, is limited to a few default projections. Sihirbaz tarafından oluşturulan zenginleştirilmiş belgeleri kaydetmek istiyorsanız, blob kapsayıcısı ve tabloları varsayılan ad ve yapıyla gelir.If you want to save enriched documents created by the wizard, the blob container and tables come with default names and structure.

Veri kaynağı girişiData source input

Veri Içeri aktarma Sihirbazı, Azure bilişsel arama Dizin oluşturucular tarafından sunulan iç mantığı kullanarak bir dış veri kaynağına bağlanır. Bu, kaynağı örneklemek, meta verileri okumak, belgeleri okumak için belgeleri çözmek ve içeriği JSON olarak seri hale getirmek için Azure bilişsel arama ' a bir sonraki içeri aktarma IŞLEMI için JSON olarak serileştirilir.The Import data wizard connects to an external data source using the internal logic provided by Azure Cognitive Search indexers, which are equipped to sample the source, read metadata, crack documents to read content and structure, and serialize contents as JSON for subsequent import to Azure Cognitive Search.

Yalnızca tek bir tablo, veritabanı görünümü veya eşdeğer veri yapısından içeri aktarabilirsiniz; ancak yapı hiyerarşik veya iç içe geçmiş alt yapılar içerebilir.You can only import from a single table, database view, or equivalent data structure, however the structure can include hierarchical or nested substructures. Daha fazla bilgi için bkz. karmaşık türleri Modelme.For more information, see How to model complex types.

Sihirbazı çalıştırmadan önce bu tek tablo veya görünüm oluşturmanız gerekir ve içerik içermesi gerekir.You should create this single table or view before running the wizard, and it must contain content. Belirgin nedenlerle veri alma Sihirbazı ' nı boş bir veri kaynağında çalıştırmak mantıklı değildir.For obvious reasons, it doesn't make sense to run the Import data wizard on an empty data source.

SeçimSelection AçıklamaDescription
Mevcut veri kaynağıExisting data source Arama hizmetinizde zaten tanımlı dizin oluşturucular varsa, yeniden kullanabileceğiniz bir veri kaynağı tanımınız olabilir.If you already have indexers defined in your search service, you might have an existing data source definition that you can reuse. Azure Bilişsel Arama, veri kaynağı nesneleri yalnızca dizin oluşturucular tarafından kullanılır.In Azure Cognitive Search, data source objects are only used by indexers. Programlı olarak veya veri Içeri aktarma Sihirbazı aracılığıyla bir veri kaynağı nesnesi oluşturabilir ve bunları gerektiği gibi yeniden kullanabilirsiniz.You can create a data source object programmatically or through the Import data wizard, and reuse them as needed.
ÖrneklerSamples Azure Bilişsel Arama, öğreticiler ve hızlı başlangıçlarda kullanılan iki yerleşik örnek veri kaynağı sağlar: gerçek bir emlak SQL veritabanı ve Cosmos DB üzerinde barındırılan bir oteller veritabanı.Azure Cognitive Search provides two built-in sample data sources that are used in tutorials and quickstarts: a real estate SQL database and a Hotels database hosted on Cosmos DB. Oteller örneğine bağlı olarak bir izlenecek yol için Azure portal hızlı başlangıçta Dizin oluşturma bölümüne bakın.For a walk through based on the Hotels sample, see the Create an index in the Azure portal quickstart.
Azure SQL veritabanıAzure SQL Database Hizmet adı, okuma iznine sahip bir veritabanı kullanıcısının kimlik bilgileri ve veritabanı adı, sayfa üzerinde ya da ADO.NET bağlantı dizesi aracılığıyla belirtilebilir.Service name, credentials for a database user with read permission, and a database name can be specified either on the page or via an ADO.NET connection string. Özellikleri görüntülemek veya özelleştirmek için bağlantı dizesini seçin.Choose the connection string option to view or customize properties.

Sayfada satır kümesini sağlayan tablo veya görünüm belirtilmelidir.The table or view that provides the rowset must be specified on the page. Bu seçenek bağlantı başarılı olduktan sonra görünür ve bir seçim yapmanızı sağlayan açılır listeyi gösterir.This option appears after the connection succeeds, giving a drop-down list so that you can make a selection.
Azure VM’lerde SQL ServerSQL Server on Azure VM Tam hizmet adını, kullanıcı KIMLIĞINI ve parolayı ve bir bağlantı dizesi olarak veritabanını belirtin.Specify a fully qualified service name, user ID and password, and database as a connection string. Bu veri kaynağını kullanmak için bağlantıyı şifreleyen yerel depoya daha önce bir sertifika yüklemiş olmanız gerekir.To use this data source, you must have previously installed a certificate in the local store that encrypts the connection. Yönergeler için bkz. Azure bilişsel arama SQL VM bağlantısı.For instructions, see SQL VM connection to Azure Cognitive Search.

Sayfada satır kümesini sağlayan tablo veya görünüm belirtilmelidir.The table or view that provides the rowset must be specified on the page. Bu seçenek bağlantı başarılı olduktan sonra görünür ve bir seçim yapmanızı sağlayan açılır listeyi gösterir.This option appears after the connection succeeds, giving a drop-down list so that you can make a selection.
Azure Cosmos DBAzure Cosmos DB Hesap, veritabanı ve bağlantı gereklidir.Requirements include the account, database, and collection. Koleksiyondaki tüm belgeler dizine dahil edilir.All documents in the collection will be included in the index. Satır kümesini düzleştirmek veya filtrelemek için bir sorgu tanımlayabilir veya sorguyu boş bırakabilirsiniz.You can define a query to flatten or filter the rowset, or leave the query blank. Bu sihirbazda bir sorgu gerekli değildir.A query is not required in this wizard.
Azure Blob depolamaAzure Blob Storage Depolama hesabı ve bir kapsayıcı gereklidir.Requirements include the storage account and a container. İsteğe bağlı olarak, gruplandırma amacıyla blob adlarından önce bir sanal adlandırma kuralı varsa adın sanal dizin kısmını kapsayıcı altındaki bir klasör olarak belirtebilirsiniz.Optionally, if blob names follow a virtual naming convention for grouping purposes, you can specify the virtual directory portion of the name as a folder under container. Daha fazla bilgi için bkz. Blob Depolama Dizini Oluşturma.See Indexing Blob Storage for more information.
Azure Tablo depolamaAzure Table Storage Depolama hesabı ve bir tablo adı gereklidir.Requirements include the storage account and a table name. İsteğe bağlı olarak, tabloların bir alt kümesini almak için sorgu belirtebilirsiniz.Optionally, you can specify a query to retrieve a subset of the tables. Daha fazla bilgi için bkz. Tablo Depolama Dizini Oluşturma.See Indexing Table Storage for more information.

Sihirbaz çıkışıWizard output

Sihirbaz, arka planda aşağıdaki nesneleri oluşturur, yapılandırır ve çağırır.Behind the scenes, the wizard creates, configures, and invokes the following objects. Sihirbaz çalıştıktan sonra, çıktısını Portal sayfalarında bulabilirsiniz.After the wizard runs, you can find its output in the portal pages. Hizmetinizin Genel Bakış sayfasında Dizin, Dizin oluşturucular, veri kaynakları ve becerileri listeleri vardır.The Overview page of your service has lists of indexes, indexers, data sources, and skillsets. Dizin tanımları portalda tam JSON olarak görüntülenebilir.Index definitions can be viewed in full JSON in the portal. Diğer tanımlarda, belirli nesneleri almak için REST API kullanabilirsiniz.For other definitions, you can use the REST API to GET specific objects.

NesneObject AçıklamaDescription
Veri KaynağıData Source Bağlantı bilgilerini, kimlik bilgileri de dahil olmak üzere kaynak verilere devam ettirir.Persists connection information to source data, including credentials. Veri kaynağı nesnesi yalnızca dizin oluşturucular ile kullanılır.A data source object is used exclusively with indexers.
DizinIndex Tam metin araması ve diğer sorgular için kullanılan fiziksel veri yapısı.Physical data structure used for full text search and other queries.
BeceriSkillset Görüntü dosyalarından bilgi çözümleme ve ayıklama da dahil olmak üzere içeriği işleme, dönüştürmeye ve şekillendirmeye yönelik bir dizi yönergedir.A complete set of instructions for manipulating, transforming, and shaping content, including analyzing and extracting information from image files. Çok basit ve sınırlı yapılar haricinde, zenginleştirme sağlayan bilişsel hizmetler kaynağına bir başvuru içerir.Except for very simple and limited structures, it includes a reference to a Cognitive Services resource that provides enrichment. İsteğe bağlı olarak, bir bilgi deposu tanımı da içerebilir.Optionally, it might also contain a knowledge store definition.
Dizin OluşturucuIndexer Bir veri kaynağı, hedef dizin, isteğe bağlı bir beceri, isteğe bağlı zamanlama ve hata elde etme ve Base-64 kodlaması için isteğe bağlı yapılandırma ayarları belirleyen bir yapılandırma nesnesi.A configuration object specifying a data source, target index, an optional skillset, optional schedule, and optional configuration settings for error handing and base-64 encoding.

Sihirbazı başlatmaHow to start the wizard

Veri Içeri aktarma Sihirbazı, hizmet Genel Bakış sayfasındaki komut çubuğundan başlatılır.The Import data wizard is started from the command bar on the service Overview page.

  1. Azure Portal, panodaki arama hizmeti sayfasını açın veya hizmet listesinde hizmetinizi bulun .In the Azure portal, open the search service page from the dashboard or find your service in the service list.

  2. En üstteki hizmete genel bakış sayfasında, verileri Içeri aktar' a tıklayın.In the service overview page at the top, click Import data.

    Portalda verileri içeri aktar komutuImport data command in portal

Ayrıca Azure Cosmos DB, Azure SQL veritabanı ve Azure Blob depolama da dahil olmak üzere diğer Azure hizmetlerinden Içeri aktarma verilerini de başlatabilirsiniz.You can also launch Import data from other Azure services, including Azure Cosmos DB, Azure SQL Database, and Azure Blob storage. Hizmet genel bakış sayfasında sol gezinti bölmesinde Azure bilişsel arama Ekle ' ye bakın.Look for Add Azure Cognitive Search in the left-navigation pane on the service overview page.

Sihirbazda Dizin şemasını düzenleme veya tamamlamaHow to edit or finish an index schema in the wizard

Sihirbaz, giriş veri kaynağından elde edilen belgelerle doldurulacak tamamlanmamış bir dizin oluşturur.The wizard generates an incomplete index, which will be populated with documents obtained from the input data source. İşlevsel dizin için aşağıdaki öğelerin tanımlandığından emin olun.For a functional index, make sure you have the following elements defined.

  1. Alan listesi tamamlansın mı?Is the field list complete? Eksik örneklemenin bulunduğu yeni alanlar ekleyin ve bir arama deneyimine değer eklememe veya bir filtre ifadesinde veya Puanlama profilindekullanılmayacak olan her türlü değeri kaldırın.Add new fields that sampling missed, and remove any that don't add value to a search experience or that won't be used in a filter expression or scoring profile.

  2. Veri türü gelen veriler için uygun mu?Is the data type appropriate for the incoming data? Azure Bilişsel Arama, varlık veri modeli (EDM) veri türlerinidestekler.Azure Cognitive Search supports the entity data model (EDM) data types. Azure SQL verileri için eşdeğer değerleri oluşturan eşleme grafiği vardır.For Azure SQL data, there is mapping chart that lays out equivalent values. Daha fazla arka plan için bkz. alan eşlemeleri ve dönüştürmeleri.For more background, see Field mappings and transformations.

  3. Anahtarolarak kullanılabilecek bir alanınız var mı?Do you have one field that can serve as the key? Bu alan Edm. String olmalı ve bir belgeyi benzersiz şekilde tanımlamalıdır.This field must be Edm.string and it must uniquely identify a document. İlişkisel veriler için bir birincil anahtarla eşlenmiş olabilir.For relational data, it might be mapped to a primary key. Blob 'lar için metadata-storage-patholabilir.For blobs, it might be the metadata-storage-path. Alan değerleri boşluk veya tire içeriyorsa, bu karakterlerin doğrulama denetimini bastırmak için, Dizin Oluşturucu oluştur adımında, Gelişmiş Seçenekleraltında Base-64 kodlama anahtarı seçeneğini ayarlamanız gerekir.If field values include spaces or dashes, you must set the Base-64 Encode Key option in the Create an Indexer step, under Advanced options, to suppress the validation check for these characters.

  4. Bu alanın bir dizinde nasıl kullanıldığını belirleme özniteliklerini belirleyin.Set attributes to determine how that field is used in an index.

    Öznitelikteki alanların fiziksel ifadesini belirlerken, bu adımla zamandan yararlanın.Take your time with this step because attributes determine the physical expression of fields in the index. Öznitelikleri daha sonra, programlama yoluyla da değiştirmek istiyorsanız, neredeyse her zaman dizini bırakıp yeniden oluşturmanız gerekir.If you want to change attributes later, even programmatically, you will almost always need to drop and rebuild the index. Aranabilir ve alınabilir gibi temel özniteliklerin depolama alanı üzerinde daha okunaklı bir etkisivardır.Core attributes like Searchable and Retrievable have a negligible impact on storage. Filtreleri etkinleştirme ve öneri araçları kullanma depolama gereksinimlerini artırma.Enabling filters and using suggesters increase storage requirements.

    • Aranabilir tam metin aramasını sunar.Searchable enables full-text search. Serbest form sorgularında veya sorgu ifadelerinde kullanılan her alan bu özniteliğe sahip olmalıdır.Every field used in free form queries or in query expressions must have this attribute. Ters çevrilen dizinler, aranabilirolarak işaretlediğiniz her alan için oluşturulur.Inverted indexes are created for each field that you mark as Searchable.

    • Alınabilir , arama sonuçlarında alanı geri döndürür.Retrievable returns the field in search results. Arama sonuçlarına içerik sağlayan her alan bu özniteliğe sahip olmalıdır.Every field that provides content to search results must have this attribute. Bu alanın ayarlanması, etkin dizin boyutunu etkilemez.Setting this field does not appreciably effect index size.

    • Filtrelenebilir , alana filtre ifadelerinde başvurulmak için izin verir.Filterable allows the field to be referenced in filter expressions. $Filter ifadesinde kullanılan her alan bu özniteliğe sahip olmalıdır.Every field used in a $filter expression must have this attribute. Filtre ifadeleri tam eşleşmeler içindir.Filter expressions are for exact matches. Metin dizeleri değişmeden kaldığı için, tam içeriğe uyum sağlamak için ek depolama alanı gereklidir.Because text strings remain intact, additional storage is required to accommodate the verbatim content.

    • Çok yönlü tablo , çok yönlü gezinme için alanı sunar.Facetable enables the field for faceted navigation. Yalnızca Filterable olarak işaretlenen alanlar, çok yönlü tabloolarak işaretlenebilir.Only fields also marked as Filterable can be marked as Facetable.

    • Sıralanabilir , alanın bir sıralama içinde kullanılmasına izin verir.Sortable allows the field to be used in a sort. $OrderBy ifadesinde kullanılan her alan bu özniteliğe sahip olmalıdır.Every field used in an $Orderby expression must have this attribute.

  5. Sözlü Analizeihtiyacınız var mı?Do you need lexical analysis? Aranabilirolan Edm. String alanları için, dil ile Gelişmiş dizin oluşturma ve sorgulama Istiyorsanız bir çözümleyici ayarlayabilirsiniz.For Edm.string fields that are Searchable, you can set an Analyzer if you want language-enhanced indexing and querying.

    Varsayılan değer Standart Lucene ' dir, ancak düzensiz ad ve fiil formlarını çözme gibi gelişmiş sözcük Işleme için Microsoft 'un çözümleyicisini kullanmak Istiyorsanız Microsoft English ' i seçebilirsiniz.The default is Standard Lucene but you could choose Microsoft English if you wanted to use Microsoft's analyzer for advanced lexical processing, such as resolving irregular noun and verb forms. Portalda yalnızca dil Çözümleyicileri belirtilebilir.Only language analyzers can be specified in the portal. Özel bir çözümleyici veya anahtar sözcük, model, vb. gibi dil olmayan bir çözümleyici kullanmak programlı olarak yapılmalıdır.Using a custom analyzer or a non-language analyzer like Keyword, Pattern, and so forth, must be done programmatically. Çözümleyiciler hakkında daha fazla bilgi için bkz. dil Çözümleyicileri ekleme.For more information about analyzers, see Add language analyzers.

  6. Otomatik tamamlama veya önerilen sonuçlar biçiminde typeahead işlevselliği mi gerekiyor?Do you need typeahead functionality in the form of autocomplete or suggested results? Seçili alanlarda typeahead sorgu önerilerini ve otomatik tamamlamayı etkinleştirmek için öneri aracı onay kutusunu seçin.Select the Suggester the checkbox to enable typeahead query suggestions and autocomplete on selected fields. Öneri araçları, dizininizdeki simgeleştirilmiş koşulların sayısına ekleyin ve bu nedenle daha fazla depolama alanı kullanın.Suggesters add to the number of tokenized terms in your index, and thus consume more storage.

Sonraki adımlarNext steps

Sihirbazın sağladığı avantajları ve sınırlamaları anlamanın en iyi yolu, adım adım ilermektir.The best way to understand the benefits and limitations of the wizard is to step through it. Aşağıdaki hızlı başlangıç, her adımda size rehberlik eder.The following quickstart guides you through each step.