Azure Search のデータのインポート ウィザードImport data wizard for Azure Search

Azure Portal では、データをインデックスに読み込むデータのインポート ウィザードが Azure Search ダッシュボードに用意されています。The Azure portal provides an Import data wizard on the Azure Search dashboard for loading data into an index. ウィザードでは、バックグラウンドでデータ ソースインデックス、およびインデクサーを構成して起動し、次のようなインデックス作成プロセスのいくつかの手順を自動化します。Behind the scenes, the wizard configures and invokes a data source, index, and indexer - automating several steps of the indexing process:

  • 同じ Azure サブスクリプションで外部のデータ ソースに接続します。Connects to an external data source in the same Azure subscription.
  • 必要に応じて、非構造化データからテキストを抽出するための光学式文字認識または自然言語処理を統合します。Optionally, integrates optical character recognition or natural language processing for extracting text from unstructured data.
  • データのサンプリングと外部データ ソースのメタデータに基づいてインデックスを生成します。Generates an index based on data sampling and metadata of the external data source.
  • JSON ドキュメントをシリアル化してインデックスに読み込み、検索可能なコンテンツのデータ ソースをクロールします。Crawls the data source for searchable content, serializing and loading JSON documents into the index.

ウィザードでは定義済みのインデックスに接続したり、既存のインデクサーを実行したりすることはできませんが、ウィザード内で、必要な構造や動作をサポートするように新しいインデックスまたはインデクサーを構成することができます。The wizard can't connect to a predefined index or run an existing indexer, but within the wizard, you can configure a new index or indexer to support the structure and behaviors you need.

Azure Search を初めて使用する場合は、New to Azure Search? ポータル ツールを使用するインポート、インデックス作成、クエリの実行に関するクイック スタートをステップ実行し、データのインポートおよび組み込みの real estate サンプル データ セットを使用して、インポートとインデックス作成を試してください。Step through the Quickstart: Import, index, and query using portal tools to test-drive importing and indexing using Import data and the built-in real estate sample data set.

データのインポートを開始するStart importing data

このセクションでは、ウィザードの起動方法について説明し、各手順の概要を示します。This section explains how to start the wizard and provides a high-level overview of each step.

  1. Azure portal でダッシュボードから検索サービス ページを開くか、サービスの一覧でご自分のサービスを見つけます。In the Azure portal, open the search service page from the dashboard or find your service in the service list.

  2. 上部にあるサービスの概要ページで、 [データのインポート] をクリックします。In the service overview page at the top, click Import data.

    ポータルの [データのインポート] コマンドImport data command in portal

    注意

    [データのインポート] は、Azure Cosmos DB、Azure SQL Database、Azure Blob Storage を含む、他の Azure サービスから起動できます。You can launch Import data from other Azure services, including Azure Cosmos DB, Azure SQL Database, and Azure Blob storage. サービスの概要ページの左側にあるナビゲーション ウィンドウで、 [Azure Search の追加] を見つけます。Look for Add Azure Search in the left-navigation pane on the service overview page.

  3. ウィザードが開き、 [データへの接続] が表示されます。ここで、このインポートで使用する外部データ ソースを選択することができます。The wizard opens to Connect to your data, where you can choose an external data source to use for this import. この手順について知っておく必要がある点がいくつかあるため、必ず、「データ ソースの入力」セクションで詳細を確認してください。There are several things to know about this step, so be sure to read the Data source inputs section for more details.

    ポータルのデータのインポート ウィザードImport data wizard in portal

  4. 次は、 [認知検索を追加します (省略可能)] です。イメージ ファイルのテキストの光学式文字認識 (OCR)、または非構造化データに対するテキスト分析を含める場合に使用します。Next is Add cognitive search, in case you want to include optical character recognition (OCR) of text in image files, or text analysis over unstructured data. Cognitive Services の AI アルゴリズムは、このタスクのために取り込まれます。AI algorithms from Cognitive Services are pulled in for this task. この手順は次の 2 つの部分に分かれています。There are two parts to this step:

    まず、Azure Search スキルセットに Cognitive Services リソースをアタッチしますFirst, attach a Cognitive Services resource to an Azure Search skillset.

    次に、スキルセットに含める AI エンリッチメントを選びます。Second, choose which AI enrichments to include in the skillset. チュートリアルのデモについては、こちらのクイック スタートを参照してください。For a walkthrough demonstration, see this Quickstart.

    データをインポートするだけの場合は、この手順をスキップし、インデックス定義に直接進みます。If you just want to import data, skip this step and go directly to index definition.

  5. 次は、 [ターゲット インデックスのカスタマイズ] です。ここでは、ウィザードに表示されるインデックス スキーマを受け入れるか変更できます。Next is Customize target index, where you can accept or modify the index schema presented in the wizard. ウィザードでは、データをサンプリングし、外部データ ソースからメタデータを読み取ることで、フィールドとデータ型を推測します。The wizard infers the fields and datatypes by sampling data and reading metadata from the external data source.

    フィールドごとに、インデックス属性を確認し、特定の動作を有効にします。For each field, check the index attributes to enable specific behaviors. 属性を選択しないと、インデックスは使用できません。If you don't select any attributes, your index won't be usable.

  6. 次は、このウィザードの製品である、 [インデクサーの作成] です。Next is Create an indexer, which is a product of this wizard. インデクサーはクローラーであり、外部の Azure データ ソースから検索可能なデータとメタデータを抽出します。An indexer is a crawler that extracts searchable data and metadata from an external Azure data source. データ ソースを選択し、スキルセット (省略可能) とインデックスをアタッチし、ウィザードの各手順を進んで、インデクサーを構成しました。By selecting the data source and attaching skillsets (optional) and an index, you've been configuring an indexer as you move through each step of the wizard.

    そのインデクサーに名前を付け、 [送信] をクリックしてインポート プロセスを開始します。Give the indexer a name, and click Submit to begin the import process.

ポータルで、 [インデクサー] リストのインデクサーをクリックすることで、インデックス作成を監視することができきます。You can monitor indexing in the portal by clicking the indexer in the Indexers list. ドキュメントが読み込まれると、定義したインデックスのドキュメント数が増えます。As documents are loaded, the document count will grow for the index you have defined. ポータル ページで最新の更新プログラムを取得するまで、数分かかる場合があります。Sometimes it takes a few minutes for the portal page to pick up the most recent updates.

最初のドキュメントが読み込まれるとすぐに、インデックスのクエリを実行する準備ができます。The index is ready to query as soon as the first document is loaded. このタスクで Search エクスプローラーを使用することができます。You can use Search explorer for this task.

データ ソースの入力Data source inputs

データのインポート ウィザードでは、外部データ ソースに接続情報を指定することで、永続的なデータ ソース オブジェクトを作成します。The Import data wizard creates a persistent data source object specifying connection information to an external data source. データ ソース オブジェクトはインデクサー専用で、次のデータ ソースに作成できます。The data source object is used exclusively with indexers and can be created for the following data sources:

インポート元として指定できるのは、単一のテーブル、データベース ビュー、または同等のデータ構造体のみですが、構造体には、階層または入れ子になったのサブ構造体を含めることができます。You can only import from a single table, database view, or equivalent data structure, however the structure can include hierarchical or nested substructures. 詳細については、複合型のモデル化の方法に関するページを参照してください。For more information, see How to model complex types.

ウィザードを実行する前に、このデータ構造を作成し、コンテンツを含める必要があります。You should create this data structure before running the wizard, and it must contain content. 空のデータ ソースに対してデータのインポート ウィザードを実行しないでください。Do not run the Import data wizard on an empty data source.

選択肢番号Selection 説明Description
既存のデータ ソースExisting data source Search サービスに定義済みのインデクサーが既にある場合は、別のインポート用に既存のデータ ソース定義を選択できます。If you already have indexers defined in your search service, you can select an existing data source definition for another import. Azure Search では、データ ソース オブジェクトはインデクサーでのみ使用されます。In Azure Search, data source objects are only used by indexers. データ ソース オブジェクトは、プログラムで、またはデータのインポート ウィザードを使用して作成することができます。You can create a data source object programmatically or through the Import data wizard.
サンプルSamples Azure Search では無料のグローバル Azure SQL データベースをホストします。このデータベースを使用して、Azure Search でのインポートやクエリ要求の詳細を確認することができます。Azure Search hosts a free global Azure SQL database that you can use to learn about importing and query requests in Azure Search. クイック スタート:ポータル ツールを使用したインポート、インデックス作成、およびクエリの実行に関するクイック スタートを参照してください。See Quickstart: Import, index, and query using portal tools for a walkthrough.
Azure SQL DatabaseAzure SQL Database サービス名、読み取り権限を持つデータベース ユーザーの資格情報、データベース名は、このページで、または ADO.NET 接続文字列を使用して指定できます。Service name, credentials for a database user with read permission, and a database name can be specified either on the page or via an ADO.NET connection string. 接続文字列のオプションを選択して、プロパティを表示またはカスタマイズします。Choose the connection string option to view or customize properties.

行セットを提供するテーブルまたはビューは、このページで指定する必要があります。The table or view that provides the rowset must be specified on the page. このオプションは接続に成功すると表示され、ドロップダウン リストから選択できます。This option appears after the connection succeeds, giving a drop-down list so that you can make a selection.
Azure VM 上の SQL ServerSQL Server on Azure VM 接続文字列として、完全修飾サービス名、ユーザー ID とパスワード、データベースを指定します。Specify a fully qualified service name, user ID and password, and database as a connection string. このデータ ソースを使用するには、接続を暗号化する証明書をローカル ストアにあらかじめインストールしておく必要があります。To use this data source, you must have previously installed a certificate in the local store that encrypts the connection. 手順については、Azure Search への SQL VM 接続に関する記事をご覧ください。For instructions, see SQL VM connection to Azure Search.

行セットを提供するテーブルまたはビューは、このページで指定する必要があります。The table or view that provides the rowset must be specified on the page. このオプションは接続に成功すると表示され、ドロップダウン リストから選択できます。This option appears after the connection succeeds, giving a drop-down list so that you can make a selection.
Cosmos DBCosmos DB 要件には、アカウント、データベース、コレクションが含まれます。Requirements include the account, database, and collection. コレクション内のすべてのドキュメントはインデックスに含まれます。All documents in the collection will be included in the index. 行セットをフラット化またはフィルター処理するクエリを定義することも、クエリを空白のままにすることもできます。You can define a query to flatten or filter the rowset, or leave the query blank. このウィザードでは、クエリは必要はありません。A query is not required in this wizard.
Azure Blob StorageAzure Blob Storage 要件には、ストレージ アカウントとコンテナーが含まれます。Requirements include the storage account and a container. BLOB 名がグループ化のために仮想名前付け規則に従っている場合は、必要に応じて、コンテナーの下のフォルダーとして名前の仮想ディレクトリの部分を指定できます。Optionally, if blob names follow a virtual naming convention for grouping purposes, you can specify the virtual directory portion of the name as a folder under container. 詳しくは、Blob Storage のインデックス作成に関する記事をご覧ください。See Indexing Blob Storage for more information.
Azure Table StorageAzure Table Storage 要件には、ストレージ アカウントとテーブル名が含まれます。Requirements include the storage account and a table name. 必要に応じて、クエリを指定してテーブルのサブセットを取得できます。Optionally, you can specify a query to retrieve a subset of the tables. 詳しくは、Table Storage のインデックス作成に関する記事をご覧ください。See Indexing Table Storage for more information.

インデックスの属性Index attributes

データのインポート ウィザードではインデックスが生成され、入力データ ソースから取得されるドキュメントが取り込まれます。The Import data wizard generates an index, which will be populated with documents obtained from the input data source.

関数インデックスについては、以下の要素が定義されていることを確認します。For a functional index, make sure you have the following elements defined.

  1. 1 つのフィールドをキーとしてマークする必要があります。このキーは、各ドキュメントを一意に識別するために使用されます。One field must be marked as a Key, which is used to uniquely identify each document. キーEdm.string である必要があります。The Key must be Edm.string.

    フィールドの値に空白またはダッシュが含まれている場合は、インデクサーの作成手順の [詳細オプション][Base-64 エンコード キー] オプションを設定し、これらの文字の検証チェックを抑制する必要があります。If field values include spaces or dashes, you must set the Base-64 Encode Key option in the Create an Indexer step, under Advanced options, to suppress the validation check for these characters.

  2. 各フィールドのインデックス属性を設定します。Set index attributes for each field. 属性を選択しない場合、必須のキー フィールドを除き、インデックスは本質的に空となります。If you select no attributes, your index is essentially empty, except for the required key field. 少なくとも、各フィールドには以下の属性の 1 つ以上を選択してください。At a minimum, choose one or more of these attributes for each field.

    • Retrievable の場合、検索結果にフィールドが返されます。Retrievable returns the field in search results. 検索結果にコンテンツを提供するすべてのフィールドに、この属性が必要です。Every field that provides content to search results must have this attribute. このフィールドを設定しても、インデックス サイズに大きな影響はありません。Setting this field does not appreciably effect index size.
    • Filterable は、フィルター式でフィールドを参照できるようにします。Filterable allows the field to be referenced in filter expressions. $filter 式で使用されるすべてのフィールドに、この属性が必要です。Every field used in a $filter expression must have this attribute. このフィルター式は完全一致用です。Filter expressions are for exact matches. テキスト文字列はそのまま残るため、逐語的なコンテンツに対応するには、追加のストレージが必要です。Because text strings remain intact, additional storage is required to accommodate the verbatim content.
    • Searchable では、全文検索が有効になります。Searchable enables full-text search. 自由形式のクエリまたはクエリ式で使用されるすべてのフィールドに、この属性が必要です。Every field used in free form queries or in query expressions must have this attribute. Searchable としてマークしたフィールドごとに、逆インデックスが作成されます。Inverted indexes are created for each field that you mark as Searchable.
  3. 必要に応じて、以下の属性を設定します。Optionally, set these attribute as needed:

    • Sortable は、並べ替えでフィールドを使用できるようにします。Sortable allows the field to be used in a sort. $Orderby 式で使用されるすべてのフィールドに、この属性が必要です。Every field used in an $Orderby expression must have this attribute.
    • Facetable は、ファセット ナビゲーションにフィールドを使用できるようにします。Facetable enables the field for faceted navigation. Filterable としてもマークされているフィールドのみを、Facetable としてマークできます。Only fields also marked as Filterable can be marked as Facetable.
  4. 言語拡張インデックス作成とクエリの実行が必要な場合は、アナライザーを設定します。Set an Analyzer if you want language-enhanced indexing and querying. 既定値は標準 Lucene ですが、不規則名詞や動詞形式の解決など、高度な字句処理のために Microsoft のアナライザーを使用する必要がある場合は、Microsoft の英語を選択できます。The default is Standard Lucene but you could choose Microsoft English if you wanted to use Microsoft's analyzer for advanced lexical processing, such as resolving irregular noun and verb forms.

    • Searchable を選択して、アナライザー リストを有効にします。Select Searchable to enable the Analyzer list.
    • リストに示されるアナライザーを選択します。Choose an analyzer provided in the list.

    現時点では、言語アナライザーのみを指定できます。Only language analyzers can be specified at this time. カスタム アナライザーや、キーワード、パターンなどの非言語アナライザーを使用する場合は、コードが必要になります。Using a custom analyzer or a non-language analyzer like Keyword, Pattern, and so forth, will require code. アナライザーの詳細については、複数言語のドキュメント用のインデックス作成に関するページを参照してください。For more information about analyzers, see Create an index for documents in multiple languages.

  5. [提案者] チェック ボックスをオンにし、選択したフィールドで先行入力クエリ候補を有効にします。Select the Suggester the checkbox to enable type-ahead query suggestions on selected fields.

次の手順Next steps

インデクサーの詳細については、次のリンク先を参照してください。Review these links to learn more about indexers: