DocumentDB の新しいインポート オプション

このポストは、5 月 5 日に投稿された New DocumentDB Import Options の翻訳です。

4 月 8 日に、さまざまなソースから DocumentDB にデータをインポートできるオープン ソース ソリューション、Azure DocumentDB Data Migration Tool がリリースされました。このツールでは主に次のソースからデータをインポートすることができます。

  • JSON ファイル
  • MongoDB
  • SQL Server
  • CSV ファイル
  • DocumentDB コレクション

そして今回、さらに 2 つのインポート オプションがサポートされました。Azure Table Storage と、JSON/CSV/MongoDB の各エクスポート ファイルの URL です。

Azure Table Storage

Azure Table Storage から DocumentDB へデータをインポートできるようになりました。接続文字列とテーブル名を指定するだけで、Azure Table のすべてのエントリをインポートできます。また、以下のオプションを利用して、インポート対象のデータを細かく指定することもできます。

  1. [Filter] (フィルター)
    • インポートするエンティティを制限するフィルターを指定します。たとえば、「PartitionKey eq ‘Partition1’ and RowKey gt ‘00001’」のように指定します。
  2. [Include Internal Fields] (内部フィールドを含めるかどうかを指定)
    • [All] – すべての内部フィールド (PartitionKey、RowKey、Timestamp) を含める
    • [None] – すべての内部フィールドを除外する
    • [RowKey] – RowKey フィールドだけを含める
  3. [Select Columns] (列の選択)
    • Azure Table エンティティの特定のプロパティだけをインポートする場合は、[Select Columns] リストに追加します。これで、それ以外のプロパティは無視されます。

 

JSON、CSV、MongoDB のエクスポート ファイルの URL

JSON、CSV、MongoDB の各エクスポート ファイルをインポートする際、Data Migration Tool 内に新しいオプションが表示されるようになりました。このオプションを使用すると、1 つ以上の HTTP URL をソース ファイルに追加することができます。Azure Blob Storage 内にファイルがある場合でも、data.gov から直接 CSV データをインポートする場合でも、HTTP アクセスが可能なファイルからデータをインポートできれば、これ以上に簡単なことはありません。

更新された Data Migration Tool のソース コードは GitHub (英語) から、コンパイル済みのバージョンは Microsoft ダウンロード センター (英語) からダウンロードできます。自分でツールをコンパイルすることも、コンパイル済みのバージョンをダウンロードして任意のディレクトリに解凍して利用することも可能です。各データ ソースからインポートする場合のコマンド ラインのサンプルや、ツールの詳しい使い方については、こちらの記事 (英語) をご覧ください。Data Migration Tool に追加を希望されるソースがありましたら、こちらのフィードバック フォーラム (英語) からぜひお知らせください。DocumentDB の詳細については、DocumentDB のページをご覧ください。