Parallel Data Warehouse の読み込みサーバーを取得して構成します

この記事では、読み込みサーバーを、Parallel Data Warehouse (PDW) にデータ読み込みを送信するための非アプライアンス Windows システムとして取得や構成する方法について説明します。

基本

読み込みサーバー:

  • 1 台のサーバーである必要はありません。 多数の読み込みサーバーと同時に読み込むことができます。

  • 独自の IT チームによって提供と管理がされます。 PDW へのデータの読み込みに使用できるサーバーが既にあるかもしれません。

  • アプライアンス以外のラックに配置されており、Analytics Platform System アプライアンス内に配置することはできません。

  • アプライアンス InfiniBand ネットワークを介して、またはイーサネット経由でアプライアンスに接続されます。 パフォーマンスを高めるには、InfiniBand を使用することをお勧めします。

  • アプライアンス ドメインではなく、独自の顧客ドメイン内にあります。 顧客ドメインとアプライアンス ドメインの間に信頼関係はありません。

手順 1: 容量要件を決定する

ロード・システムは、同時ロードを実行する 1 つ以上のロード・サーバーとして設計できます。 各読み込みサーバーは、ワークロードのパフォーマンスとストレージの要件を処理する限り、読み込み専用である必要はありません。

読み込みサーバーのシステム要件は、自分のワークロードにほぼ完全に依存します。 容量要件を判断するには、サーバー キャパシティ プランニング ワークシートの読み込み の読み込みを使用します。

手順 2: サーバーを取得する

容量の要件をよりよく理解して、購入またはプロビジョニングが必要なサーバーとネットワーク コンポーネントを計画できます。 次の要件の一覧を購入プランに組み込み、サーバーを購入する、または、既存のサーバーをプロビジョニングします。

ソフトウェア要件

サポートされているオペレーティング システム:

  • Windows Server 2012、Windows Server 2012 R2、またはそれ以降のバージョン。 これらのオペレーティング システムには、FDR ネットワーク アダプターが必要です。

  • Windows Server 2008 R2。 この OS には DDR ネットワーク アダプターが必要です。

dwloader コマンドライン読み込みツールを使用するには、サーバーで EN-US ロケールを使用する必要があります。 dwloader は他のロケールをサポートしていません。

Windows Server 2012 および Windows Server 2012 R2 ネットワークの要件

読み込みに必要ありませんが、InfiniBand は、サーバーを読み込む場合に推奨される接続の種類です。 最適なパフォーマンスを得るために、Windows Server 2012 または Windows Server 2012 R2 と FDR InfiniBand ネットワーク アダプターを使用して、読み込みサーバーをアプライアンス InfiniBand ネットワークに接続します。

Windows Server 2012 または Windows Server 2012 R2 InfiniBand 接続を準備するには:

  1. アプライアンス InfiniBand スイッチに接続できるように、サーバーをアプライアンスに十分近く置けるように計画します。 InfiniBand に関する Mellanox Technologies の詳細については、ホワイトペーパー「InfiniBand の概要」を参照してください。

  2. Mellanox ConnectX-3 FDR InfiniBand 単一またはデュアル ポート ネットワーク アダプターを購入します。 データ転送中のフォールト トレランスのために、2 つのポートを備えたネットワーク アダプターを購入することをお勧めします。 高可用性の実現には、2 つのポート ネットワーク アダプターが必要です。

  3. デュアル ポート カードの場合は 2 本の FDR InfiniBand ケーブル、単一ポート カードの場合は 1 本の FDR InfiniBand ケーブルを購入します。 FDR InfiniBand ケーブルは、ロード サーバーをアプライアンス InfiniBand ネットワークに接続します。 ケーブルの長さは、環境に応じて、読み込みサーバーとアプライアンス InfiniBand スイッチの間の距離によって異なります。

手順 3: InfiniBand ネットワークにサーバーを接続する

次の手順を使用して、読み込みサーバーを InfiniBand ネットワークに接続します。 サーバーが InfiniBand ネットワークを使用していない場合は、この手順をスキップします。

  1. アプライアンス InfiniBand ネットワークに接続できるように、サーバーをアプライアンスに十分近く置けるように計画します。

  2. InfiniBand Mellanox ConnectX-3 FDR InfiniBand ネットワーク アダプターをサーバーにインストールします。

  3. FDR ケーブルを使用して、InfiniBand ネットワーク アダプターを、最初のアプライアンス ラックの 2 つの InfiniBand スイッチのいずれかひとつに接続します。

  4. InfiniBand ネットワーク アダプターに適した Windows ドライバーをインストールして構成します。

    • Windows 用 InfiniBand ドライバーは、InfiniBand ベンダーの業界コンソーシアムである OpenFabrics Alliance が開発しています。 正しいドライバーが InfiniBand ネットワーク アダプターと一緒に配布されている可能性があります。 そうでない場合は、www.openfabrics.org からドライバーをダウンロードできます。
  5. ネットワーク アダプターの InfiniBand と DNS の設定を構成します。 構成手順については、「InfiniBand ネットワーク アダプターの構成」を参照してください。

手順 4: 読み込みツールをインストールする

クライアントツールは、 Microsoft ダウンロード センターからダウンロードして入手できます。

dwloader をインストールするには、クライアント ツールから dwloader のインストールを実行します。

読み込みに Integration Services を使用する場合は、Integration Services と Integration Services 変換先アダプターをインストールする必要があります。 アダプターは、クライアント ツールで使用できます。

手順 5: 読み込みを開始する

これで、データの読み込みを開始する準備ができました。 詳細については、次を参照してください:

  1. dwloader のコマンドライン読み込みツール

  2. フローの読み込み

パフォーマンス

Windows Server 2012 以降で読み込みパフォーマンスを最大限に高めるには、データが上書きされたときにオペレーティング システムが既存のデータをゼロで上書きしないように、ファイルの瞬時初期化を有効にします。 ディスクに以前のデータがまだ存在するため、これがセキュリティ 上のリスクである場合は、ファイルの瞬時初期化をオフにしてください。

セキュリティ通知

読み込むデータはアプライアンスに保存されないため、IT チームは、データが読み込まれるセキュリティのすべての側面を管理する責任があります。 例えば、ロードするデータのセキュリティ管理、ロードを保存するサーバーのセキュリティ管理、ロードサーバーとSQL Server PDWアプライアンスを接続するネットワークインフラのセキュリティ管理などです。

重要

dwloader コマンドライン読み込みツールを使用する各読み込みサーバーをセキュリティで保護することが特に重要です。 dwloader は、データを読み込むときに、最初に Control ノードで認証を行い、認証が成功した後、読み込みサーバーからデータ チャネル経由で直接コンピューティング ノードにデータを移動します。 証明書の検証は、各読み込みサーバーと各コンピューティング ノードの間の手振りでは行われません。 これにより、コンピューティング ノードは、読み込み中に各データ チャネルで中間者攻撃を受ける可能性があります。 これらの攻撃により、改ざんされたデータや情報漏えいが発生する可能性があります。

データのセキュリティ リスクを軽減するために、次のことをお勧めします:

  • PDW にデータを読み込む目的でのみ使用される 1 つの Windows アカウントを指定します。 そのアカウントのアクセス許可を読み込む場所に限定します。

  • データを読み込むアクセス許可を持つ PDW ユーザーを 1 人指定します。 セキュリティ要件に応じて、データベースごとに 1 人の特定のユーザーを持つことができます。

  • 読み込みサーバーに対する操作は、信頼された内部ネットワークの外部からデータをプルする UNC パスを受け入れます。 また、ネットワーク上の攻撃者や名前解決に影響を与える能力を持つ攻撃者は、SQL Server PDW に送信されたデータを傍受または変更できます。 これにより、改ざんと情報漏えいのリスクが伴います。 改ざんは、接続への署名を要求することで軽減する必要があります。 このリスクを軽減するには、読み込みサーバーのセキュリティ設定\ローカル ポリシー\セキュリティ オプション: Microsoft ネットワーク クライアント: 通信にデジタル署名する (常に) 有効、次のグループ ポリシー オプションを設定します。

  • Windows Server 2012 以降でファイルの瞬時初期化をオフにします。 これは、「パフォーマンス」セクションで説明されているように、パフォーマンスとセキュリティのトレードオフです。 セキュリティ要件に応じて最適なものを決定する必要があります。