HPC Pack 2016 Update 2 の新機能

このドキュメントでは、HPC Pack 2016 Update 2 と比較して、Microsoft HPC Pack 2016 Update 2 で使用できる新機能と変更の一覧を示します。 HPC Pack 2016 Update 2 をオンプレミスのコンピューターにダウンロードしてインストールするか、 デプロイ テンプレート を使用して、HPC Pack 2016 Update 2 を使用して Azure 上にクラスターを作成できます。

Mesos の統合

HPC Pack では、オープン ソースの HPC Pack Mesos フレームワークを使用して、Mesos クラスターからコンピューティング リソースを自動的に拡張できるようになりました。 この機能を有効にすると、HPC Pack は

  1. Mesos クラスターからコンピューティング ノード リソースを借用する (次の場合)
    • HPC Pack には、より多くのリソースが必要なキュー タスクがあります。
    • Mesos クラスターには、HPC Pack に使用できるリソースがあります。
  2. 計算ノードを Mesos クラスターに返します(次の場合)
    • Mesos フレームワークから借用したノードがアイドル タイムアウトに達しました。

ドメインに参加していないコンピューティング ノードの SOA 共通データ

これにより、ドメインに参加していない Windows コンピューティング ノードで実行されている SOA サービスは、通常はヘッド ノードにある HPC Runtime 共有にアクセスすることなく、Azure Blob Storageから直接 SOA Common Data を読み取れます。 これにより、Azure でプロビジョニングされたコンピューティング リソースを使用して、ハイブリッド HPC Pack クラスター内の SOA ワークロードが有効になります。

Azure IaaS VM へのバーストの機能強化

HPC Pack 2016 Update 1 では、HPC Pack "Azure IaaS VM ノード テンプレート" に新しいノード テンプレートの種類が導入されました。 次に、以下の機能強化を行いました。

  1. Azure IaaS VM 用のノード テンプレートを作成するには、クラスター管理者は、Azure サービス プリンシパル、Azure Key Vault シークレットを構成し、Azure portalから情報を収集する複数の手順を実行する必要があります。 次に、これらの手順をすべてステップ バイ ステップ ウィザードに簡略化しました。

  2. Azure IaaS コンピューティング ノードを作成するときに、Azure 高速ネットワークを有効にできるようになりました。

  3. Azure ノード情報 (ノード サイズ、イメージ名など) が、ノード上のメタデータ サービスを通じて自動的に収集されるようになりました。 プロビジョニング中のノードが完了すると、クラスター マネージャー GUI でこれらの情報を確認できるようになります。

ノードでジョブ/タスク履歴を表示する

コマンド ノード ビューの新しいパラメーター "/jobhistory"、"/taskhistory"、"/lastrows"、"/when" が追加されました。 "/jobhistory" および (または) "/taskhistory" を使用して、ノードのジョブおよび(または) タスク割り当て履歴を取得します。 "/lastrows" を使用して、割り当て履歴を取得するためにクエリを実行する DB の行数を指定します。既定値は 100 行です。 "/when" を使用して割り当て履歴をフィルター処理し、指定した時間内にノードで実行されていたジョブ/タスクを確認します。 たとえば、次のコマンドでは、ノード IaaSCN001 で実行されている最新のジョブ履歴が表示されます。

node view IaaSCN001 /jobhistory

高速バランス スケジューリング モード

高速バランス モードは、キューモードとバランスモードに加えて新しいモードです。 このモードでは、コアは拡張優先度に従ってジョブに割り当てられます。 実行中のジョブ間のバランス クォータを計算するバランス モードとは異なり、高速バランス モードでは、キューに登録されたジョブと実行中のジョブの間でバランス クォータが計算され、このモードのプリエンプションはノード グループ レベルで適切に行われるため、最終的なバランス状態をより効率的に実現できます。 Fast Balanced モードには、ジョブ設定に関するいくつかの制約があります。 互換性のないジョブは検証エラーで失敗します。

高速バランス モードを有効にするには、powershell コマンドレットの下で を実行する必要があります。

set-hpcclusterproperty -schedulingmode FastBalanced

クラスター管理者のコンピューティング ノードを再起動するタスク

クラスター管理者は、完了時にコンピューティング ノードを再起動するタスクを使用してジョブを作成して送信できるようになりました。 クラスター管理者は、タスク環境変数 CCP_RESTART=True を指定する必要があります。 コンピューティング ノードでタスクが完了すると、ノード自体が再起動され、タスクはスケジューラの "実行中" 状態のままです。 再起動からサービスが再起動されると、タスクは完了として報告されます。

この種類のタスクは、コンピューティング ノードを再起動するときに他のタスクが影響を受けないように、コンピューティング ノードでのみ実行する必要があります。

リザードの更新

Lizard は、HPC Pack クラスターで Linpack ベンチマークを実行して調整するツールです。 HPC Pack 2016 Update 2 と共にダウンロードできる更新されたトカゲ ツールが提供されました。

その他の改良

リソース使用率、可用性に関する HPC Pack 組み込みレポートで Linux ノードが有効になりました。

以下の機能強化は、HPC Pack 2016 Update 1 から QFE まででも利用できます

  1. ジョブ環境変数 HPC_CREATECONSOLEに新しい値 "KEEP" を追加します。この値を指定すると、新しいログオン コンソール セッションが存在しない場合は作成されるか、既存のログオン コンソール セッションにアタッチされ、コンピューティング ノードでジョブが完了した後もコンソール セッションが保持されます。

  2. Intel MPI、Open MPI、MPICH、または Linux ノード上の他の MPI アプリケーションの ホストファイル または マシンファイル を生成するようになりました。 ランク 0 タスクの開始時に、MPI アプリケーションのノードまたはコア割り当て情報を含むホスト ファイルまたはマシン ファイルが生成されます。 ユーザーは、task コマンドでジョブ環境変数またはタスク環境変数 $CCP_MPI_HOSTFILE を使用してファイル名を取得し、$CCP_MPI_HOSTFILE_FORMAT を使用してホスト ファイルまたはコンピューター ファイルの形式を指定できます。 MPI PINGPONG 実行でこれを使用する方法の例を次に示します。

    source /opt/intel/impi/`ls /opt/intel/impi`/bin64/mpivars.sh && mpirun -f $CCP_MPI_HOSTFILE IMB-MPI1 pingpong
    
  3. 既定では、スケジューラはジョブの runas ユーザー資格情報を使用して、コンピューティング ノードで "対話型" ログオンを実行します。 また、ドメイン ポリシーによって "対話型" ログオンアクセス許可が禁止されることがあります。 ユーザーが異なるログオンの種類を指定して問題を軽減できるように、新しいジョブ環境変数 "HPC_JOBLOGONTYPE" が導入されました。 ジョブ環境変数の値は、次のように 2,3,4,5,7,8,9 に設定できます。詳細については、こちらを参照してください

    public enum LogonType
    {
            Interactive = 2,
            Network = 3,
            Batch = 4,
            Service = 5,
            Unlock = 7,
            NetworkClearText = 8,
            NewCredentials = 9,
    }
    
  4. DB 接続文字列プラグインの機能強化: スケジューラ サービスに加えて、監視サービス、レポート サービス、診断サービス、および SDM サービスの DB 接続文字列も、接続に失敗したときに更新されるため、ユーザーはカスタマイズされたアセンブリをプラグインとして使用して、これらのサービスの DB 接続文字列を更新できます。