HDInsight クラスターを新しいバージョンにアップグレードするUpgrade HDInsight cluster to a newer version

最新の HDInsight 機能を利用するために、HDInsight クラスターを最新バージョンにアップグレードすることをお勧めします。To take advantage of the latest HDInsight features, we recommend that HDInsight clusters be upgraded to latest version. HDInsight クラスターのバージョンをアップグレードするには、下のガイドラインに従います。Follow the below guidelines to upgrade your HDInsight cluster versions.


HDInsight のサポートされているバージョンについては、HDInsight コンポーネントのバージョンに関するページを参照してください。For information on supported versions of HDInsight, see HDInsight component versions.

アップグレード タスクUpgrade tasks

HDInsight クラスターをアップグレードするワークフローは次のとおりです。The workflow to upgrade HDInsight Cluster is as follows. HDInsight アップグレード ワークフローの図HDInsight upgrade workflow diagram

  1. このドキュメントの各セクションを読んで、HDInsight クラスターに移行するときに必要になる場合がある変更について理解します。Read each section of this document to understand changes that may be required when upgrading your HDInsight cluster.
  2. テスト/品質保証環境として、クラスターを作成します。Create a cluster as a test/quality assurance environment. クラスターの作成の詳細については、「HDInsight での Linux ベースの Hadoop クラスターの作成」を参照してください。For more information on creating a cluster, see Learn how to create Linux-based HDInsight clusters
  3. 既存のジョブ、データ ソース、およびシンクを新しい環境にコピーします。Copy existing jobs, data sources, and sinks to the new environment.
  4. 検証テストを実行し、新しいクラスターで予期したとおりにジョブが動作していることを確認します。Perform validation testing to make sure that your jobs work as expected on the new cluster.

すべて予期したとおりに動作していることを確認したら、移行のダウンタイムをスケジュールします。Once you have verified that everything works as expected, schedule downtime for the migration. このダウンタイム中に、次の操作を実行します。During this downtime, do the following actions:

  1. クラスター ノードでローカルに格納されている一時的なデータをバックアップします。Back up any transient data stored locally on the cluster nodes. たとえば、ヘッド ノードに直接データを格納している場合です。For example, if you have data stored directly on a head node.
  2. 既存のクラスターを削除しますDelete the existing cluster.
  3. 同じ VNET サブネットの中に、前のクラスターで使用していたのと同じ既定のデータ ストアを使用する、最新の (またはサポートされている) バージョンの HDI クラスターを作成します。Create a cluster in the same VNET subnet with latest (or supported) HDI version using the same default data store that the previous cluster used. これで、新しいクラスターで既存の運用データを引き続き使用できます。This allows the new cluster to continue working against your existing production data.
  4. バックアップしたすべての一時的なデータをインポートします。Import any transient data you backed up.
  5. 新しいクラスターを使用して、ジョブを開始または処理を続行します。Start jobs/continue processing using the new cluster.

次の手順Next Steps