クイック スタート:Linux (Ubuntu) Data Science Virtual Machine を設定するQuickstart: Set up the Data Science Virtual Machine for Linux (Ubuntu)

Ubuntu 18.04 Data Science Virtual Machine を起動して実行します。Get up and running with the Ubuntu 18.04 Data Science Virtual Machine.

前提条件Prerequisites

Ubuntu 18.04 Data Science Virtual Machine を作成するには、Azure サブスクリプションが必要です。To create an Ubuntu 18.04 Data Science Virtual Machine, you must have an Azure subscription. Azure を無料で試すTry Azure for free.

注意

Azure 無料アカウントでは、GPU 対応の仮想マシン SKU がサポートされません。Azure free accounts don't support GPU enabled virtual machine SKUs.

Linux データ サイエンス仮想マシンの作成Create your Data Science Virtual Machine for Linux

Data Science Virtual Machine Ubuntu 18.04 のインスタンスを作成する手順は以下のとおりです。Here are the steps to create an instance of the Data Science Virtual Machine Ubuntu 18.04:

  1. Azure ポータルにアクセスします。Go to the Azure portal. まだサインインしていない場合は、Azure アカウントへのサインインを求めるメッセージが表示される可能性があります。You might be prompted to sign in to your Azure account if you're not already signed in.

  2. 「Data Science Virtual Machine」と入力して仮想マシンの一覧を検索し、[Data Science Virtual Machine - Ubuntu 18.04] を選択します。Find the virtual machine listing by typing in "data science virtual machine" and selecting "Data Science Virtual Machine- Ubuntu 18.04"

  3. 次のウィンドウで [作成] を選択します。On the next window, select Create.

  4. [仮想マシンの作成] ブレードにリダイレクトされます。You should be redirected to the "Create a virtual machine" blade.

  5. ウィザードの各手順を構成するために、次の情報を入力します。Enter the following information to configure each step of the wizard:

    1. [基本] :Basics:

      • サブスクリプション:複数のサブスクリプションがある場合は、マシンが作成されて課金されるサブスクリプションを選択します。Subscription: If you have more than one subscription, select the one on which the machine will be created and billed. そのサブスクリプションに対するリソース作成権限が必要です。You must have resource creation privileges for this subscription.

      • [リソース グループ] :新しいグループを作成するか、既存のグループを使用します。Resource group: Create a new group or use an existing one.

      • [仮想マシン名] : 仮想マシンの名前を入力します。Virtual machine name: Enter the name of the virtual machine. この名前は Azure portal で使用されます。This name will be used in your Azure portal.

      • [リージョン] :最適なデータ センターを選択します。Region: Select the datacenter that's most appropriate. ネットワーク アクセスを最速にするために、データの大半が存在するデータセンターか、物理的に最も近くにあるデータセンターを選びます。For fastest network access, it's the datacenter that has most of your data or is closest to your physical location. 詳細については、Azure リージョンに関する記事を参照してください。Learn more about Azure Regions.

      • イメージ:既定値をそのまま使用します。Image: Leave the default value.

      • Size:このオプションには、一般的なワークロードに適したサイズが自動的に設定されます。Size: This option should autopopulate with a size that is appropriate for general workloads. 詳細については、Azure の Linux VM のサイズに関する記事を参照してください。Read more about Linux VM sizes in Azure.

      • [認証の種類] : 設定を迅速に行うには、[パスワード] を選択します。Authentication type: For quicker setup, select "Password."

        注意

        JupyterHub を使用する場合は、JupyterHub は SSH 公開キーを使用するように構成されて "いない" ため、必ず [パスワード] を選択します。If you intend to use JupyterHub, make sure to select "Password," as JupyterHub is not configured to use SSH public keys.

      • [ユーザー名] : 管理者のユーザー名を入力します。Username: Enter the administrator username. このユーザー名を使用して、仮想マシンにログインします。You'll use this username to log into your virtual machine. このユーザー名は Azure ユーザー名と同じである必要はありません。This username need not be the same as your Azure username. 大文字は使用 "しない" でください。Do not use capitalized letters.

        重要

        ユーザー名に大文字を使用すると、JupyterHub が機能しなくなり、500 内部サーバー エラーが発生します。If you use capitalized letters in your username, JupyterHub will not work, and you'll encounter a 500 internal server error.

      • パスワード:仮想マシンへのログインに使用するパスワードを入力します。Password: Enter the password you'll use to log into your virtual machine.

    2. [Review + create](レビュー + 作成) を選択します。Select Review + create.

    3. [レビュー + 作成]Review+create

      • 入力したすべての情報が正しいことを確認します。Verify that all the information you entered is correct.
      • [作成] を選択しますSelect Create.

    プロビジョニングには 5 分くらいかかります。The provisioning should take about 5 minutes. この状態は Azure portal に表示されます。The status is displayed in the Azure portal.

Ubuntu Data Science Virtual Machine にアクセスする方法How to access the Ubuntu Data Science Virtual Machine

Ubuntu DSVM には、次の 3 つの方法のいずれかでアクセスできます。You can access the Ubuntu DSVM in one of three ways:

  • ターミナル セッションの場合の SSHSSH for terminal sessions
  • グラフィカル セッションの場合の X2GoX2Go for graphical sessions
  • Jupyter Notebook の場合の JupyterHub と JupyterLabJupyterHub and JupyterLab for Jupyter notebooks

また、Data Science Virtual Machine を Azure Notebooks に接続して、VM で Jupyter Notebook を実行し、無料のサービス レベルの制限をバイパスすることもできます。You can also attach a Data Science Virtual Machine to Azure Notebooks to run Jupyter notebooks on the VM and bypass the limitations of the free service tier. 詳細については、Azure Notebooks プロジェクトの管理と構成に関するページを参照してください。For more information, see Manage and configure Azure Notebooks projects.

SSHSSH

SSH 認証を使用して VM を構成した場合、テキスト シェル インターフェイスの手順 3 の [基本] セクションで作成したアカウント資格情報を使用してログオンできます。If you configured your VM with SSH authentication, you can logon using the account credentials that you created in the Basics section of step 3 for the text shell interface. Windows では、PuTTY などの SSH クライアント ツールをダウンロードできます。On Windows, you can download an SSH client tool like PuTTY. グラフィカル デスクトップ (X ウィンドウ システム) を使用する場合は、PuTTY で X11 転送を使用できます。If you prefer a graphical desktop (X Window System), you can use X11 forwarding on PuTTY.

注意

テストでは、パフォーマンスは、X11 転送よりも、X2Go クライアントの方が優れていました。The X2Go client performed better than X11 forwarding in testing. グラフィカル デスクトップ インターフェイスでは、X2Go クライアントを使用することをお勧めします。We recommend using the X2Go client for a graphical desktop interface.

X2GoX2Go

Linux VM は、既に X2Go サーバーでプロビジョニングされており、クライアント接続を受け入れる準備ができています。The Linux VM is already provisioned with X2Go Server and ready to accept client connections. Linux VM のグラフィカル デスクトップに接続するには、クライアントで次の手順を実行します。To connect to the Linux VM graphical desktop, complete the following procedure on your client:

  1. X2Goのページから、お使いのクライアント プラットフォーム向けの X2Go クライアントをダウンロードしてインストールします。Download and install the X2Go client for your client platform from X2Go.

  2. 仮想マシンのパブリック IP アドレスをメモしておきます。これは、作成した仮想マシンを開いて Azure portal で確認できます。Make note of the virtual machine's public IP address, which you can find in the Azure portal by opening the virtual machine you created.

    Ubuntu マシンの IP アドレス

  3. X2Go クライアントを実行します。Run the X2Go client. [新しいセッション] ウィンドウが自動的にポップアップ表示されない場合は、[セッション] > [新しいセッション] に移動します。If the "New Session" window doesn't pop up automatically, go to Session -> New Session.

  4. 結果の構成ウィンドウで、次の構成パラメーターを入力します。On the resulting configuration window, enter the following configuration parameters:

    • [Session] (セッション) タブ:Session tab:
      • [Host](ホスト) : 前にメモした VM の IP アドレスを入力します。Host: Enter the IP address of your VM, which you made note of earlier.
      • [Login](ログイン) : Linux VM 上のユーザー名を入力します。Login: Enter the username on the Linux VM.
      • [SSH Port](SSH ポート) : 既定値の 22 のままにします。SSH Port: Leave it at 22, the default value.
      • [Session Type](セッションの種類) : 値を XFCE に変更します。Session Type: Change the value to XFCE. 現在、Linux VM でサポートされるのは XFCE デスクトップのみです。Currently, the Linux VM supports only the XFCE desktop.
    • [Media](メディア) タブ: 音声のサポートとクライアントの印刷を使用しない場合は、それらをオフにできます。Media tab: You can turn off sound support and client printing if you don't need to use them.
    • [Shared folders](共有フォルダー) : このタブを使用して、VM にマウントするクライアント マシン ディレクトリを追加します。Shared folders: Use this tab to add client machine directory that you would like to mount on the VM.

    X2go の構成

  5. [OK] を選択します。Select OK.

  6. VM のログイン画面を表示するには、X2Go ウィンドウの右側のウィンドウにあるボックスをクリックします。Click on the box in the right pane of the X2Go window to bring up the log-in screen for your VM.

  7. VM のパスワードを入力します。Enter the password for your VM.

  8. [OK] を選択します。Select OK.

  9. ファイアウォールをバイパスして接続を完了するには、X2Go アクセス許可の付与が必要な場合があります。You may have to give X2Go permission to bypass your firewall to finish connecting.

  10. これで、Ubuntu DSVM のグラフィカル インターフェイスが表示されます。You should now see the graphical interface for your Ubuntu DSVM.

JupyterHub と JupyterLabJupyterHub and JupyterLab

Ubuntu DSVM は、マルチユーザーの Jupyter サーバーである JupyterHub を実行します。The Ubuntu DSVM runs JupyterHub, a multiuser Jupyter server. 接続するには、次の手順を実行します。To connect, take the following steps:

  1. Azure portal で VM を検索して選択し、VM のパブリック IP アドレスをメモしておきます。Make note of the public IP address for your VM, by searching for and selecting your VM in the Azure portal. Ubuntu マシンの IP アドレスUbuntu machine IP address

  2. ローカル コンピューターから Web ブラウザーを開き、https://your-vm-ip:8000 に移動します。"your-vm-ip" は、前にメモした IP アドレスに置き換えます。From your local machine, open a web browser and navigate to https://your-vm-ip:8000, replacing "your-vm-ip" with the IP address you took note of earlier.

  3. ブラウザーにより、証明書エラーが発生したことが報告され、ページを直接開けなくなる場合があります。Your browser will probably prevent you from opening the page directly, telling you that there's a certificate error. DSVM では、自己署名証明書を使用してセキュリティを提供しています。The DSVM is providing security via a self-signed certificate. ほとんどのブラウザーでは、この警告の後にクリック スルーすることができます。Most browsers will allow you to click through after this warning. 多くのブラウザーでは、Web セッション全体の証明書に関する何らかの視覚的な警告が引き続き提供されます。Many browsers will continue to provide some kind of visual warning about the certificate throughout your Web session.

  4. VM を作成するときに使ったユーザー名とパスワードを入力してサインインしてください。Enter the username and password that you used to create the VM, and sign in.

    Jupyter ログインを入力する

注意

この段階で 500 エラーが発生した場合、ユーザー名に大文字を使用した可能性があります。If you receive a 500 Error at this stage, it is likely that you used capitalized letters in your username. これは、JupyterHub と、それが使用する PAMAuthenticator の間の既知の相互作用です。This is a known interaction between Jupyter Hub and the PAMAuthenticator it uses.

  1. 入手できる多くのサンプル ノートブックを参照します。Browse the many sample notebooks that are available.

次世代の Jupyter Notebook と JupyterHub である JupyterLab も利用できます。JupyterLab, the next generation of Jupyter notebooks and JupyterHub, is also available. これにアクセスするには、JupyterHub にサインインし、URL https://your-vm-ip:8000/user/your-username/lab を参照します。"your-username" は VM の構成時に選択したユーザー名に置き換えます。To access it, sign in to JupyterHub, and then browse to the URL https://your-vm-ip:8000/user/your-username/lab, replacing "your-username" with the username you chose when configuring the VM. この場合も、証明書のエラーが原因で、最初はサイトへのアクセスがブロックされることがあります。Again, you may be initially blocked from accessing the site because of a certificate error.

次の行を /etc/jupyterhub/jupyterhub_config.py に追加すれば、JupyterLab を既定のノートブック サーバーとして設定できます。You can set JupyterLab as the default notebook server by adding this line to /etc/jupyterhub/jupyterhub_config.py:

c.Spawner.default_url = '/lab'

次のステップNext steps

学習と調査をどのように続ければよいかを以下に示します。Here's how you can continue your learning and exploration:

  • Linux Data Science Virtual Machine でのデータ サイエンスに関するチュートリアルでは、ここでプロビジョニングされた Linux DSVM を使用して、一般的なデータ サイエンス タスクをいくつか実行する方法を示します。The Data science on the Data Science Virtual Machine for Linux walkthrough shows you how to do several common data science tasks with the Linux DSVM provisioned here.
  • この記事で説明しているツールを試して、DSVM 上のさまざまなデータ サイエンス ツールを確認します。Explore the various data science tools on the DSVM by trying out the tools described in this article. VM にインストールされているツールの基本的な概要と詳細情報を入手できる場所は、仮想マシン内のシェルで dsvm-more-info を実行して確認することもできます。You can also run dsvm-more-info on the shell within the virtual machine for a basic introduction and pointers to more information about the tools installed on the VM.
  • Team Data Science Processを使用して、分析ソリューションを体系的に構築する方法を確認します。Learn how to systematically build analytical solutions using the Team Data Science Process.
  • Azure AI サービスを使用する機械学習とデータ分析のサンプルについては、Azure AI Gallery を参照してください。Visit the Azure AI Gallery for machine learning and data analytics samples that use the Azure AI services.
  • この仮想マシンに適したリファレンス ドキュメントを参照してください。Consult the appropriate reference documentation for this virtual machine.