Quickstart: De Data Science Virtual Machine instellen voor Linux (Ubuntu)Quickstart: Set up the Data Science Virtual Machine for Linux (Ubuntu)

Aan de slag met de Ubuntu 18.04 Data Science Virtual Machine.Get up and running with the Ubuntu 18.04 Data Science Virtual Machine.

VereistenPrerequisites

Voor het maken van een Ubuntu 18.04 Data Science Virtual Machine moet u over een Azure-abonnement beschikken.To create an Ubuntu 18.04 Data Science Virtual Machine, you must have an Azure subscription. Azure gratis uitproberen.Try Azure for free.

Notitie

Gratis Azure-accounts bieden geen ondersteuning voor SKU’s voor virtuele machines met GPU ingeschakeld.Azure free accounts don't support GPU enabled virtual machine SKUs.

Uw Data Science Virtual Machine voor Linux makenCreate your Data Science Virtual Machine for Linux

Hier ziet u de stappen die u moet uitvoeren om een exemplaar van een Ubuntu 18.04 Data Science Virtual Machine te maken:Here are the steps to create an instance of the Data Science Virtual Machine Ubuntu 18.04:

  1. Ga naar de Azure Portal.Go to the Azure portal. Als u nog niet bent aangemeld bij uw Azure-account, wordt u gevraagd om dit te doen.You might be prompted to sign in to your Azure account if you're not already signed in.

  2. Zoek de vermelding van de virtuele machine door 'data science virtual machine' te typen en Data Science Virtual Machine - Ubuntu 18.04 te selecteren.Find the virtual machine listing by typing in "data science virtual machine" and selecting "Data Science Virtual Machine- Ubuntu 18.04"

  3. Selecteer Maken in het volgende venster.On the next window, select Create.

  4. U wordt omgeleid naar de blade Een virtuele machine maken.You should be redirected to the "Create a virtual machine" blade.

  5. Voer de volgende gegevens in voor het configureren van elke stap in de wizard:Enter the following information to configure each step of the wizard:

    1. Basisprincipes:Basics:

      • Abonnement: Als u meer dan één abonnement hebt, selecteert u datgene waarop de machine wordt gemaakt en gefactureerd.Subscription: If you have more than one subscription, select the one on which the machine will be created and billed. U hebt privileges voor het maken van resources nodig voor dit abonnement.You must have resource creation privileges for this subscription.

      • Resourcegroep: Maak een nieuwe groep of gebruik een bestaande.Resource group: Create a new group or use an existing one.

      • Naam van virtuele machine: Voer de naam van de virtuele machine in.Virtual machine name: Enter the name of the virtual machine. Deze naam wordt gebruikt in uw Azure Portal.This name will be used in your Azure portal.

      • Regio: Selecteer het geschiktste datacenter.Region: Select the datacenter that's most appropriate. Dit is het datacenter waarop de meeste van uw gegevens zijn opgeslagen of dat zich fysiek het dichtst bij u in de buurt bevindt, voor de snelste netwerktoegang.For fastest network access, it's the datacenter that has most of your data or is closest to your physical location. Meer informatie over Azure-regio's.Learn more about Azure Regions.

      • Installatiekopie: Laat de standaardwaarde staan.Image: Leave the default value.

      • Grootte: Deze optie moet automatisch worden gevuld met een grootte die geschikt is voor algemene werkbelastingen.Size: This option should autopopulate with a size that is appropriate for general workloads. VM Linux VM-grootten in Azure.Read more about Linux VM sizes in Azure.

      • Verificatietype: Selecteer Wachtwoord voor snellere installatie.Authentication type: For quicker setup, select "Password."

        Notitie

        Als u JupyterHub wilt gebruiken moet u Wachtwoord selecteren, omdat JupyterHub niet is geconfigureerd voor het gebruik van openbare SSH-sleutels.If you intend to use JupyterHub, make sure to select "Password," as JupyterHub is not configured to use SSH public keys.

      • Gebruikersnaam: Voer de gebruikersnaam van de beheerder in.Username: Enter the administrator username. Met deze gebruikersnaam meldt u zich aan bij de virtuele machine.You'll use this username to log into your virtual machine. Deze gebruikersnaam hoeft niet hetzelfde te zijn als uw Azure-gebruikersnaam.This username need not be the same as your Azure username. Gebruik geen hoofdletters.Do not use capitalized letters.

        Belangrijk

        Als u hoofdletters gebruikt in de gebruikersnaam, werkt JupyterHub niet en krijgt u een foutmelding 500 Interne serverfout.If you use capitalized letters in your username, JupyterHub will not work, and you'll encounter a 500 internal server error.

      • Wachtwoord: Voer het wachtwoord in waarmee u zich gaat aanmelden bij de virtuele machine.Password: Enter the password you'll use to log into your virtual machine.

    2. Selecteer Controleren + maken.Select Review + create.

    3. Beoordelen en makenReview+create

      • Controleer of alle informatie die u hebt ingevoerd, correct is.Verify that all the information you entered is correct.
      • Selecteer Maken.Select Create.

    Het inrichten duurt ongeveer 5 minuten.The provisioning should take about 5 minutes. De status wordt weergegeven in de Azure Portal.The status is displayed in the Azure portal.

Toegang tot de Ubuntu Data Science Virtual MachineHow to access the Ubuntu Data Science Virtual Machine

U kunt op een van de volgende drie manieren toegang krijgen tot de Ubuntu DSVM:You can access the Ubuntu DSVM in one of three ways:

  • SSH voor terminalsessiesSSH for terminal sessions
  • X2Go voor grafische sessiesX2Go for graphical sessions
  • JupyterHub en JupyterLab voor Jupyter-notebooksJupyterHub and JupyterLab for Jupyter notebooks

U kunt ook een Data Science Virtual Machine aan Azure Notebooks koppelen om Jupyter-notebooks op de virtuele machine uit te voeren en de beperkingen van de gratis servicelaag te omzeilen.You can also attach a Data Science Virtual Machine to Azure Notebooks to run Jupyter notebooks on the VM and bypass the limitations of the free service tier. Zie Azure Notebooks-projecten beheren en configurerenvoor meer informatie.For more information, see Manage and configure Azure Notebooks projects.

SSHSSH

Als u uw virtuele machine met SSH-verificatie hebt geconfigureerd, kunt u zich aanmelden met de accountreferenties die u hebt gemaakt in het gedeelte Basisinstellingen van stap 3 voor de tekstshell-interface.If you configured your VM with SSH authentication, you can logon using the account credentials that you created in the Basics section of step 3 for the text shell interface. In Windows kunt u een SSH-clienthulpprogramma zoals PuTTY downloaden.On Windows, you can download an SSH client tool like PuTTY. Als u liever een grafisch bureaublad (X Window-systeem) gebruikt, kunt u gebruikmaken van X11-doorsturing in PuTTy.If you prefer a graphical desktop (X Window System), you can use X11 forwarding on PuTTY.

Notitie

In tests presteerde de X2Go-client beter dan X11-doorsturing.The X2Go client performed better than X11 forwarding in testing. Voor een grafische desktop adviseren we het gebruik van de X2Go-client.We recommend using the X2Go client for a graphical desktop interface.

X2GoX2Go

De virtuele Linux-machine is al ingericht met X2Go Server en is klaar om clientverbindingen te accepteren.The Linux VM is already provisioned with X2Go Server and ready to accept client connections. Om verbinding te maken met het grafische bureaublad van de virtuele Linux-machine, voert u de volgende procedure uit op de client:To connect to the Linux VM graphical desktop, complete the following procedure on your client:

  1. Download en installeer de X2Go-client voor uw clientplatform van X2Go.Download and install the X2Go client for your client platform from X2Go.

  2. Noteer het openbare IP-adres van de virtuele machine, dat u in de Azure Portal kunt vinden door de virtuele machine te openen die u hebt gemaakt.Make note of the virtual machine's public IP address, which you can find in the Azure portal by opening the virtual machine you created.

    IP-adres Ubuntu-machine

  3. Start de X2Go-client.Run the X2Go client. Als het venster Nieuwe sessie niet automatisch wordt weergegeven, gaat u naar Sessie -> Nieuwe sessie.If the "New Session" window doesn't pop up automatically, go to Session -> New Session.

  4. Voer in het configuratievenster dat wordt geopend de volgende configuratieparameters in:On the resulting configuration window, enter the following configuration parameters:

    • Tabblad sessie:Session tab:
      • Host: Voer het IP-adres van uw virtuele machine in, dat u eerder hebt genoteerd.Host: Enter the IP address of your VM, which you made note of earlier.
      • Aanmelden: Voer de gebruikersnaam in op de virtuele Linux-machine.Login: Enter the username on the Linux VM.
      • SSH-poort: Behoud de standaardwaarde 22.SSH Port: Leave it at 22, the default value.
      • Sessietype: Wijzig de waarde in XFCE.Session Type: Change the value to XFCE. Momenteel ondersteunt de virtuele Linux-machine alleen het XFCE-bureaublad.Currently, the Linux VM supports only the XFCE desktop.
    • Tabblad media: U kunt ondersteuning voor geluid en afdrukken met de client uitschakelen als u die niet nodig hebt.Media tab: You can turn off sound support and client printing if you don't need to use them.
    • Gedeelde mappen: Gebruik dit tabblad om de map op de clientmachine toe te voegen die u wilt koppelen aan de virtuele machine.Shared folders: Use this tab to add client machine directory that you would like to mount on the VM.

    X2go-configuratie

  5. Selecteer OK.Select OK.

  6. Klik op het vak in het rechterdeelvenster van het X2Go-venster om het aanmeldingsscherm voor uw virtuele machine weer te geven.Click on the box in the right pane of the X2Go window to bring up the log-in screen for your VM.

  7. Voer het wachtwoord voor de virtuele machine in.Enter the password for your VM.

  8. Selecteer OK.Select OK.

  9. Mogelijk moet u X2Go toestemming geven om uw firewall te omzeilen voor het voltooien van de verbinding.You may have to give X2Go permission to bypass your firewall to finish connecting.

  10. De grafische interface van de Ubuntu Data Science Virtual Machine wordt nu weergegeven.You should now see the graphical interface for your Ubuntu DSVM.

JupyterHub en JupyterlabJupyterHub and JupyterLab

Op de Ubuntu DSVM wordt JupyterHub uitgevoerd, een Jupyter-server voor meerdere gebruikers.The Ubuntu DSVM runs JupyterHub, a multiuser Jupyter server. Voer dan de volgende stappen uit om verbinding te maken:To connect, take the following steps:

  1. Noteer het openbare IP-adres van uw virtuele machine door de virtuele machine in de Azure Portal te zoeken en te selecteren.Make note of the public IP address for your VM, by searching for and selecting your VM in the Azure portal. IP-adres Ubuntu-machineUbuntu machine IP address

  2. Open op uw lokale computer een webbrowser en ga naar https://VM-IP: 8000, waarbij u ' VM-IP ' vervangt door het IP-adres dat u eerder hebt genoteerd.From your local machine, open a web browser and navigate to https://your-vm-ip:8000, replacing "your-vm-ip" with the IP address you took note of earlier.

  3. Waarschijnlijk kunt u de pagina niet rechtstreeks openen in de browser vanwege een certificaatfout.Your browser will probably prevent you from opening the page directly, telling you that there's a certificate error. De DSVM is beveiligd met een zelfondertekend certificaat.The DSVM is providing security via a self-signed certificate. In de meeste browsers kunt u verdergaan na deze waarschuwing.Most browsers will allow you to click through after this warning. In veel browsers wordt er gedurende de websessie een visuele waarschuwing over het certificaat getoond.Many browsers will continue to provide some kind of visual warning about the certificate throughout your Web session.

    Notitie

    Als het foutbericht ERR_EMPTY_RESPONSE in uw browser wordt weergegeven, controleert u of u toegang hebt tot de computer door expliciet het HTTPS-protocol te gebruiken en niet HTTP of alleen het webadres.If you see the ERR_EMPTY_RESPONSE error message in your browser, make sure you access the machine by explicitly using the HTTPS protocol, and not by using HTTP or just the web address. Als u het webadres zonder https:// in de adresregel typt, gaan de meeste browsers standaard naar http en dan ziet u deze fout.If you type the web address without https:// in the address line, most browsers will default to http, and you will see this error.

  4. Voer de gebruikersnaam en het wachtwoord in die u hebt gebruikt om de virtuele machine te maken en meld u aan.Enter the username and password that you used to create the VM, and sign in.

    Aanmeldingsgegevens Jupyter invoeren

    Notitie

    Als er in deze fase een 500-fout wordt weergegeven, hebt u waarschijnlijk hoofdletters gebruikt in uw gebruikersnaam.If you receive a 500 Error at this stage, it is likely that you used capitalized letters in your username. Dit is een bekende interactie tussen Jupyter Hub en de PAMAuthenticator die wordt gebruikt.This is a known interaction between Jupyter Hub and the PAMAuthenticator it uses. Als u de fout 'Kan deze pagina niet bereiken' ontvangt, moeten uw machtigingen voor de netwerkbeveiligingsgroep waarschijnlijk worden aangepast.If you receive a "Can't reach this page" error, it is likely that your Network Security Group permissions need to be adjusted. Zoek in Azure Portal de netwerkbeveiligingsgroep binnen de resourcegroep.In the Azure portal, find the Network Security Group resource within your Resource Group. Als u via openbaar internet toegang wilt tot JupyterHub, moet poort 8000 open zijn.To access JupyterHub from the public Internet, you must have port 8000 open. (In de afbeelding ziet u dat deze VM is geconfigureerd voor Just-in-Time-toegang. Dit wordt zeer aanbevolen.(The image shows that this VM is configured for just-in-time access, which is highly recommended. Zie Beheerpoorten beveiligen met Just-in-Time-toegang.) Configuratie van netwerkbeveiligingsgroepSee Secure your management ports with just-in time access.) Configuration of Network Security Group

  5. Blader door de vele beschikbare voorbeeldnotitieblokken.Browse the many sample notebooks that are available.

Jupyterlab, de volgende generatie Jupyter-notebooks en JupyterHub, is ook beschikbaar.JupyterLab, the next generation of Jupyter notebooks and JupyterHub, is also available. Meld u aan bij JupyterHub en blader vervolgens naar de URL https://VM-IP: 8000/gebruiker/uw-gebruikersnaam/Lab, waarbij u ‘uw-gebruikersnaam’ vervangt door de gebruikersnaam die u hebt gekozen bij het configureren van de virtuele machine.To access it, sign in to JupyterHub, and then browse to the URL https://your-vm-ip:8000/user/your-username/lab, replacing "your-username" with the username you chose when configuring the VM. Ook nu wordt de toegang tot de site mogelijk geblokkeerd vanwege een certificaatfout.Again, you may be initially blocked from accessing the site because of a certificate error.

U kunt Jupyterlab instellen als de standaard notebookserver door deze regel toe te voegen aan /etc/jupyterhub/jupyterhub_config.py:You can set JupyterLab as the default notebook server by adding this line to /etc/jupyterhub/jupyterhub_config.py:

c.Spawner.default_url = '/lab'

Volgende stappenNext steps

U kunt nu verder leren en verkennen:Here's how you can continue your learning and exploration:

  • Zie Datatechnologie op de Linux Data Science Virtual Machine voor een overzicht waarin wordt getoond hoe u enkele algemene data-sciencetaken uitvoert met de Linux DSVM die hier is ingericht.The Data science on the Data Science Virtual Machine for Linux walkthrough shows you how to do several common data science tasks with the Linux DSVM provisioned here.
  • U kunt de verschillende hulpprogramma’s voor data science op de DSVM verkennen door de hulpprogramma’s uit te proberen die in dit artikel worden beschreven.Explore the various data science tools on the DSVM by trying out the tools described in this article. U kunt ook dsvm-more-info uitvoeren in de shell in de virtuele machine voor een basisintroductie en verwijzingen naar meer informatie over de hulpprogramma’s die op de virtuele machine zijn geïnstalleerd.You can also run dsvm-more-info on the shell within the virtual machine for a basic introduction and pointers to more information about the tools installed on the VM.
  • Meer informatie over het systematisch bouwen van analytische oplossingen met het Team Data Science Process.Learn how to systematically build analytical solutions using the Team Data Science Process.
  • Ga naar de Azure AI Gallery voor voorbeelden van machine learning en gegevensanalyse die gebruikmaken van de Azure AI-services.Visit the Azure AI Gallery for machine learning and data analytics samples that use the Azure AI services.
  • Raadpleeg de bijbehorende referentiedocumentatie voor deze virtuele machine.Consult the appropriate reference documentation for this virtual machine.