Início Rápido: Configurar a Máquina Virtual de Ciência de Dados para Linux (Ubuntu)Quickstart: Set up the Data Science Virtual Machine for Linux (Ubuntu)

Coloque tudo em funcionamento com a Máquina Virtual de Ciência de Dados do Ubuntu 18.04.Get up and running with the Ubuntu 18.04 Data Science Virtual Machine.

Pré-requisitosPrerequisites

Para criar uma Máquina Virtual de Ciência de Dados do Ubuntu 18.04, é necessário ter uma assinatura do Azure.To create an Ubuntu 18.04 Data Science Virtual Machine, you must have an Azure subscription. Experimentar o Azure gratuitamente.Try Azure for free.

Observação

As contas gratuitas do Azure não dão suporte a SKUs de máquina virtual habilitada para GPU.Azure free accounts don't support GPU enabled virtual machine SKUs.

Criar sua Máquina Virtual de Ciência de Dados para LinuxCreate your Data Science Virtual Machine for Linux

Veja as etapas para criar uma instância da Máquina Virtual de Ciência de Dados do Ubuntu 18.04:Here are the steps to create an instance of the Data Science Virtual Machine Ubuntu 18.04:

  1. Vá para o Portal do Azure.Go to the Azure portal. Você pode ser solicitado a entrar na sua conta do Azure, caso ainda não esteja conectado.You might be prompted to sign in to your Azure account if you're not already signed in.

  2. Localize a listagem de máquinas virtuais digitando "máquina virtual de ciência de dados" e selecionando "Máquina Virtual de Ciência de Dados – Ubuntu 18.04"Find the virtual machine listing by typing in "data science virtual machine" and selecting "Data Science Virtual Machine- Ubuntu 18.04"

  3. Na próxima janela, selecione Criar.On the next window, select Create.

  4. Você deve ser redirecionado para a folha "Criar uma máquina virtual".You should be redirected to the "Create a virtual machine" blade.

  5. Insira as seguintes informações para configurar cada etapa do assistente:Enter the following information to configure each step of the wizard:

    1. Noções básicas:Basics:

      • Assinatura: se você tiver mais de uma assinatura, selecione aquela em que o computador será criado e cobrado.Subscription: If you have more than one subscription, select the one on which the machine will be created and billed. Você deve ter privilégios de criação de recurso nessa assinatura.You must have resource creation privileges for this subscription.

      • Grupo de recursos: crie um novo grupo ou use um existente.Resource group: Create a new group or use an existing one.

      • Nome da máquina virtual: Insira o nome da máquina virtual.Virtual machine name: Enter the name of the virtual machine. Esse nome será usado em seu portal do Azure.This name will be used in your Azure portal.

      • Região: selecione o datacenter mais apropriado.Region: Select the datacenter that's most appropriate. Para um acesso mais rápido à rede, é o data center que contém a maioria dos seus dados ou que está mais próximo de sua localização física.For fastest network access, it's the datacenter that has most of your data or is closest to your physical location. Leia mais sobre as Regiões do Azure.Learn more about Azure Regions.

      • Imagem: Mantenha o valor padrão.Image: Leave the default value.

      • Size: essa opção deve ser populada automaticamente com um tamanho apropriado para cargas de trabalho gerais.Size: This option should autopopulate with a size that is appropriate for general workloads. Leia mais sobre os tamanhos de VM do Linux no Azure.Read more about Linux VM sizes in Azure.

      • Tipo de autenticação: Para configuração mais rápida, selecione "Senha".Authentication type: For quicker setup, select "Password."

        Observação

        Caso pretenda usar o JupyterHub, selecione "Senha", pois o JupyterHub não é configurado para usar chaves públicas SSH.If you intend to use JupyterHub, make sure to select "Password," as JupyterHub is not configured to use SSH public keys.

      • Nome de usuário: Insira o nome de usuário do administrador.Username: Enter the administrator username. Você usará esse nome de usuário para fazer logon em sua máquina virtual.You'll use this username to log into your virtual machine. Esse nome de usuário não precisa ser igual ao seu nome de usuário do Azure.This username need not be the same as your Azure username. Não use letras em maiúsculas.Do not use capitalized letters.

        Importante

        Se você usar letras em maiúsculas em seu nome de usuário, o JupyterHub não funcionará e você obterá um erro de servidor interno 500.If you use capitalized letters in your username, JupyterHub will not work, and you'll encounter a 500 internal server error.

      • Senha: insira a senha que você usará para fazer logon em sua máquina virtual.Password: Enter the password you'll use to log into your virtual machine.

    2. Selecione Examinar + criar.Select Review + create.

    3. Examinar + criarReview+create

      • Verifique se todas as informações inseridas estão corretas.Verify that all the information you entered is correct.
      • Selecione Criar.Select Create.

    O provisionamento deve demorar cerca de 5 minutos.The provisioning should take about 5 minutes. O status é exibido no portal do Azure.The status is displayed in the Azure portal.

Como acessar a Máquina Virtual de Ciência de Dados do UbuntuHow to access the Ubuntu Data Science Virtual Machine

É possível acessar a DSVM do Ubuntu usando três métodos:You can access the Ubuntu DSVM in one of three ways:

  • SSH para sessões de terminalSSH for terminal sessions
  • X2Go para sessões gráficasX2Go for graphical sessions
  • JupyterHub e JupyterLab para notebooks JupyterJupyterHub and JupyterLab for Jupyter notebooks

SSHSSH

Se você configurou sua VM com a autenticação SSH, poderá fazer logon usando as credenciais da conta que você criou na seção Noções básicas da etapa 3 para a interface do shell de texto.If you configured your VM with SSH authentication, you can logon using the account credentials that you created in the Basics section of step 3 for the text shell interface. No Windows, é possível baixar uma ferramenta de cliente SSH, como o PuTTY.On Windows, you can download an SSH client tool like PuTTY. Se preferir uma área de trabalho gráfica (Sistema Windows X), você poderá usar o encaminhamento X11 no PuTTY.If you prefer a graphical desktop (X Window System), you can use X11 forwarding on PuTTY.

Observação

O cliente X2Go apresentou desempenho melhor do que o encaminhamento X11 em testes.The X2Go client performed better than X11 forwarding in testing. Recomendamos o uso do cliente X2Go para uma interface gráfica de área de trabalho.We recommend using the X2Go client for a graphical desktop interface.

X2GoX2Go

A VM Linux já está provisionada com um servidor X2Go e pronta para aceitar conexões de cliente.The Linux VM is already provisioned with X2Go Server and ready to accept client connections. Para se conectar à área de trabalho gráfica da VM do Linux, realize o seguinte procedimento em seu cliente:To connect to the Linux VM graphical desktop, complete the following procedure on your client:

  1. Baixe e instale o cliente X2Go para sua plataforma de cliente X2Go.Download and install the X2Go client for your client platform from X2Go.

  2. Anote o endereço IP público da máquina virtual, que pode ser encontrado no portal do Azure abrindo a máquina virtual que você criou.Make note of the virtual machine's public IP address, which you can find in the Azure portal by opening the virtual machine you created.

    Endereço IP do computador Ubuntu

  3. Execute o cliente X2Go.Run the X2Go client. Se a janela "Nova Sessão" não aparecer automaticamente, vá para Sessão -> Nova Sessão.If the "New Session" window doesn't pop up automatically, go to Session -> New Session.

  4. Na janela de configuração resultante, insira os seguintes parâmetros de configuração:On the resulting configuration window, enter the following configuration parameters:

    • Guia Sessão:Session tab:
      • Host: Insira o endereço IP de sua VM, que você anotou anteriormente.Host: Enter the IP address of your VM, which you made note of earlier.
      • Logon: Insira o nome de usuário na VM Linux.Login: Enter the username on the Linux VM.
      • Porta SSH: Deixe em 22, o valor padrão.SSH Port: Leave it at 22, the default value.
      • Tipo de Sessão: Altere o valor para XFCE.Session Type: Change the value to XFCE. No momento, a VM Linux dá suporte apenas à área de trabalho XFCE.Currently, the Linux VM supports only the XFCE desktop.
    • Guia Mídia: Você poderá desligar o suporte a som e impressão de cliente se não precisar usá-los.Media tab: You can turn off sound support and client printing if you don't need to use them.
    • Pastas compartilhadas: use essa guia para adicionar o diretório de computador cliente que você deseja montar na VM.Shared folders: Use this tab to add client machine directory that you would like to mount on the VM.

    Configuração do X2Go

  5. Selecione OK.Select OK.

  6. Clique na caixa no painel à direita da janela X2Go para abrir a tela de logon de sua VM.Click on the box in the right pane of the X2Go window to bring up the log-in screen for your VM.

  7. Insira a senha de sua VM.Enter the password for your VM.

  8. Selecione OK.Select OK.

  9. Talvez seja necessário conceder permissão ao X2Go para ignorar o firewall para concluir a conexão.You may have to give X2Go permission to bypass your firewall to finish connecting.

  10. Agora você deve ver a interface gráfica para sua DSVM do Ubuntu.You should now see the graphical interface for your Ubuntu DSVM.

JupyterHub e JupyterLabJupyterHub and JupyterLab

A DSVM do Ubuntu executa o JupyterHub, um servidor Jupyter multiusuário.The Ubuntu DSVM runs JupyterHub, a multiuser Jupyter server. Para conectar, execute as seguintes etapas:To connect, take the following steps:

  1. Anote o endereço IP público de sua VM, pesquisando e selecionando sua VM no portal do Azure.Make note of the public IP address for your VM, by searching for and selecting your VM in the Azure portal. Endereço IP do computador UbuntuUbuntu machine IP address

  2. No computador local, abra um navegador da Web e navegue até https: https://seu-IP-de-VM:8000, substituindo "Seu-IP-de-VM" pelo endereço IP que anotou anteriormente.From your local machine, open a web browser and navigate to https://your-vm-ip:8000, replacing "your-vm-ip" with the IP address you took note of earlier.

  3. Seu navegador provavelmente impedirá que você abra a página diretamente, informando que há um erro de certificado.Your browser will probably prevent you from opening the page directly, telling you that there's a certificate error. O DSVM está fornecendo segurança por meio de um certificado autoassinado.The DSVM is providing security via a self-signed certificate. A maioria dos navegadores permitirá que você clique após esse aviso.Most browsers will allow you to click through after this warning. Muitos navegadores continuarão a fornecer algum tipo de aviso visual sobre o certificado em toda a sessão da Web.Many browsers will continue to provide some kind of visual warning about the certificate throughout your Web session.

    Observação

    Se você vir a mensagem de erro ERR_EMPTY_RESPONSE no navegador, acesse o computador usando explicitamente o protocolo HTTPS – e não o HTTP ou apenas o endereço Web.If you see the ERR_EMPTY_RESPONSE error message in your browser, make sure you access the machine by explicitly using the HTTPS protocol, and not by using HTTP or just the web address. Se você digitar o endereço Web sem https:// na linha de endereço, a maioria dos navegadores usará como padrão http e você verá esse erro.If you type the web address without https:// in the address line, most browsers will default to http, and you will see this error.

  4. Insira o nome de usuário e a senha usados para criar a VM e entre.Enter the username and password that you used to create the VM, and sign in.

    Insira o logon do Jupyter

    Observação

    Se você receber um erro 500 neste estágio, é provável que tenha usado letras maiúsculas em seu nome de usuário.If you receive a 500 Error at this stage, it is likely that you used capitalized letters in your username. Essa é uma interação conhecida entre o Jupyter Hub e o PAMAuthenticator que ele usa.This is a known interaction between Jupyter Hub and the PAMAuthenticator it uses. Se você receber um erro "Não é possível acessar esta página", é provável que suas permissões do Grupo de Segurança de Rede precisem ser ajustadas.If you receive a "Can't reach this page" error, it is likely that your Network Security Group permissions need to be adjusted. No portal do Azure, encontre o recurso de Grupo de Segurança de Rede dentro do Grupo de Recursos.In the Azure portal, find the Network Security Group resource within your Resource Group. Para acessar o JupyterHub da Internet pública, será preciso que a porta 8000 esteja aberta.To access JupyterHub from the public Internet, you must have port 8000 open. (A imagem mostra que essa VM está configurada para acesso just-in-time, o que é altamente recomendado.(The image shows that this VM is configured for just-in-time access, which is highly recommended. Confira Proteja suas portas de gerenciamento com acesso just-in-time.) Configuração do Grupo de Segurança de RedeSee Secure your management ports with just-in time access.) Configuration of Network Security Group

  5. Procure os vários notebooks de exemplo disponíveis.Browse the many sample notebooks that are available.

O JupyterLab, a próxima geração de notebooks Jupyter e JupyterHub, também está disponível.JupyterLab, the next generation of Jupyter notebooks and JupyterHub, is also available. Para acessá-lo, entre no JupyterHub e navegue até a URL https: //seu-IP-de-VM:8000/usuário/seu-nome-de-usuário/lab, substituindo "seu-nome-de-usuário" pelo nome de usuário que você escolheu ao configurar a VM.To access it, sign in to JupyterHub, and then browse to the URL https://your-vm-ip:8000/user/your-username/lab, replacing "your-username" with the username you chose when configuring the VM. Novamente, você pode estar bloqueado inicialmente para acessar o site devido a um erro de certificado.Again, you may be initially blocked from accessing the site because of a certificate error.

É possível definir o JupyterLab como o servidor de Notebook padrão adicionando esta linha a /etc/jupyterhub/jupyterhub_config.py:You can set JupyterLab as the default notebook server by adding this line to /etc/jupyterhub/jupyterhub_config.py:

c.Spawner.default_url = '/lab'

Próximas etapasNext steps

Veja como você pode continuar seu aprendizado e exploração:Here's how you can continue your learning and exploration:

  • O passo a passo Ciência de dados na Máquina Virtual de Ciência de Dados para Linux mostra como executar várias tarefas comuns de ciência de dados com a DSVM Linux provisionada aqui.The Data science on the Data Science Virtual Machine for Linux walkthrough shows you how to do several common data science tasks with the Linux DSVM provisioned here.
  • Explore as várias ferramentas de ciência de dados na DSVM experimentando as ferramentas descritas neste artigo.Explore the various data science tools on the DSVM by trying out the tools described in this article. Você também pode executar dsvm-more-info no shell contido na máquina virtual para uma introdução básica e ponteiros para obter mais informações sobre as ferramentas instaladas na VM.You can also run dsvm-more-info on the shell within the virtual machine for a basic introduction and pointers to more information about the tools installed on the VM.
  • Saiba como criar soluções de análise sistematicamente usando o Processo de Ciência de Dados de Equipe.Learn how to systematically build analytical solutions using the Team Data Science Process.
  • Visite a Galeria de IA do Azure para obter exemplos de análise de dados e aprendizado de máquina que usam os serviços de IA do Azure.Visit the Azure AI Gallery for machine learning and data analytics samples that use the Azure AI services.
  • Consulte a documentação de referência apropriada para esta máquina virtual.Consult the appropriate reference documentation for this virtual machine.