O que é a Máquina Virtual de Ciência de Dados do Azure para Linux e Windows?What is the Azure Data Science Virtual Machine for Linux and Windows?

A DSVM (Máquina Virtual de Ciência de Dados) é uma imagem de VM personalizada plataforma de nuvem do Azure especificamente criada para ciência de dados.The Data Science Virtual Machine (DSVM) is a customized VM image on the Azure cloud platform built specifically for doing data science. Ela tem muitas ferramentas populares de ciência de dados pré-instaladas e pré-configuradas a fim de iniciar rapidamente a criação de aplicativos inteligentes para análise avançada.It has many popular data science tools preinstalled and pre-configured to jump-start building intelligent applications for advanced analytics.

O DSVM está disponível em:The DSVM is available on:

  • Windows Server 2019Windows Server 2019
  • Ubuntu 18.04 LTSUbuntu 18.04 LTS

Comparação com o Azure Machine LearningComparison with Azure Machine Learning

A DSVM é uma imagem de VM personalizada para ciência de dados, enquanto o Azure ML (Azure Machine Learning) é uma plataforma completa que abrange:The DSVM is a customized VM image for Data Science but Azure Machine Learning (AzureML) is an end-to-end platform that encompasses:

  • Computação totalmente gerenciadaFully Managed Compute
    • Instâncias de computaçãoCompute Instances
    • Clusters de computação para tarefas de ML distribuídasCompute Clusters for distributed ML tasks
    • Clusters de inferência para pontuação em tempo realInference Clusters for real-time scoring
  • Armazenamentos de dados (por exemplo, Blob, ADLS Gen2, BD SQL)Datastores (for example Blob, ADLS Gen2, SQL DB)
  • Acompanhamento de experimentosExperiment tracking
  • Gerenciamento de modelosModel management
  • NotebooksNotebooks
  • Ambientes (gerenciam dependências do Conda e do R)Environments (manage conda and R dependencies)
  • RotulagemLabeling
  • Pipelines (automatizam fluxos de trabalho de ciência de dados de ponta a ponta)Pipelines (automate End-to-End Data science workflows)

Comparação com as instâncias de computação do AzureMLComparison with AzureML Compute Instances

As instâncias de Computação do Azure Machine Learning são uma imagem de VM totalmente configurada e gerenciada, enquanto a DSVM é uma VM não gerenciada.Azure Machine Learning Compute Instances are a fully configured and managed VM image whereas the DSVM is an unmanaged VM.

As principais diferenças entre essas duas ofertas de produtos são detalhadas abaixo:The key differences between these two product offerings are detailed below:

RecursoFeature Ciência de dadosData Science
VMVM
AzureMLAzureML
Instância de computaçãoCompute Instance
Totalmente gerenciadoFully Managed NãoNo SimYes
Suporte ao idiomaLanguage Support Python, R, Julia, SQL, C#,Python, R, Julia, SQL, C#,
Java, Node.js, F#Java, Node.js, F#
Python e RPython and R
Sistema operacionalOperating System UbuntuUbuntu
WindowsWindows
UbuntuUbuntu
Opção de GPU pré-configuradaPre-Configured GPU Option SimYes SimYes
Opção de escala verticalScale up option SimYes SimYes
Acesso ao SSHSSH Access SimYes SimYes
Acesso ao RDPRDP Access SimYes NãoNo
InternoBuilt-in
Notebooks hospedadosHosted Notebooks
NãoNo
(exige configuração adicional)(requires additional configuration)
SimYes
SSO internoBuilt-in SSO NãoNo
(exige configuração adicional)(requires additional configuration)
SimYes
Colaboração internaBuilt-in Collaboration NãoNo SimYes
Ferramentas pré-instaladasPre-installed Tools Jupyter (laboratório), RStudio Server, VS Code,Jupyter(lab), RStudio Server, VSCode,
Visual Studio, PyCharm, Juno,Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,Power BI Desktop, SSMS,
Microsoft Office 365, Apache DrillMicrosoft Office 365, Apache Drill
Jupyter (laboratório)Jupyter(lab)
RStudio ServerRStudio Server

Casos de uso de exemploSample Use Cases

Abaixo, ilustramos alguns casos de uso comuns para clientes da DSVM.Below we illustrate some common use cases for DSVM customers.

Avaliação e experimento de curto prazoShort-term experimentation and evaluation

Use a DSVM para avaliar ou aprender a usar novas ferramentas de ciência de dados, especialmente vendo algumas de nossas amostras e nossos passos a passos publicados.You can use the DSVM to evaluate or learn new data science tools, especially by going through some of our published samples and walkthroughs.

Aprendizado profundo com GPUsDeep learning with GPUs

Na DSVM, seus modelos de treinamento podem usar algoritmos de aprendizado profundo em hardware baseado em GPUs (unidades de processamento gráfico).In the DSVM, your training models can use deep learning algorithms on hardware that's based on graphics processing units (GPUs). Aproveitando os recursos de dimensionamento de VM da plataforma Azure, a DSVM ajuda a usar o hardware baseado em GPU na nuvem de acordo com suas necessidades.By taking advantage of the VM scaling capabilities of the Azure platform, the DSVM helps you use GPU-based hardware in the cloud according to your needs. É possível mudar para uma VM baseada em GPU durante o treinamento de modelos grandes ou quando houver necessidade de cálculos em alta velocidade mantendo o mesmo disco do SO.You can switch to a GPU-based VM when you're training large models, or when you need high-speed computations while keeping the same OS disk. Escolha um dos SKUs de máquina virtual habilitada para GPUs da série N com a DSVM.You can choose any of the N series GPUs enabled virtual machine SKUs with DSVM. Observe que não há suporte para SKUs de máquina virtual habilitada para GPU em contas gratuitas do Azure.Note GPU enabled virtual machine SKUs are not supported on Azure free accounts.

As edições do Windows da DSVM vêm pré-instaladas com drivers de GPU, estruturas e versões de GPU de estruturas de aprendizado profundo.The Windows editions of the DSVM come pre-installed with GPU drivers, frameworks, and GPU versions of deep learning frameworks. Nas edições do Linux, o aprendizado profundo em GPUs está habilitado nas DSVMs do Ubuntu.On the Linux editions, deep learning on GPUs is enabled on the Ubuntu DSVMs.

Você também pode implantar as edições para Ubuntu ou Windows da DSVM em uma máquina virtual do Azure não baseada em GPUs.You can also deploy the Ubuntu or Windows editions of the DSVM to an Azure virtual machine that isn't based on GPUs. Nesse caso, todas as estruturas de aprendizado profundo farão o fallback para o modo de CPU.In this case, all the deep learning frameworks will fall back to the CPU mode.

Saiba mais sobre o aprendizado profundo e as estruturas de IA disponíveis.Learn more about available deep learning and AI frameworks.

Educação e treinamento de ciência de dadosData science training and education

Os treinadores corporativos e educadores que dão aulas de ciência de dados geralmente fornecem uma imagem de máquina virtual.Enterprise trainers and educators who teach data science classes usually provide a virtual machine image. A imagem garante que os alunos tenham uma configuração consistente e que as amostras funcionem de maneira previsível.The image ensures students have a consistent setup and that the samples work predictably.

A DSVM cria um ambiente sob demanda com uma configuração consistente que facilita o suporte e os desafios de incompatibilidade.The DSVM creates an on-demand environment with a consistent setup that eases the support and incompatibility challenges. Nos casos em que esses ambientes precisam ser criados com frequência, especialmente para aulas rápidas de treinamento, os alunos são consideravelmente beneficiados.Cases where these environments need to be built frequently, especially for shorter training classes, benefit substantially.

O que está incluso na DSVM?What's included on the DSVM?

Confira uma lista completa de ferramentas em DSVMs do Windows e do Linux aqui.See a full list of tools on both the Windows and Linux DSVMs here.

Próximas etapasNext steps

Saiba mais com estes artigos:Learn more with these articles: