Aracılığıyla paylaş


Windows Veri Bilimi Sanal Makinesi ile veri bilimi

Windows Veri Bilimi Sanal Makinesi (DSVM), veri araştırma ve modelleme görevlerini gerçekleştirebileceğiniz güçlü bir veri bilimi geliştirme ortamıdır. Ortam, şirket içi, bulut veya karma dağıtımlar için analizinizi kullanmaya başlamanızı kolaylaştıran birçok popüler veri analizi aracıyla önceden oluşturulmuş ve paketlenmiştir.

DSVM, Azure hizmetleriyle yakından çalışır. Azure'da, Azure Synapse'te (eski adı SQL DW), Azure Data Lake'te, Azure Depolama veya Azure Cosmos DB'de depolanan verileri okuyabilir ve işleyebilir. Ayrıca Azure Machine Learning gibi diğer analiz araçlarından da yararlanabilir.

Bu makalede, veri bilimi görevlerini gerçekleştirmek ve diğer Azure hizmetleriyle etkileşime geçmek için DSVM'nizi kullanmayı öğreneceksiniz. DSVM'de yapabileceğiniz bazı işlemler şunlardır:

  • Python 2, Python 3 ve Microsoft R kullanarak bir tarayıcıda verilerinizle denemeler yapmak için Jupyter Notebook kullanın. (Microsoft R, R'nin performans için tasarlanmış kurumsal kullanıma hazır bir sürümüdür.)

  • Microsoft Machine Learning Server ve Python kullanarak verileri keşfedin ve DSVM'de yerel olarak modeller geliştirin.

  • Azure portalını veya PowerShell'i kullanarak Azure kaynaklarınızı Yönetici.

  • DSVM'nizde takılabilir sürücü olarak bir Azure Dosyalar paylaşımı oluşturarak depolama alanınızı genişletin ve büyük ölçekli veri kümelerini/kodu tüm ekibinizde paylaşın.

  • GitHub kullanarak ekibinizle kod paylaşın. Önceden yüklenmiş Git istemcilerini kullanarak deponuza erişin: Git Bash ve Git GUI.

  • Azure Blob depolama, Azure Cosmos DB, Azure Synapse (eski adı SQL DW) ve Azure SQL Veritabanı gibi Azure veri ve analiz hizmetlerine erişin.

  • DSVM'de önceden yüklenmiş Power BI Desktop örneğini kullanarak raporlar ve panolar oluşturun ve bunları bulutta dağıtın.

  • Sanal makinenize ek araçlar yükleyin.

Not

Bu makalede listelenen veri depolama ve analiz hizmetlerinin birçoğu için ek kullanım ücretleri uygulanır. Ayrıntılar için Bkz . Azure fiyatlandırma sayfası.

Önkoşullar

Not

Azure ile etkileşim kurmak için Azure Az PowerShell modülünü kullanmanızı öneririz. Başlamak için bkz . Azure PowerShell'i yükleme. Az PowerShell modülüne nasıl geçeceğinizi öğrenmek için bkz. Azure PowerShell’i AzureRM’den Az’ye geçirme.

Jupyter Notebook'u kullanma

Jupyter Notebook, veri keşfetme ve modelleme için tarayıcı tabanlı bir IDE sağlar. Jupyter Notebook'ta Python 2, Python 3 veya R kullanabilirsiniz.

Jupyter Not Defteri'ni başlatmak için Başlat menüsünde veya masaüstünde Jupyter Not Defteri simgesini seçin. DSVM komut isteminde, komutunu jupyter notebook mevcut not defterleriniz olan veya yeni not defterleri oluşturmak istediğiniz dizinden de çalıştırabilirsiniz.

Jupyter'ı başlattıktan sonra DSVM'ye /notebooks önceden paketlenmiş not defterleri gibi dizine gidin. Artık yapabileceklerin:

  • Kodu görmek için not defterini seçin.
  • Shift+Enter tuşlarını seçerek her hücreyi çalıştırın.
  • Hücre>Çalıştır'ı seçerek not defterinin tamamını çalıştırın.
  • Jupyter simgesini (sol üst köşe), sağ taraftaki Yeni düğmesini ve ardından not defteri dilini (çekirdek olarak da bilinir) seçerek yeni bir not defteri oluşturun.

Not

Şu anda Jupyter'deki Python 2.7, Python 3.6, R, Julia ve PySpark çekirdekleri desteklenmektedir. R çekirdeği hem açık kaynak R hem de Microsoft R'de programlamayı destekler.

Not defterindeyken, seçtiğiniz kitaplıkları kullanarak verilerinizi keşfedebilir, modeli derleyebilir ve modeli test edebilirsiniz.

Microsoft Machine Learning Server ile verileri keşfetme ve model geliştirme

Not

Machine Learning Server Tek Başına desteği 1 Temmuz 2021'de sona erecektir. 30 Haziran'dan sonra DSVM görüntülerinden kaldıracağız. Mevcut dağıtımlar yazılıma erişmeye devam edecektir, ancak ulaşılan destek bitiş tarihi nedeniyle 1 Temmuz 2021'de destek sağlanamaz.

Veri analizinizi doğrudan DSVM üzerinde yapmak için R ve Python gibi dilleri kullanabilirsiniz.

R için Visual Studio için R Araçları kullanabilirsiniz. Microsoft, ölçeklenebilir analizleri etkinleştirmek ve paralel öbekli analizde izin verilen bellek boyutundan daha büyük verileri analiz etmek için açık kaynak CRAN R'nin üzerine ek kitaplıklar sağlamıştır.

Python için, Visual Studio için Python Araçları (PTVS) uzantısının önceden yüklenmiş olduğu Visual Studio Community Edition gibi bir IDE kullanabilirsiniz. Varsayılan olarak, PTVS'de yalnızca kök Conda ortamı olan Python 3.6 yapılandırılır. Anaconda Python 2.7'yi etkinleştirmek için aşağıdaki adımları izleyin:

  1. Araçlar>Python Araçları>Python Ortamları'na gidip Visual Studio Community Edition'da + Özel'i seçerek her sürüm için özel ortamlar oluşturun.
  2. Bir açıklama verin ve Anaconda Python 2.7 için ortam ön eki yolunu c:\anaconda\envs\python2 olarak ayarlayın.
  3. Ortamı kaydetmek için Otomatik Algıla>Uygula'yı seçin.

Python ortamları oluşturma hakkında daha fazla bilgi için PTVS belgelerine bakın.

Şimdi yeni bir Python projesi oluşturmak için ayarlandınız. Yeni>Proje>Python'ını Dosyala'ya >gidin ve oluşturduğunuz Python uygulamasının türünü seçin. Python ortamlarına sağ tıklayıp Python Ortamlarını Ekle/Kaldır'ı seçerek geçerli projenin Python ortamını istediğiniz sürüme (Python 2.7 veya 3.6) ayarlayabilirsiniz. PTVS ile çalışma hakkında daha fazla bilgiyi ürün belgelerinde bulabilirsiniz.

Azure kaynaklarını yönetme

DSVM yalnızca analiz çözümünüzü sanal makinede yerel olarak oluşturmanıza izin vermez. Ayrıca Azure bulut platformundaki hizmetlere erişmenizi sağlar. Azure, DSVM'nizden yönetebileceğiniz ve erişebileceğiniz çeşitli işlem, depolama, veri analizi ve diğer hizmetler sağlar.

Azure aboneliğinizi ve bulut kaynaklarınızı yönetmek için iki seçeneğiniz vardır:

Paylaşılan dosya sistemlerini kullanarak depolama alanını genişletme

Veri bilimcileri ekip içindeki büyük veri kümelerini, kodları veya diğer kaynakları paylaşabilir. DSVM'de yaklaşık 45 GB kullanılabilir alan vardır. Depolama alanınızı genişletmek için Azure Dosyalar kullanabilir ve bir veya daha fazla DSVM örneğine bağlayabilir veya REST API aracılığıyla erişebilirsiniz. Ek ayrılmış veri diskleri eklemek için Azure portalını veya Azure PowerShell'i de kullanabilirsiniz.

Not

Azure Dosyalar paylaşımındaki en fazla alan 5 TB'tır. Her dosya için boyut sınırı 1 TB'tır.

Azure PowerShell'de bu betiği kullanarak Azure Dosyalar paylaşımı oluşturabilirsiniz:

# Authenticate to Azure.
Connect-AzAccount
# Select your subscription
Get-AzSubscription –SubscriptionName "<your subscription name>" | Select-AzSubscription
# Create a new resource group.
New-AzResourceGroup -Name <dsvmdatarg>
# Create a new storage account. You can reuse existing storage account if you want.
New-AzStorageAccount -Name <mydatadisk> -ResourceGroupName <dsvmdatarg> -Location "<Azure Data Center Name For eg. South Central US>" -Type "Standard_LRS"
# Set your current working storage account
Set-AzCurrentStorageAccount –ResourceGroupName "<dsvmdatarg>" –StorageAccountName <mydatadisk>

# Create an Azure Files share
$s = New-AzStorageShare <<teamsharename>>
# Create a directory under the file share. You can give it any name
New-AzStorageDirectory -Share $s -Path <directory name>
# List the share to confirm that everything worked
Get-AzStorageFile -Share $s

Artık bir Azure Dosyalar paylaşımı oluşturduğunuza göre, bunu Azure'daki herhangi bir sanal makineye bağlayabilirsiniz. Gecikme süresi ve veri aktarımı ücretlerinden kaçınmak için VM'yi depolama hesabıyla aynı Azure veri merkezine yerleştirmenizi öneririz. Sürücüyü DSVM'ye bağlamaya yönelik Azure PowerShell komutları şunlardır:

# Get the storage key of the storage account that has the Azure Files share from the Azure portal. Store it securely on the VM to avoid being prompted in the next command.
cmdkey /add:<<mydatadisk>>.file.core.windows.net /user:<<mydatadisk>> /pass:<storage key>

# Mount the Azure Files share as drive Z on the VM. You can choose another drive letter if you want.
net use z:  \\<mydatadisk>.file.core.windows.net\<<teamsharename>>

Artık bu sürücüye SANAL makinedeki herhangi bir normal sürücü gibi erişebilirsiniz.

GitHub'da kod paylaşma

GitHub, geliştirici topluluğu tarafından paylaşılan teknolojileri kullanarak çeşitli araçlara yönelik kod örneklerini ve kaynakları bulabileceğiniz bir kod deposudur. Kod dosyalarının sürümlerini izlemek ve depolamak için teknoloji olarak Git'i kullanır. GitHub ayrıca ekibinizin paylaşılan kodunu ve belgelerini depolamak, sürüm denetimi uygulamak ve kodu görüntülemek ve katkıda bulunmak için kimlerin erişimi olduğunu denetlemek için kendi deponuzu oluşturabileceğiniz bir platformdur.

Git'i kullanma hakkında daha fazla bilgi için GitHub yardım sayfalarını ziyaret edin. GitHub'ı ekibinizle işbirliği yapmanın, topluluk tarafından geliştirilen kodu kullanmanın ve topluluğa kod eklemenin yollarından biri olarak kullanabilirsiniz.

DSVM, GitHub deposuna erişmek için komut satırına ve GUI'ye istemci araçlarıyla birlikte yüklenir. Git ve GitHub ile çalışan komut satırı aracı Git Bash olarak adlandırılır. Visual Studio, DSVM'de yüklüdür ve Git uzantılarına sahiptir. Bu araçların simgelerini Başlat menüsünde ve masaüstünde bulabilirsiniz.

GitHub deposundan kod indirmek için komutunu kullanırsınız git clone . Örneğin, Microsoft tarafından yayımlanan veri bilimi deposunu geçerli dizine indirmek için Git Bash'te aşağıdaki komutu çalıştırabilirsiniz:

git clone https://github.com/Azure/DataScienceVM.git

Visual Studio'da aynı kopyalama işlemini yapabilirsiniz. Aşağıdaki ekran görüntüsünde, Visual Studio'da Git ve GitHub araçlarına erişme gösterilmektedir:

GitHub bağlantısının görüntülendiği Visual Studio'nun ekran görüntüsü

GitHub deponuzla çalışmak için Git'i kullanma hakkında daha fazla bilgiyi github.com'da bulunan kaynaklardan bulabilirsiniz. Başvuru sayfası yararlı bir başvurudur.

Azure veri ve analiz hizmetlerine erişme

Azure Blob Depolama

Azure Blob depolama, büyük ve küçük veriler için güvenilir, ekonomik bir bulut depolama hizmetidir. Bu bölümde verileri Blob depolamaya nasıl taşıyabileceğiniz ve azure blobunda depolanan verilere nasıl erişebileceğiniz açıklanmaktadır.

Önkoşullar

  • Azure portaldan Azure Blob depolama hesabınızı oluşturun.

    Azure portalında depolama hesabı oluşturma işleminin ekran görüntüsü

  • Komut satırı AzCopy aracının önceden yüklendiğini onaylayın: C:\Program Files (x86)\Microsoft SDKs\Azure\AzCopy\azcopy.exe. azcopy.exe içeren dizin zaten PATH ortam değişkeninizde olduğundan, bu aracı çalıştırırken tam komut yolunu yazmaktan kaçınabilirsiniz. AzCopy aracı hakkında daha fazla bilgi için AzCopy belgelerine bakın.

  • Azure Depolama Gezgini aracını başlatın. Depolama Gezgini web sayfasından indirebilirsiniz.

    Depolama hesabına erişim Azure Depolama Gezgini ekran görüntüsü

Vm'den Azure blob'a veri taşıma: AzCopy

Verileri yerel dosyalarınız ve Blob depolama alanınız arasında taşımak için azCopy'yi komut satırında veya PowerShell'de kullanabilirsiniz:

AzCopy /Source:C:\myfolder /Dest:https://<mystorageaccount>.blob.core.windows.net/<mycontainer> /DestKey:<storage account key> /Pattern:abc.txt

C:\myfolder değerini dosyanızın depolandığı yol, mystorageaccount değerini Blob depolama hesabı adınız, mycontainer değerini kapsayıcı adıyla ve depolama hesabı anahtarını blob depolama erişim anahtarınızla değiştirin. Depolama hesabı kimlik bilgilerinizi Azure portalında bulabilirsiniz.

PowerShell'de veya komut isteminden AzCopy komutunu çalıştırın. AzCopy komutunun bazı örnek kullanımı aşağıda verilmiştir:

# Copy *.sql from a local machine to an Azure blob
"C:\Program Files (x86)\Microsoft SDKs\Azure\AzCopy\azcopy" /Source:"c:\Aaqs\Data Science Scripts" /Dest:https://[ENTER STORAGE ACCOUNT].blob.core.windows.net/[ENTER CONTAINER] /DestKey:[ENTER STORAGE KEY] /S /Pattern:*.sql

# Copy back all files from an Azure blob container to a local machine

"C:\Program Files (x86)\Microsoft SDKs\Azure\AzCopy\azcopy" /Dest:"c:\Aaqs\Data Science Scripts\temp" /Source:https://[ENTER STORAGE ACCOUNT].blob.core.windows.net/[ENTER CONTAINER] /SourceKey:[ENTER STORAGE KEY] /S

Azure blob'a kopyalamak için AzCopy komutunu çalıştırdıktan sonra dosyanız Azure Depolama Gezgini görüntülenir.

Karşıya yüklenen CSV dosyasını görüntüleyen depolama hesabının ekran görüntüsü

Vm'den Azure blob'a veri taşıma: Azure Depolama Gezgini

Ayrıca Azure Depolama Gezgini kullanarak vm'nizdeki yerel dosyadan veri yükleyebilirsiniz:

  • Kapsayıcıya veri yüklemek için hedef kapsayıcıyı seçin ve Karşıya Yükle düğmesini seçin.Azure Depolama Gezgini'daki karşıya yükle düğmesinin ekran görüntüsü
  • Dosyalar kutusunun sağ tarafındaki üç noktayı (...) seçin, dosya sisteminden karşıya yüklenecek bir veya birden çok dosyayı seçin ve dosyaları karşıya yüklemeye başlamak için Karşıya Yükle'yi seçin.Dosyaları karşıya yükle iletişim kutusunun ekran görüntüsü

Azure blobundan veri okuma: Python ODBC

BlobService kitaplığını kullanarak verileri doğrudan Jupyter Notebook'taki veya Python programındaki bir blobdan okuyabilirsiniz.

İlk olarak gerekli paketleri içeri aktarın:

import pandas as pd
from pandas import Series, DataFrame
import numpy as np
import matplotlib.pyplot as plt
from time import time
import pyodbc
import os
from azure.storage.blob import BlobService
import tables
import time
import zipfile
import random

Ardından Blob depolama hesabı kimlik bilgilerinizi takın ve blobdan verileri okuyun:

CONTAINERNAME = 'xxx'
STORAGEACCOUNTNAME = 'xxxx'
STORAGEACCOUNTKEY = 'xxxxxxxxxxxxxxxx'
BLOBNAME = 'nyctaxidataset/nyctaxitrip/trip_data_1.csv'
localfilename = 'trip_data_1.csv'
LOCALDIRECTORY = os.getcwd()
LOCALFILE =  os.path.join(LOCALDIRECTORY, localfilename)

#download from blob
t1 = time.time()
blob_service = BlobService(account_name=STORAGEACCOUNTNAME,account_key=STORAGEACCOUNTKEY)
blob_service.get_blob_to_path(CONTAINERNAME,BLOBNAME,LOCALFILE)
t2 = time.time()
print(("It takes %s seconds to download "+BLOBNAME) % (t2 - t1))

#unzip downloaded files if needed
#with zipfile.ZipFile(ZIPPEDLOCALFILE, "r") as z:
#    z.extractall(LOCALDIRECTORY)

df1 = pd.read_csv(LOCALFILE, header=0)
df1.columns = ['medallion','hack_license','vendor_id','rate_code','store_and_fwd_flag','pickup_datetime','dropoff_datetime','passenger_count','trip_time_in_secs','trip_distance','pickup_longitude','pickup_latitude','dropoff_longitude','dropoff_latitude']
print 'the size of the data is: %d rows and  %d columns' % df1.shape

Veriler bir veri çerçevesi olarak okunur:

İlk 10 veri satırının ekran görüntüsü

Azure Synapse Analytics ve veritabanları

Azure Synapse Analytics, kurumsal sınıf SQL Server deneyimine sahip bir hizmet olarak esnek bir veri ambarıdır.

Bu makaledeki yönergeleri izleyerek Azure Synapse Analytics sağlayabilirsiniz. Azure Synapse Analytics'i sağladıktan sonra, Azure Synapse Analytics içindeki verileri kullanarak veri yükleme, araştırma ve modelleme yapmak için bu kılavuzu kullanabilirsiniz.

Azure Cosmos DB

Azure Cosmos DB, buluttaki bir NoSQL veritabanıdır. JSON gibi belgelerle çalışmak ve belgeleri depolamak ve sorgulamak için kullanabilirsiniz.

DSVM'den Azure Cosmos DB'ye erişmek için aşağıdaki önkoşul adımlarını kullanın:

  1. Azure Cosmos DB Python SDK'sı DSVM'de zaten yüklüdür. Güncelleştirmek için bir komut isteminden komutunu çalıştırın pip install pydocumentdb --upgrade .

  2. Azure portalından bir Azure Cosmos DB hesabı ve veritabanı oluşturun.

  3. Microsoft İndirme Merkezi'nden Azure Cosmos DB Veri Geçiş Aracı'nı indirin ve istediğiniz bir dizine ayıklayın.

  4. Genel blobda depolanan JSON verilerini (yanardağ verileri) aşağıdaki komut parametreleriyle Azure Cosmos DB'ye geçiş aracına aktarın. (Azure Cosmos DB Veri Geçiş Aracı'nı yüklediğiniz dizinden dtui.exe kullanın.) Kaynak ve hedef konumu şu parametrelerle girin:

    /s:JsonFile /s.Files:https://data.humdata.org/dataset/a60ac839-920d-435a-bf7d-25855602699d/resource/7234d067-2d74-449a-9c61-22ae6d98d928/download/volcano.json /t:DocumentDBBulk /t.ConnectionString:AccountEndpoint=https://[DocDBAccountName].documents.azure.com:443/;AccountKey=[[KEY];Database=volcano /t.Collection:volcano1

Verileri içeri aktardıktan sonra Jupyter'a gidip DocumentDBSample adlı not defterini açabilirsiniz. Azure Cosmos DB'ye erişmek ve bazı temel sorgulamalar yapmak için Python kodu içerir. Hizmetin belge sayfasını ziyaret ederek Azure Cosmos DB hakkında daha fazla bilgi edinebilirsiniz.

Power BI raporlarını ve panolarını kullanma

Veriler hakkında görsel içgörüler elde etmek için Power BI Desktop'taki önceki Azure Cosmos DB örneğinden Volkan JSON dosyasını görselleştirebilirsiniz. Ayrıntılı adımları Power BI makalesinde bulabilirsiniz. Üst düzey adımlar şunlardır:

  1. Power BI Desktop'ı açın ve Veri Al'ı seçin. URL'yi şu şekilde belirtin: https://cahandson.blob.core.windows.net/samples/volcano.json.
  2. JSON kayıtlarının liste olarak içeri aktarılmış olduğunu görmeniz gerekir. Power BI'ın bu listeyle çalışabilmesi için listeyi tabloya dönüştürün.
  3. Genişlet (ok) simgesini seçerek sütunları genişletin.
  4. Konumun bir Kayıt alanı olduğuna dikkat edin. Kaydı genişletin ve yalnızca koordinatları seçin. Koordinat bir liste sütunudur.
  5. Liste koordinat sütununu virgülle ayrılmış LatLong sütununa dönüştürmek için yeni bir sütun ekleyin. formülünü Text.From([coordinates]{1})&","&Text.From([coordinates]{0})kullanarak koordinat listesi alanındaki iki öğeyi birleştirir.
  6. Yükseltme sütununu ondalık sütuna dönüştürün ve Kapat ve Uygula düğmelerini seçin.

Önceki adımlar yerine aşağıdaki kodu yapıştırabilirsiniz. Veri dönüştürmelerini bir sorgu dilinde yazmak için Power BI'daki Gelişmiş Düzenleyici kullanılan adımları betikler.

let
    Source = Json.Document(Web.Contents("https://cahandson.blob.core.windows.net/samples/volcano.json")),
    #"Converted to Table" = Table.FromList(Source, Splitter.SplitByNothing(), null, null, ExtraValues.Error),
    #"Expanded Column1" = Table.ExpandRecordColumn(#"Converted to Table", "Column1", {"Volcano Name", "Country", "Region", "Location", "Elevation", "Type", "Status", "Last Known Eruption", "id"}, {"Volcano Name", "Country", "Region", "Location", "Elevation", "Type", "Status", "Last Known Eruption", "id"}),
    #"Expanded Location" = Table.ExpandRecordColumn(#"Expanded Column1", "Location", {"coordinates"}, {"coordinates"}),
    #"Added Custom" = Table.AddColumn(#"Expanded Location", "LatLong", each Text.From([coordinates]{1})&","&Text.From([coordinates]{0})),
    #"Changed Type" = Table.TransformColumnTypes(#"Added Custom",{{"Elevation", type number}})
in
    #"Changed Type"

Artık veriler Power BI veri modelinizdedir. Power BI Desktop örneğiniz aşağıdaki gibi görünmelidir:

Power BI Desktop

Veri modelini kullanarak rapor ve görselleştirme oluşturmaya başlayabilirsiniz. Rapor oluşturmak için bu Power BI makalesindeki adımları izleyebilirsiniz.

DSVM'yi dinamik olarak ölçeklendirme

Projenizin gereksinimlerini karşılamak için DSVM'nin ölçeğini artırıp azaltabilirsiniz. VM'yi akşamları veya hafta sonları kullanmanız gerekmiyorsa, VM'yi Azure portalından kapatabilirsiniz.

Not

VM'deki işletim sistemi için yalnızca kapatma düğmesini kullanıyorsanız işlem ücretlerine tabi olursunuz. Bunun yerine Azure portalını veya Cloud Shell'i kullanarak DSVM'nizi serbest bırakmanız gerekir.

Bazı büyük ölçekli çözümlemeleri işlemeniz ve daha fazla CPU, bellek veya disk kapasitesine ihtiyacınız olabilir. Bu durumda CPU çekirdekleri, derin öğrenme için GPU tabanlı örnekler, bellek kapasitesi ve işlem ve bütçe gereksinimlerinizi karşılayan disk türleri (katı hal sürücüleri dahil) açısından bir vm boyutu seçeneği bulabilirsiniz. Vm'lerin tam listesi ve saatlik işlem fiyatlandırması Azure Sanal Makineler fiyatlandırma sayfasında bulunabilir.

Daha fazla araç ekleme

DSVM'ye önceden oluşturulmuş araçlar birçok yaygın veri analizi gereksinimlerini karşılayabilir. Bu size zaman kazandırır çünkü ortamlarınızı tek tek yüklemeniz ve yapılandırmanız gerekmez. Ayrıca, yalnızca kullandığınız kaynaklar için ödeme yaptığınız için tasarruf etmenizi sağlar.

Analiz ortamınızı geliştirmek için bu makalede profili oluşturulan diğer Azure veri ve analiz hizmetlerini kullanabilirsiniz. Bazı durumlarda, bazı özel iş ortağı araçları dahil olmak üzere ek araçlara ihtiyacınız olabilir. İhtiyacınız olan yeni araçları yüklemek için sanal makinede tam yönetim erişiminiz vardır. Ayrıca Python ve R'ye önceden yüklenmemiş ek paketler de yükleyebilirsiniz. Python için veya pipkullanabilirsinizconda. R için R konsolunda kullanabilir install.packages() veya IDE'yi kullanarak Paketleri>Paketleri Yükle'yi seçebilirsiniz.

Derin öğrenme

Çerçeve tabanlı örneklere ek olarak, DSVM'de doğrulanmış bir dizi kapsamlı izlenecek yol alabilirsiniz. Bu kılavuzlar, görüntü ve metin/dil anlama gibi etki alanlarında derin öğrenme uygulamaları geliştirmenize hızlı bir başlangıç yapma konusunda yardımcı olur.

  • Sinir ağlarını farklı çerçeveler arasında çalıştırma: Bu kılavuzda kodun bir çerçeveden diğerine nasıl geçirilicağı gösterilmektedir. Ayrıca çerçeveler arasında modelleri ve çalışma zamanı performansını karşılaştırmayı da gösterir.

  • Görüntülerdeki ürünleri algılamak için uçtan uca bir çözüm oluşturmaya yönelik bir nasıl yapılır kılavuzu: Görüntü algılama, görüntülerdeki nesneleri bulup sınıflandırabilen bir tekniktir. Bu teknoloji, gerçek hayattaki birçok iş alanında büyük ödüller getirme potansiyeline sahiptir. Örneğin, perakendeciler müşterinin raftan hangi ürünü seçtiğini belirlemek için bu tekniği kullanabilir. Bu bilgiler de mağazaların ürün envanterlerini yönetmelerine yardımcı olur.

  • Ses için derin öğrenme: Bu öğreticide, kentsel sesler veri kümesinde ses olay algılaması için bir derin öğrenme modelinin nasıl eğitilmiş olduğu gösterilmektedir. Ayrıca ses verileriyle çalışma hakkında genel bir bakış sağlar.

  • Metin belgelerinin sınıflandırması: Bu kılavuzda iki sinir ağı mimarisinin nasıl derlenip eğitilme yöntemi gösterilmektedir: Hiyerarşik Dikkat Ağı ve Uzun Kısa Süreli Bellek (LSTM) ağı. Bu sinir ağları, metin belgelerini sınıflandırmak için derin öğrenme için Keras API'sini kullanır.

Özet

Bu makalede, Microsoft Veri Bilimi Sanal Makinesi üzerinde yapabileceğiniz bazı işlemler açıklanmıştır. DSVM'yi etkili bir analiz ortamı yapmak için yapabileceğiniz daha birçok şey vardır.