Carico di lavoro applicazioni analitiche e di data science in Visual Studio

Il carico di lavoro Applicazioni analitiche e di data science in Visual Studio riunisce diversi linguaggi e le rispettive distribuzioni di runtime:

Python è un linguaggio di scripting fondamentale usato per le attività di data science. Python è facile da apprendere e offre supporto da un ricco ecosistema di pacchetti. Questi pacchetti soddisfano le esigenze di un'ampia gamma di scenari, ad esempio l'acquisizione e la pulizia dei dati, il training di modelli di dati, la distribuzione dei dati e i tracciati. F# è anche un potente linguaggio .NET funzionale applicabile per un'ampia gamma di attività di elaborazione dati.

Screenshot che mostra Visual Studio con progetti di codice R, Python e F#.

Installazione del carico di lavoro

Il carico di lavoro Applicazioni analitiche e di data science è disponibile nella Programma di installazione di Visual Studio in Carichi di lavoro Altri set di>strumenti:

Screenshot che mostra come selezionare il carico di lavoro Applicazioni di analisi scientifica dei dati nel Programma di installazione di Visual Studio 2022.

Screenshot che mostra come selezionare il carico di lavoro Applicazioni di analisi scientifica dei dati nel Programma di installazione di Visual Studio 2019.

Per impostazione predefinita, il carico di lavoro installa le opzioni seguenti, che è possibile modificare nella sezione di riepilogo per il carico di lavoro nel Programma di installazione di Visual Studio:

  • Supporto per il linguaggio F# desktop
  • Python:
    • Supporto linguaggio Python
    • Supporto Web Python
    • Strumenti di sviluppo nativo Python

Integrazione con SQL Server

SQL Server supporta l'uso di Python per eseguire attività di analisi avanzate direttamente all'interno di SQL Server. Il supporto di Python è disponibile in SQL Server 2017 CTP 2.0 e versioni successive.

L'esecuzione del codice nella posizione in cui si trovano già i dati offre i vantaggi seguenti:

  • Eliminazione dello spostamento dei dati: invece di spostare dati dal database all'applicazione o al modello, è possibile compilare applicazioni nel database. Questa funzionalità elimina le barriere di sicurezza, conformità, governance, integrità e una serie di problemi simili correlati allo spostamento di grandi quantità di dati. È anche possibile utilizzare set di dati che non rientrano nella memoria di un computer client.

  • Distribuzione semplice: dopo aver pronto un modello, distribuirlo nell'ambiente di produzione è una semplice questione di incorporamento del modello in uno script T-SQL. Qualsiasi applicazione client SQL scritta in qualsiasi linguaggio può quindi sfruttare modelli e intelligence tramite una chiamata di stored procedure. Non sono necessarie integrazioni specifiche del linguaggio.

  • Prestazioni e scalabilità di livello aziendale: è possibile usare le funzionalità avanzate di SQL Server, ad esempio tabelle in memoria e indici dell'archivio colonne, con le API scalabili ad alte prestazioni nei pacchetti RevoScale. L'eliminazione dello spostamento dei dati implica anche l'evitare vincoli di memoria client man mano che i dati aumentano o si desidera aumentare le prestazioni dell'applicazione.

  • Estendibilità avanzata: è possibile installare ed eseguire uno dei pacchetti open source più recenti in SQL Server per creare applicazioni di Deep Learning e intelligenza artificiale su enormi quantità di dati in SQL Server. Installare un pacchetto in SQL Server è semplice come l'installazione di un pacchetto nel computer locale.

  • Disponibilità elevata senza costi aggiuntivi: le integrazioni del linguaggio sono disponibili in tutte le edizioni di SQL Server 2017 e versioni successive, inclusa l'edizione Express.

Installazione dell'integrazione di SQL Server

Per sfruttare al meglio l'integrazione di SQL Server, usare il Programma di installazione di Visual Studio per installare il carico di lavoro Carichi>di lavoro Altri set di strumenti>Archiviazione dati ed elaborazione. Selezionare l'opzione SQL Server Data Tools per abilitare SQL IntelliSense, evidenziazione della sintassi e distribuzione:

Screenshot che mostra come selezionare il carico di lavoro Archiviazione ed elaborazione dati nel Programma di installazione di Visual Studio 2022.

Screenshot che mostra come selezionare il carico di lavoro Archiviazione dati ed elaborazione nel Programma di installazione di Visual Studio 2019.

Per altre informazioni, vedere Python in SQL Server 2017: Enhanced in-database Machine Learning (blog) (Python in SQL Server 2017: Apprendimento automatico avanzato nel database).

Altri servizi e SDK

Oltre ai carichi di lavoro delle applicazioni di analisi scientifica dei dati direttamente, i notebook in Visual Studio Code e Azure SDK per Python sono utili anche per l'analisi scientifica dei dati.

Azure SDK per Python semplifica l'uso e la gestione dei servizi di Microsoft Azure dalle applicazioni eseguite in Windows, Mac e Linux. Per altre informazioni, vedere Azure per sviluppatori Python.

È possibile combinare l'estensione Jupyter con notebook in Visual Studio Code per supportare lo sviluppo di Jupyter e migliorare il progetto con estensioni del linguaggio aggiuntive. Il servizio include notebook di esempio in Python, R e F# per iniziare. Per altre informazioni, vedere Esperienze di notebook di Microsoft e GitHub.

Screenshot che mostra l'uso di Notebook con Jupyter in un'introduzione all'esempio R.