Microsoft Azure

Introduzione a Machine Learning Studio

James McCaffrey

Scaricare il codice di esempio

C'è accordo unanime sulla esattamente ciò che il termine "machine learning" mezzi (ML). Nella mia mente, ML è qualsiasi sistema che utilizza i dati per aiutare a fare previsioni. Ad esempio, è possibile prevedere chi vincerà il Super Bowl, o a quale gruppo (cluster) di persone un nuovo cliente sarà più simile.

ML sistemi di scrittura da zero utilizzando c# o qualsiasi altro linguaggio di programmazione sono affascinante, ma richiede tempo, richiede la conoscenza specializzata è spesso difficile. Il nuovo Microsoft Azure ML Studio (pubblicato nel luglio 2014) rende creazione ML sistemi molto più facile, più veloce e più efficiente. In questo articolo, ti prenderanno attraverso un esempio completo che ti porterà e funzionante con Studio di ML.

Il modo migliore per vedere dove è diretto questo articolo è di esaminare lo screenshot in Figura 1. L'immagine mostra un esperimento di ML Studio completato. L'obiettivo dell'esperimento è quello di prevedere l'affiliazione di partito politico (democratico o repubblicano) di un membro degli Stati Uniti Camera dei rappresentanti, basato sul precedente comportamento di voto.

A Complete Azure ML Studio Experiment
Figura 1 azzurro ML completo Studio esperimento

Nella parte superiore dell'immagine, si noti che in Internet Explorer esegue ML Studio — è un'applicazione Web-based. Più specifi co­camente, Studio ML è il front-end per il servizio Microsoft Azure Machine Learning. Da qui, per semplicità, utilizzerò il termine "ML Studio" per fare riferimento a entrambi i client front-end e terminare la Azure indietro. Nella barra degli indirizzi, si vede che sto utilizzando un URL interno "passau.cloupapp.net." Durante lo sviluppo, ML Studio progetto è stato definito in codice "Passau" e potreste incontrare quel termine nella documentazione. Con il tempo di leggere questo articolo, l'URL pubblico per ML Studio sarà disponibile presso azure.microsoft.com.

Utilizzando ML Studio per creare sistemi di ML è approssimativamente analoga utilizzando Visual Studio per creare programmi eseguibili, anche se lei non dovrebbe avere troppo portato via con questa nozione. Per utilizzare Visual Studio, è possibile acquistare lo strumento o utilizzare una versione di prova gratuita. Con Studio ML, è accusato per l'utilizzo del servizio, ma ci saranno modi per provare gratuitamente il sistema. I dettagli esatti sono determinati a cambiare frequentemente — cambiamento costante è uno dei principali aspetti negativi, a mio parere, di lavorare con sistemi basati su cloud. Vorrei installare un prodotto sul mio desktop e avere eventuali modifiche essere totalmente la mia decisione. Nel mondo nuovo del cloud computing, dovete essere preparati per un ambiente di lavoro dove cambiamento non è più completamente sotto il tuo controllo.

ML Studio ha tre aree di lavoro primario. Sulla sinistra si possono vedere oggetti con nomi come DataSet salvato, dati di Input e Output e Machine Learning. Queste sono le categorie e se si espande li, vedi articoli specifici che possono essere trascinati sulla superficie di progettazione del centro. Questo è simile alla casella degli strumenti di Visual Studio , dove è possibile trascinare i controlli dell'interfaccia utente in un'area di progettazione. Tuttavia, moduli di Studio ML rappresentano in genere quello che si può pensare come metodi — precompilati, codice che esegue una sorta di attività di ML.

Centro dell'area di Studio ML è chiamato esperimento. Questo è analogo all'editor Visual Studio — il luogo dove si fanno la maggior parte del vostro lavoro. In Figura 1, l'esperimento è intitolato esperimento di voto. Un titolo di esperimento è approssimativamente analogo a un nome di soluzione Visual Studio . Le scatole rettangolari sono moduli che sono stati trascinati nell'area di progettazione. Ad esempio, il modulo etichettato "Voto dati" è la fonte di dati grezzi, ed è il modulo etichettato "Logistica binaria classificazione modello di regressione" (l'etichetta è parzialmente tagliato) dell'algoritmo ML usato.

Stabilire le linee curve ingresso -­flussi tra i moduli di output. Per essere onesti, la mia prima impressione come sviluppatore non è stato complessivamente positivo: "Oh grande. Linee curvy. Non mi piacciono le linee curve. Che non è reale programmazione. " Ma non mi ha preso tempo per adattarsi allo stile visual Studio ML di creare sistemi, e ora io sono un credente.

Il lato destro del ML Studio Mostra i dettagli su cosa­mai attualmente selezionata nell'area di lavoro principale. In Figura 1, poiché il modulo modello classificazione binaria di regressione logistica è selezionato (il suo confine è in grassetto), le informazioni nella zona destra, ad esempio "Ottimizzazione tolleranza", con valore 1.0 e-07, si riferisce specificamente a quel modulo. Si può pensare le informazioni nella zona destra come parametro i valori (o equivalentemente, valori di argomento, a seconda del vostro punto di vista) del modulo/metodo selezionato.

È possibile eseguire un esperimento facendo clic sull'icona Esegui situato nella parte inferiore dello strumento. Questo è un po ' equivalente a colpire il tasto F5 in Visual Studio per eseguire un programma nel debugger. Come ogni modulo termina, ML Studio viene visualizzato un segno di spunta verde all'interno del modulo. Si può anche vedere un'icona Salva ma, per impostazione predefinita, ML Studio salva automaticamente il tuo esperimento ogni pochi secondi — lavorando nel cloud può essere pericolosa a causa di problemi come l'eliminazione di una connessione di rete.

Nelle sezioni che seguono, vado a piedi è attraverso la creazione dell'esperimento in Figura 1 così sarete in grado di replicarlo. In questo modo vi darà una solida base per inquirenti ML Studio sul proprio, o per esplorare la documentazione di rilascio anticipato. Questo articolo presuppone che si hanno competenze di programmazione almeno a livello di inizio (al fine di comprendere la terminologia e le analogie di ML Studio e Visual Studio ), ma non si assume che nulla si sa di ML Studio o apprendimento automatico.

Come ottenere i risultati?

Se siete nuovi a ML Studio, probabilmente stai chiedendo dove trovare l'output dell'esperimento. Come si scopre, un tipico esperimento di ML Studio ha spesso uscite multiple. Bottom-line output, per intenderci, è mostrato Figura 2. Ho tagliato la sezione del centro per rendere un po' più semplice visualizzare l'immagine.

Azure ML Studio Experiment Results
Figura 2 azzurro ML Studio esperimento risultati

Al fine di vedere questi risultati, io sul modulo esperimento modello Score più a destra e selezionate l'opzione di visualizzare dal menu contestuale. Questo ha aperto una finestra separata con i risultati come mostrato. Per ora, guardate la parte inferiore dell'immagine, che è simile a:

unknown-party  y  n  y  n . . y  n  democrat    0.0013
unknown-party  y  y  y  y . . n  n  republican  0.7028

Questo output indica che dopo il modello di previsione è stato creato, è stato presentato con due nuovi elementi di dati. Il primo, con un gruppo di sconosciuti, è dati per un ipotetico rappresentante che hanno votato "sì" su un disegno di legge legislativo relativo a portatori di handicap infanti (le colonne hanno intestazioni, se si guarda attentamente), "no" su un disegno di legge relativo a un progetto di acqua e così via, attraverso un voto "no" su un disegno di legge relativa al Sud Africa. Il modello creato da Studio ML predice che il rappresentante ipotetico è un democratico. Il secondo elemento dati è per un ipotetico rappresentante che hanno votato "sì", le prime otto fatture e "no" il secondo otto fatture; il modello prevede che la persona è un repubblicano.

Creazione di dati

Ora che avete capito l'obiettivo dell'esperimento demo, sei in una posizione migliore per capire come creare l'esperimento. È abbastanza sicuro di dire che tutti gli esperimenti di ML Studio iniziano con alcuni dati e una o più domande a cui rispondere. Qui, i dati demo sono un ben noto (nella comunità di ML, almeno) set di dati, spesso chiamato il Set di dati record di voto del Congresso dei benchmark (o impostare i dati del voto UCI, perché il percorso del file primario è su un server gestito da University of California, Irvine). I dati grezzi, un semplice file di testo denominato casa-voti-84.data, si possono trovare facendo una ricerca su Internet.

Le prime quattro righe di dati grezzi sono:

republican,n,y,n,y,y,y,n,n,n,y,?,y,y,y,n,y
republican,n,y,n,y,y,y,n,n,n,n,n,y,y,y,n,?
democrat,?,y,y,?,y,y,n,n,n,n,y,n,y,y,n,n
democrat,n,y,y,n,?,y,n,n,n,n,y,n,y,n,n,y
...

Ci sono un totale di 435 delimitato da virgole di righe di dati, uno per ciascuno dei 435 membri degli Stati Uniti Camera dei rappresentanti nel 1984. Il primo colonna/campo è partito ed è democratico o repubblicano (c'erano non indipendenti o altre parti). I prossimo 16 elementi su ogni riga rappresentano un voto sì (y), un voto no (n) o un voto manca (?).

ML Studio può leggere i dati direttamente via Web, o da storage azzurro, ma preferisco creare il mio archivio di dati. A tale scopo, copiato il file di testo in blocco note sulla mia macchina locale e poi aggiunto le intestazioni di colonna sulla base della descrizione del file sul sito dell'UCI, in questo modo:

political-party,handicapped-infants, . . ,south-africa
republican,n,y,n,y,y,y,n,n,n,y,?,y,y,y,n,y
republican,n,y,n,y,y,y,n,n,n,n,n,y,y,y,n,?
democrat,?,y,y,?,y,y,n,n,n,n,y,n,y,y,n,n
...

Quando si scrive codice ML da zero, lavorare con le intestazioni di colonna può essere fastidioso, così le intestazioni sono spesso lasciate fuori i file di dati. Ma con Studio ML, utilizzando le intestazioni di colonna è in realtà più facile che omettendo li, così come rendere i dati più facile da capire. Rinominato il file locale VotingRawWithHeader.txt e salvato sulla mia macchina. Se si desidera utilizzare le intestazioni stesse come ho fatto, è possibile ottenere il file di dati che ho usato nel download del codice per questo articolo a msdn.microsoft.com/magazine/msdnmag0914.

Dopo la navigazione verso la Home page di ML Studio, ho cliccato sulla categoria DataSet nel riquadro sinistro. Nell'area di lavoro principale, ML Studio visualizza un elenco dei set di dati incorporato, ad esempio Iris due dati di classe e i dati del telescopio. La maggior parte di questi insiemi di dati che vedete inizialmente sono più o meno set ben noto benchmark (molti dal repository UCI) che può essere utilizzato per esplorare Studio di ML. Nell'angolo inferiore sinistro di ML Studio, trova la nuova icona e cliccato su di esso.

Da lì potuto scegliere un nuovo Dataset o un nuovo esperimento, così ho cliccato su Dataset e quindi sull'icona da File locale. Questo ha portato la finestra di dialogo mostrata Figura 3. Ho usato il pulsante Sfoglia per indirizzare i file locale, denominato il set di dati "Dati di voto", tipo selezionato "File CSV generico con un'intestazione (CSV)" e digitato in una breve descrizione del set di dati.

Creating a New Dataset
Figura 3 creazione di un nuovo Dataset

Ho cliccato sul segno di spunta OK e ML Studio caricato il file locale in storage azzurro e salvato. Indietro nella visualizzazione di DataSet in Studio ML, ho fatto un aggiornamento della pagina e i dati di voto ora erano visibili insieme con i set di dati demo. Si noti che nella versione pre-release di ML Studio ho usato, non era possibile eliminare un set di dati. Così, quando si sta studiando, vi consiglio caldamente di creare un singolo set di dati con un nome generico come dati del manichino. Poi, quando è necessario un diverso set di dati, utilizzare l'opzione "Questa è una nuova versione di un dataset esistente" così l'area di lavoro di Studio ML non diventata superamento con orfani, fittizi insiemi di dati che non possono essere eliminate.

L'esperimento di creazione

Per creare l'esperimento, ho cliccato sull'icona nell'angolo inferiore sinistro di ML Studio nuovo e poi l'opzione esperimento. Successivamente, nel riquadro sinistro, cliccato sulla categoria set di dati salvati e poi scorre verso l'elemento dei dati di voto ho appena creato e trascinato nel riquadro Progettazione. Nella parte superiore dell'area di progettazione, sono entrato esperimento di voto come titolo. A questo punto, si potrebbe fare clic destro sul nodo di uscita inferiore del modulo dati di voto e selezionare l'opzione Visualize per verificare il che tuo set di dati è corretto.

Molti sviluppatori, me compreso, quando in primo luogo lavorando con ML, seriamente sottovalutano quanto sforzo è coinvolto nel manipolare i dati di origine prima di applicare gli algoritmi di ML. Attività tipiche includono ridisporre le colonne di dati, eliminazione di colonne indesiderate, trattando i valori mancanti, codifica dati non numerici e suddividendo i dati in set di formazione e test. Dalla prospettiva di uno sviluppatore per l'esperimento di voto-dati, queste attività potrebbero assumere la forma di codice come questa:

 

string[][] rawData = LoadData("VotingRawWithHeader.txt");
rawData = ProcessMissing(rawData, '?', 'n');
rawData = SwapColumns(rawData, 0, 16);
double[][] data = Encode(rawData);
double[][] trainData;
double[][] testData;
MakeTrainTest(data, 0.80, out trainData, out testData);

Figura 4 illustrato un primo piano dei primi moduli Studio quattro ML che eseguono questi compiti. In molti scenari di ML, l'approccio più comune per affrontare i valori mancanti è semplicemente eliminare tutte le righe di elementi di dati che contengono uno o più valori mancanti e ML Studio ti dà quell'opzione. Tuttavia, con dati di voto, mia ipotesi era che un voto manca era davvero un'implicita voto "no". Così, per il modulo Scrubber valori mancanti, nel riquadro di destra, specificato che tutti i valori mancanti ("?") dovrebbe essere sostituito da "n" valori.

Processing the Data
Figura 4 l'elaborazione dei dati

Il modulo di progetto colonne consente di specificare le colonne che si desidera omettere. In questo caso, ho selezionato l'opzione "Seleziona tutte le colonne". ML Studio esamina i dati e fa congetture intelligenti se i valori di colonna siano dati categorici stringa o dati numerici. Il modulo Editor di metadati consente di ignorare le ipotesi ML e consente di specificare la colonna Label, cioè la variabile da prevedere. Ho selezionato la colonna "partito politico" (Ecco dove avere le intestazioni di colonna è di grande aiuto) e specificato che era la colonna etichetta. Ho lasciato le altre 16 colonne come colonne di caratteristica (predictor).

Il modulo Split fa proprio questo, dividendo i dati in un set di training, utilizzati per creare un modello ML e un set di test, utilizzato per stimare l'accuratezza del modello. Qui, specificato 0,8 nel riquadro del parametro del modulo quindi i dati di allenamento sarebbe l'80 per cento degli 435 elementi (348 articoli) e il set di test sarebbe il rimanente 20 percento (87 articoli). Il modulo di Spalato ha anche un parametro booleano denominato "Stratificata divisa." Quando si lavora con Studio ML, vi imbatterete sicuramente in parametri di cui non si capiscono il significato. L'icona del punto interrogativo in basso a destra consente di accedere alla guida di Studio di ML.

Il modello di formazione

Si può pensare un modello ML come una raccolta di informazioni — in genere valori numerici chiamato pesi — che vengono utilizzati per generare le uscite e le previsioni. Un modello di formazione è il processo di trovare un set di valori di peso, in modo che quando ha presentato con dati di input dal training set (in questo caso, 16 Sì e no voti), calcolato uscite (democratico o repubblicano) corrispondono strettamente le uscite note i dati di allenamento. Una volta che questi pesi sono stati determinati, il modello risultante può essere presentato con i dati del test. L'accuratezza del modello ai dati di prova (la percentuale di pronostici corretti) vi dà una stima approssimativa di quanto bene farà il modello quando sono presentati con nuovi dati, dove l'uscita vera non è noto.

Per la dimostrazione di voto, un approccio basato sul codice di formazione potrebbe essere simile:

 

int numFeatures = 16;
LogisticModel lm = new LogisticModel(numFeatures);
int maxEpochs = 10000;
lm.Train(trainData, maxEpochs);

Figura 5 illustrato un primo piano della formazione Studio ML equivalente -­relativi moduli. Nella demo, il modulo del treno modello accetta come input il modulo modello classificazione binaria di regressione logistica. A differenza di altre connessioni, questo non è realmente un flusso di dati; in realtà specifica esattamente che tipo di modello ML deve essere usato. Alternative alla logistica classificazione binaria di regressione includono moduli Media Perceptron binario, potenziato decisione albero binario e Neural Network classificatori binari.

Training the Model
Figura 5 il modello di formazione

Così, come fai a sapere quale modello utilizzare? Perché l'uscita di prevedere ha due possibili valori, democratico o repubblicano, si desidera un modello binario. Ma ci sono decine di approcci ML e probabilmente la parte più difficile dell'utilizzo di ML Studio è dover ricercare i pro ei contro di diversi classificatori di ML. Un'analogia sviluppatore con Visual Studio è che Microsoft .NET Framework ha decine di strutture di dati, ad esempio dizionario generico HashSet e coda generico, e tocca a voi per sapere esattamente cosa fa ogni struttura dati. Allo stesso modo, sta a voi imparare circa classificatori ML.

Il modulo di regressione logistica ha alcuni parametri che probabilmente non capiresti, compresa la tolleranza di ottimizzazione, L1 regolarizzazione peso e dimensioni della memoria per L-BFGS. Ancora una volta, sta a voi imparare cosa fanno questi parametri. Fortunatamente, ML Studio ha valori predefiniti ben scelto per la maggior parte dei parametri del modulo. Accettato tutti i valori predefiniti dei parametri tranne ho usato zero per il "seme casuale numero".

Nel modulo modello treno, devi dire Studio ML quale colonna di dati di training è quella etichetta; quale colonna è la variabile da prevedere. Con il modulo modello treno selezionato, cliccato sul pulsante selettore lancio colonna nel riquadro parametri del modulo ha scelto l'opzione di scegliere per nome nel controllo elenco a discesa e quindi digitato il partito politico. Potrei hai utilizzato l'indice di colonna, 1, perché il partito politico è nella prima colonna (indici di ML Studio sono basati su 1, piuttosto che basato su 0 come gli sviluppatori sono abituati a). Si noti che la colonna Label per il modello di treno modulo è necessario specificare anche se lo fate nell'Editor di metadati.

Il modello di valutazione

Dopo il demo modello è stato addestrato, i prossimi passi sono a nutrire i dati di training e i dati del test al modello, calcolare le uscite calcolate e calcolare l'accuratezza delle uscite calcolate (contro le uscite note). Nel codice, questo potrebbe apparire come:

 

lm.ComputeOutputs(trainData); // Score
double trainAccuracy = lm.Accuracy(trainData); // Evaluate
lm.ComputeOutputs(testData); // Score
double testAccuracy = lm.Accuracy(testData); // Evaluate

Figura 6 illustrato un primo piano del punteggio pertinenti e moduli di valutazione. I due moduli modello Score accettano che due flussi di input. Il primo input è il modello addestrato (le informazioni necessarie per calcolare le uscite), e il secondo input è un set di training o set di test (gli input di dati necessari). I risultati di questi due moduli punteggi vengono inviati al modulo modello valutare, che calcola l'accuratezza.

Scoring and Evaluating the Model
Figura 6 segnando e valutando il modello

Figura 7 Mostra il modulo modello valutare i risultati. Avviso in alto a destra, il secondo dei due oggetti Dataset è stato selezionato (evidenziato), il che significa che i risultati sono per i dati di prova. La parte più importante del risultato è il valore di precisione di 0.989. Ricordiamo il set di prova era di 435 originali elementi di dati, o 87 oggetti il 20 per cento. Il modello di regressione logistica ha predetto correttamente il partito politico di 86 fuori gli elementi di 87 prova. C'è un sacco di altre informazioni contenute nel modello di valutare modulo risultati. Ad esempio, il grafico viene chiamato un grafico della caratteristica di funzionamento del ricevitore (ROC). Esso trame la percentuale di "veri positivi" (correggere le previsioni) sul vs asse y. la percentuale di "falsi positivi" (previsioni errate) sull'asse x.

Model Accuracy on Test Data
Figura 7 modello precisione sui dati di prova

Più che uno strumento

L'applicazione Azure ML Studio, insieme con il motore posteriore, con il servizio Microsoft Azure Machine Learning (ML), è molto più che lo strumento client descritto in questo breve articolo. Dal punto di vista di uno sviluppatore ML Studio semplifica notevolmente la creazione di sistemi di previsione. Ma ci sono proposte di valore aggiuntive che non sono così evidenti.

Un argomento importante, non trattato in questo articolo è la capacità di ML Azure di creare e pubblicare un Web service utilizzando basta trascinare e rilasciare e pochi click. ML azzurro gestisce automaticamente la distribuzione, capacità di provisioning, bilanciamento del carico, ridimensionamento automatico e monitoraggio sanitario. Una pre-release cliente stimato che con Azure ML, essi erano in grado di creare una soluzione di business (un sistema di rilevamento di frodi) presso una piccola frazione del costo di utilizzo software commerciale analitica.

ML azzurro supporta R, una scienza di dati popolare linguaggio di programmazione. Centinaia di moduli opensource R esistenti può essere copiato direttamente in un sistema di Azure ML.

ML Studio permette facile collaborazione. Un esperimento può essere facilmente condivisi tra diverse persone. Ho usato questa caratteristica me ed era molto più efficiente di mio approccio di conversazione e-mail normale, avanti e indietro.

Azzurro ML fornisce più solo vantaggi per gli sviluppatori e i dati di scienziati. "Distribuzione avanzata analitica è dura," ha detto Joseph Sirosh, vicepresidente aziendale Microsoft, gestione delle informazioni e Machine Learning. "Le imprese sono stanchi di pagare prezzi elevati, reclutare talenti costoso e aspettare mesi per ottenere risultati. Avere la capacità di sviluppare modelli analitici e distribuirle senza queste strozzature rapidamente è cambiare il gioco. ML azzurro consente alle aziende di sbloccare il valore nei loro dati e costruire sistemi per ridurre le spese, crescono ricavi e servire meglio i loro clienti finali."

Fare previsioni

Una volta che un modello di Studio ML è stato creato e valutato, può essere utilizzato per fare previsioni sui dati con uscite sconosciuti. Volevo per predire il partito politico di un ipotetico rappresentante che hanno votato "sì", "no", «sì» "no" e così via, su 16 bollette legislative e un secondo rappresentante che hanno votato "sì" sulle prime otto fatture e "no" sulle restanti otto fatture.

Un approccio potrebbe essere di creare e caricare un nuovo Dataset di Studio ML e poi punteggio ottenuto nello stesso modo come la formazione e insiemi di dati di test. Ma per una quantità limitata di dati, un approccio più interattivo è quello di utilizzare il modulo di immettere dati come mostrato Figura 8, che consente di immettere i dati manualmente.

Entering New Data to Predict
Figura 8 inserendo nuovi dati per prevedere

Il formato dei dati nel modulo deve corrispondere esattamente il formato di dati utilizzati per formare il modello, quindi le intestazioni di colonna sono richieste. L'uscita dal modulo immettere dati è combinato con l'uscita dal modulo treno modello. Dopo l'esecuzione dell'esperimento, si possono vedere i risultati cliccando sull'opzione del modulo modello Score, Visualize come illustrato in precedenza in Figura 2.

Se si stavano facendo previsioni utilizzando un linguaggio di programmazione procedura, il codice potrebbe essere simile:

string[] unknown = new string[] { "party", "y", "n", "y", . . "n" };
double result = lm.ComputeOutput(unknown);
if (result < 0.5)
  Console.WriteLine("Predicted party is democrat");
else
  Console.WriteLine("Predicted party is republican");

Ancora una volta, alcune delle informazioni ML Studio rischia di essere un po' misteriosa. Ricordare che le stime includono due finali valori numerici:

unknown-party  y  n  y . . y  n  democrat    0.0013
unknown-party  y  y  y . . n  n  republican  0.7028

Come si scopre, per Logistic Regression classificazione binaria, un valore di output sotto 0,5 indica la prima classe (carbossimetilazione in questo esempio) e un valore di output sopra 0,5 indica la seconda classe (repubblicano). Tenere presente che, come Visual Studio, Studio ML ha molte caratteristiche e genera una quantità enorme di informazioni. Si impara cosa dire dei vari pezzi di informazioni nel tempo utilizzando il sistema e affrontare un nuovo pezzo alla volta, piuttosto che facendo un'immersione profonda nella documentazione e cercando di imparare tutto in una volta.

Nessun codice?!

Questo articolo ha solo scalfito la superficie di ML Studio, ma fornisce informazioni sufficienti quindi è possibile replicare l'esperimento di voto e provare lo strumento. Avrete notato che questo articolo non include alcuna codifica. Nessun codice? Bah! Ma una delle cose più cool di ML Studio è che è possibile scrivere i propri moduli personalizzati utilizzando c#, e mi occuperò di questo argomento in futuri articoli. La mia impressione è che la ML Studio genererà un ecosistema in cui gli sviluppatori scrivere moduli specializzati, sofisticati e rendono disponibili che sia commercialmente e attraverso vari canali, come open source e Blog.


Dr. James McCaffrey lavora per la ricerca di Microsoft di Redmond, WA  Ha lavorato su diversi prodotti Microsoft, inclusi Internet Explorer e Bing. Può essere raggiunto a jammc@microsoft.com.

Grazie ai seguenti esperti tecnici Microsoft per la revisione di questo articolo: Roger Barga (Machine Learning) e Michael Jones (ingegneria di prodotto globale)