Previsione di cancellazione del prestito con SQL Server

Data Science Virtual Machine
Power BI
SQL Server

Idea della soluzione

Se si desidera vedere questo articolo con altre informazioni, ad esempio potenziali casi d'uso, servizi alternativi, considerazioni sull'implementazione o linee guida sui prezzi, è possibile inviare commenti e suggerimenti GitHub!

Questa soluzione illustra come creare e distribuire un modello di Machine Learning con SQL Server 2016 con R Services per prevedere se un prestito bancario dovrà essere addebitato entro i prossimi 3 mesi.

Architettura

Diagramma dell'architettura Scaricare un SVG di questa architettura.

Panoramica

Esistono diversi vantaggi per gli enti creditizi per dotare i dati di previsione di addebito dei prestiti. L'addebito di un prestito è l'ultima risorsa che la banca farà su un prestito gravemente delinquente, con i dati di previsione a portata di mano, il responsabile del prestito potrebbe offrire incentivi personalizzati, ad esempio un tasso di interesse inferiore o un periodo di rimborso più lungo, per aiutare i clienti a continuare a pagare i prestiti e quindi a evitare che il prestito sia addebitato. Per ottenere questo tipo di dati di stima, spesso le unioni di credito o le banche preparano manualmente i dati in base alla cronologia dei pagamenti precedenti dei clienti ed eseguiti una semplice analisi di regressione statistica. Questo metodo è altamente soggetto a errori di compilazione dei dati e non statisticamente suono.

Questo modello di soluzione illustra una soluzione end-to-end per l'esecuzione dell'analisi predittiva sui dati del prestito e la produzione di punteggi in base alla probabilità di addebito. Un report di PowerBI illustra anche l'analisi e la tendenza dei crediti crediti e la previsione della probabilità di addebito.

Prospettiva di Business Manager

Questa stima di addebito del prestito usa i dati di cronologia dei prestiti simulati per stimare la probabilità di addebito del prestito nell'immediato futuro (prossimi tre mesi). Più alto è il punteggio, maggiore è la probabilità che il prestito sia addebitato in futuro.

Con i dati di analisi, il gestore dei prestiti presenta anche le tendenze e l'analisi dei prestiti di addebito da parte delle succursali. Le caratteristiche dei prestiti ad alto rischio di addebito consentono ai gestori di prestito di creare un piano aziendale per l'offerta di prestito in quell'area geografica specifica.

R Services per SQL Server il calcolo ai dati consentendo l'esecuzione di R nello stesso computer del database. Include un servizio di database che viene eseguito all'esterno SQL Server processo e comunica in modo sicuro con il runtime R.

Questo modello di soluzione illustra come creare e pulire un set di dati simulati, usare vari algoritmi per eseguire il training dei modelli R, selezionare il modello con prestazioni migliori ed eseguire stime di chargeoff e salvare i risultati della stima SQL Server. Un report di PowerBI si connette alla tabella dei risultati della stima e mostra report interattivi con l'utente nell'analisi predittiva.

Scienziato dei dati prospettiva

R Services per SQL Server il calcolo ai dati eseguendo R nel computer che ospita il database. Include un servizio di database che viene eseguito all'esterno SQL Server processo e comunica in modo sicuro con il runtime R.

Questa soluzione illustra i passaggi per creare e perfezionare i dati, eseguire il training dei modelli R ed eseguire l'assegnazione dei punteggi SQL Server macchina virtuale. I risultati della stima finale verranno archiviati in SQL Server . Questi dati vengono quindi visualizzato in PowerBI, che contiene anche un riepilogo dell'analisi di addebito del prestito e della stima di addebito per i tre mesi successivi. (I dati simulati vengono visualizzati in questo modello per illustrare la funzionalità)

I data scientist che stanno testando e sviluppando soluzioni possono lavorare in base alla praticità dell'IDE R nel computer client, durante il push del calcolo SQL Server macchina virtuale. Le soluzioni completate vengono distribuite SQL Server 2016 incorporando le chiamate a R nelle stored procedure. Queste soluzioni possono quindi essere ulteriormente automatizzate con SQL Server Integration Services e SQL Server agent.

Fare clic sul pulsante Distribuisci per testare l'automazione e l'intera soluzione verrà resa disponibile nella sottoscrizione di Azure.

Prezzi

La sottoscrizione di Azure usata per la distribuzione incorrerà in addebiti per il consumo per i servizi usati in questa soluzione, circa 1,15 usd/ora per la macchina virtuale predefinita.

Assicurarsi di arrestare l'istanza di macchina virtuale quando non si usa attivamente la soluzione. L'esecuzione della macchina virtuale comporta costi più elevati.

Se non la si usa, è consigliabile eliminarla.