Förutsägelser kring nedskrivning av lån med SQL Server

Data Science Virtual Machine
Power BI
SQL Server

Lösnings idé Solution Idea

Om du vill se den här artikeln med mer information, implementerings information, prissättnings vägledning eller kod exempel kan du berätta för oss med GitHub feedback!If you'd like to see us expand this article with more information, implementation details, pricing guidance, or code examples, let us know with GitHub Feedback!

Den här lösningen visar hur du skapar och distribuerar en maskin inlärnings modell med SQL Server 2016 med R-tjänster för att förutsäga om ett bank lån måste debiteras inom de kommande 3 månaderna.This solution demonstrates how to build and deploy a machine learning model with SQL Server 2016 with R Services to predict if a Bank loan will need to be charged off within next 3 months.

ArkitekturArchitecture

Arkitektur diagram Ladda ned en SVG -arkitektur.Architecture Diagram Download an SVG of this architecture.

ÖversiktOverview

Det finns flera fördelar med att utlånings institutioner kan utrustas med låne kring nedskrivning förutsägelse data.There are multiple benefits for lending institutions to equip with loan chargeoff prediction data. Att betala ut ett lån är den sista utväg som banken kommer att göra på ett allvarligt eftersatta lån, med förutsägelse data till hands, kan låne befälet erbjuda personligt anpassade incitament, till exempel lägre ränte satser eller längre åter betalnings period, så att kunderna kan fortsätta att göra låne betalningar och därmed förhindra att lånet debiteras.Charging off a loan is the last resort that the bank will do on a severely delinquent loan, with the prediction data at hand, the loan officer could offer personalized incentives like lower interest rate or longer repayment period to help customers to keep making loan payments and thus prevent the loan of getting charged off. För att komma till den här typen av förutsägelse data kan kredit unioner eller banker manuellt Handcraft data baserat på kundernas tidigare betalnings historik och utfört enkel statistisk Regressions analys.To get to this type of prediction data, often credit unions or banks manually handcraft the data based on customers' past payment history and performed simple statistical regression analysis. Den här metoden är hög beroende av data kompileringsfel och inte statistiskt ljud.This method is highly subject to data compilation error and not statistically sound.

Den här lösnings mal len visar en lösning som avslutas för att köra förutsägelse analys på låne data och ge poäng på kring nedskrivning sannolikhet.This solution template demonstrates a solution end to end to run predictive analytics on loan data and produce scoring on chargeoff probability. En PowerBI-rapport kommer också att gå igenom analysen och trenden för kredit lån och förutsägelse av kring nedskrivning-sannolikhet.A PowerBI report will also walk through the analysis and trend of credit loans and prediction of chargeoff probability.

Business Manager-perspektivBusiness Manager Perspective

Den här låne kring nedskrivning förutsägelsen använder en simulerad låne historik data för att förutsäga sannolikheten för låne kring nedskrivning i omedelbar framtid (de kommande tre månaderna).This loan chargeoff prediction uses a simulated loan history data to predict probability of loan chargeoff in the immediate future (next three months). Ju högre poäng desto högre är sannolikheten för lånet att debiteras i framtiden.The higher the score, the higher is the probability of the loan getting charged-off in the future.

Med analys data presenteras låne chefen också med trender och analyser av kring nedskrivning lån efter avdelnings platser.With the analytics data, loan manager is also presented with the trends and analytics of the chargeoff loans by branch locations. Egenskaperna hos de hög kring nedskrivning riskerar lån gör det lättare för låne ansvariga att skapa affärs planer för låne erbjudanden i det specifika geografiska området.Characteristics of the high chargeoff risk loans will help loan managers to make business plan for loan offering in that specific geographical area.

SQL Server R Services ger data beräkningen genom att tillåta att R körs på samma dator som databasen.SQL Server R Services brings the compute to the data by allowing R to run on the same computer as the database. Den innehåller en databas tjänst som körs utanför SQL Servers processen och kommunicerar säkert med R-körningsmiljön.It includes a database service that runs outside the SQL Server process and communicates securely with the R runtime.

Den här lösnings mal len visar hur du skapar och rensar en uppsättning simulerade data, använder olika algoritmer för att träna R-modeller, väljer den bästa presterande modellen och utför kring nedskrivning förutsägelser och sparar förutsägelse resultatet igen till SQL Server.This solution template walks through how to create and clean up a set of simulated data, use various algorithms to train the R models, select the best performant model and perform chargeoff predictions and save the prediction results back to SQL Server. En PowerBI-rapport ansluter till tabellen förutsägelse resultat och visar interaktiva rapporter med användaren om förutsägelse analys.A PowerBI report connects to the prediction result table and show interactive reports with the user on the predictive analytics.

Data expert perspektivData Scientist Perspective

SQL Server R Services ger data beräkningen genom att köra R på den dator som är värd för-databasen.SQL Server R Services brings the compute to the data by running R on the computer that hosts the database. Den innehåller en databas tjänst som körs utanför SQL Servers processen och kommunicerar säkert med R-körningsmiljön.It includes a database service that runs outside the SQL Server process and communicates securely with the R runtime.

Den här lösningen vägleder dig genom stegen för att skapa och förfina data, träna R-modeller och utföra en bedömning på den SQL Server datorn.This solution walks through the steps to create and refine data, train R models, and perform scoring on the SQL Server machine. Resultatet av den slutliga förutsägelsen kommer att lagras i SQL Server.The final prediction results will be stored in SQL Server . Dessa data visualiseras sedan i PowerBI, som också innehåller en sammanfattning av låne kring nedskrivning analys och kring nedskrivning förutsägelse för de kommande tre månaderna.This data is then visualized in PowerBI, which also contains a summary of the loan chargeoff analysis and chargeoff prediction for the next three months. (Simulerade data visas i den här mallen för att illustrera funktionen)(Simulated data is shown in this template to illustrate the feature)

Data tekniker som testar och utvecklar lösningar kan arbeta från bekvämligheten hos sin R IDE på sin klient dator, samtidigt som du skickar data bearbetningen till den SQL Server datorn.Data scientists who are testing and developing solutions can work from the convenience of their R IDE on their client machine, while pushing the compute to the SQL Server machine. De slutförda lösningarna distribueras till SQL Server 2016 genom att bädda in anrop till R i lagrade procedurer.The completed solutions are deployed to SQL Server 2016 by embedding calls to R in stored procedures. Dessa lösningar kan sedan automatiseras ytterligare med SQL Server Integration Services och SQL Server Agent.These solutions can then be further automated with SQL Server Integration Services and SQL Server agent.

Klicka på knappen distribuera för att testa automatiseringen och hela lösningen görs tillgänglig i din Azure-prenumeration.Click on the Deploy button to test the automation and the entire solution will be made available in your Azure subscription.

PrissättningPricing

Din Azure-prenumeration som används för distributionen debiteras förbruknings avgifter för tjänsterna som används i den här lösningen, ungefär $1.15 per timme för den virtuella standard datorn.Your Azure subscription used for the deployment will incur consumption charges on the services used in this solution, approximately $1.15/hour for the default VM.

Se till att du stoppar din VM-instans när du inte aktivt använder lösningen.Please ensure that you stop your VM instance when not actively using the solution. Att köra den virtuella datorn kommer att ådra sig högre kostnader.Running the VM will incur higher costs.

Ta bort lösningen om du inte använder den.Please delete the solution if you are not using it.