Voorspelling van oninbaar worden van leningen met SQL Server

Data Science Virtual Machines
Power BI
SQL Server

Oplossingsidee

Als u wilt dat we dit artikel uitbreiden met meer informatie, zoals mogelijke use cases, alternatieve services, implementatieoverwegingen of prijsinformatie, laat het ons dan weten met GitHub Feedback!

Deze oplossing laat zien hoe u een machine learning-model bouwt en implementeert met SQL Server 2016 met R Services om te voorspellen of een banklening binnen de komende drie maanden moet worden afgeschreven.

Architectuur

Architectuurdiagram Download een SVG van deze architectuur.

Overzicht

Er zijn meerdere voordelen voor de onderwijsinstellingen om met voorspellingsgegevens voor de afdding van leningen te kunnen werken. Het in rekening brengen van een lening is het laatste redmiddel dat de bank zal doen bij een zeer delinquent lening. Met de voorspellingsgegevens bij de hand kan de medewerker persoonlijke incentives bieden, zoals een lager rentepercentage of een langere aflossingsperiode om klanten te helpen betalingen te blijven doen en zo te voorkomen dat de lening in rekening wordt gebracht. Om bij dit type voorspellingsgegevens te komen, maken kredietvak- of banken vaak handmatig de gegevens op basis van de betalingsgeschiedenis van klanten uit het verleden en hebben ze eenvoudige statistische regressieanalyses uitgevoerd. Deze methode is zeer onderhevig aan een gegevenscompilatiefout en klinkt niet statistisch goed.

Deze oplossingssjabloon demonstreert een end-to-end oplossing voor het uitvoeren van predictive analytics op leninggegevens en het produceren van scoring op toerekeningskans. In een PowerBI-rapport worden ook de analyse en trend van kredietrisico's en de voorspelling van de toerekeningskans door lopen.

Business Manager-perspectief

Deze voorspelling van de toerekening van leningen maakt gebruik van een gesimuleerde gegevens van de leninggeschiedenis om de waarschijnlijkheid van toerekening van leningen in de nabije toekomst (de komende drie maanden) te voorspellen. Hoe hoger de score, hoe hoger de kans is dat de lening in de toekomst wordt afgeschreven.

Met de analysegegevens krijgt de beheerder van een lening ook de trends en analyses te zien van de afk betalende leningen per vertakkingslocaties. Kenmerken van de kredietrisico's voor hoge kosten helpen leningbeheerders bij het maken van een bedrijfsplan voor het aanbieden van leningen in dat specifieke geografische gebied.

SQL Server R Services brengt de berekening naar de gegevens door R uit te voeren op dezelfde computer als de database. Het bevat een databaseservice die buiten het SQL Server wordt uitgevoerd en veilig communiceert met de R-runtime.

Deze oplossingssjabloon laat u zien hoe u een set gesimuleerde gegevens maakt en opschoont, verschillende algoritmen gebruikt om de R-modellen te trainen, het best presterende model selecteert, voorspellingen voor afkeert en de voorspellingsresultaten weer op SQL Server. Een PowerBI-rapport maakt verbinding met de tabel met voorspellingsresultaat en geeft interactieve rapporten weer met de gebruiker op predictive analytics.

Datawetenschapper Perspectief

SQL Server R Services brengt de berekening naar de gegevens door R uit te voert op de computer die als host voor de database wordt gebruikt. Het bevat een databaseservice die buiten het SQL Server wordt uitgevoerd en veilig communiceert met de R-runtime.

Deze oplossing doorloopt de stappen voor het maken en verfijnen van gegevens, het trainen van R-modellen en het uitvoeren van scores op SQL Server machine. De uiteindelijke voorspellingsresultaten worden opgeslagen in SQL Server . Deze gegevens worden vervolgens gevisualiseerd in PowerBI, dat ook een samenvatting bevat van de kostenanalyse van de lening en de voorspelling van de toestorting voor de komende drie maanden. (Gesimuleerde gegevens worden weergegeven in deze sjabloon om de functie te illustreren)

Gegevenswetenschappers die oplossingen testen en ontwikkelen, kunnen werken vanuit het gemak van hun R IDE op hun clientmachine, terwijl ze de rekenkracht naar de SQL Server machine pushen. De voltooide oplossingen worden geïmplementeerd in SQL Server 2016 door aanroepen naar R in opgeslagen procedures in tesluiten. Deze oplossingen kunnen vervolgens verder worden geautomatiseerd met SQL Server Integration Services en SQL Server agent.

Klik op de knop Implementeren om de automatisering te testen. De volledige oplossing wordt beschikbaar gesteld in uw Azure-abonnement.

Prijzen

Voor uw Azure-abonnement dat wordt gebruikt voor de implementatie worden verbruikskosten in rekening gebracht voor de services die in deze oplossing worden gebruikt, ongeveer $ 1,15/uur voor de standaard-VM.

Zorg ervoor dat u uw VM-exemplaar stopt wanneer u de oplossing niet actief gebruikt. Voor het uitvoeren van de VM worden hogere kosten in rekening brengen.

Verwijder de oplossing als u deze niet gebruikt.