Prédiction des pertes sèches sur prêt avec SQL Server

Data Science Virtual Machine
Power BI
SQL Server

Idée de solution Solution Idea

Si vous souhaitez nous voir développer cet article avec d’autres informations, les détails de l’implémentation, le guide de tarification ou des exemples de code, faites-le-nous savoir avec les Commentaires de GitHub !If you'd like to see us expand this article with more information, implementation details, pricing guidance, or code examples, let us know with GitHub Feedback!

Cette solution montre comment créer et déployer un modèle Machine Learning avec SQL Server 2016 avec R Services pour prédire si un prêt bancaire fera l’objet d’une perte sèche dans les 3 prochains mois.This solution demonstrates how to build and deploy a machine learning model with SQL Server 2016 with R Services to predict if a Bank loan will need to be charged off within next 3 months.

ArchitectureArchitecture

Diagramme d’architecture Télécharger une SVG de cette architecture.Architecture Diagram Download an SVG of this architecture.

Vue d’ensembleOverview

Les établissements de prêts ont tout intérêt à s’équiper pour le traitement des données de prédiction des pertes sèches sur prêt.There are multiple benefits for lending institutions to equip with loan chargeoff prediction data. Le passage d’un prêt en perte sèche est le dernier recours dont dispose la banque pour un prêt en souffrance grave. En bénéficiant de données prévisionnelles, un gestionnaire de prêts peut proposer des avantages personnalisés, tels qu’un taux d'intérêt plus bas ou une période de remboursement plus longue, pour aider ses clients à continuer à rembourser leurs prêts et éviter ainsi qu’ils ne passent en pertes sèches.Charging off a loan is the last resort that the bank will do on a severely delinquent loan, with the prediction data at hand, the loan officer could offer personalized incentives like lower interest rate or longer repayment period to help customers to keep making loan payments and thus prevent the loan of getting charged off. Pour obtenir ce type de données de prévision, les coopératives de crédit ou les banques élaborent généralement des jeux de données plus ou moins artisanaux en se basant sur les antécédents de paiement de leurs clients, et se contentent d’une simple analyse de régression statistique.To get to this type of prediction data, often credit unions or banks manually handcraft the data based on customers' past payment history and performed simple statistical regression analysis. Cette méthode est fortement sujette à l’erreur de compilation des données et n’est pas statistiquement sûre.This method is highly subject to data compilation error and not statistically sound.

Ce modèle de solution illustre une solution de bout en bout pour exécuter des analyses prédictives sur des données de prêt et produire des scores de perte sèche.This solution template demonstrates a solution end to end to run predictive analytics on loan data and produce scoring on chargeoff probability. Un rapport PowerBI présente également l’analyse et la tendance des prêts de crédit et la prédiction de perte sèche.A PowerBI report will also walk through the analysis and trend of credit loans and prediction of chargeoff probability.

Perspective du gestionnaire d’activitésBusiness Manager Perspective

Cette prédiction de prêt sèches se base sur une simulation de données d’historique de prêt pour prédire la probabilité de perte sèche dans un futur proche (les trois prochains mois).This loan chargeoff prediction uses a simulated loan history data to predict probability of loan chargeoff in the immediate future (next three months). Plus le score est élevé, plus le risque est élevé, plus il est probable que le prêt soit une perte sèche à l’avenir.The higher the score, the higher is the probability of the loan getting charged-off in the future.

Grâce aux données analytiques, les gestionnaires de prêts pourront également consulter les tendances et l’analyse des pertes sèches par succursale.With the analytics data, loan manager is also presented with the trends and analytics of the chargeoff loans by branch locations. Les caractéristiques des prêts à risque élevé pertes sèches aideront les responsables des prêts à établir des business plans pour leurs offres de prêts selon des zones géographiques précises.Characteristics of the high chargeoff risk loans will help loan managers to make business plan for loan offering in that specific geographical area.

SQL Server R Services transmet le calcul aux données en permettant à R de s’exécuter sur le même ordinateur que la base de données.SQL Server R Services brings the compute to the data by allowing R to run on the same computer as the database. Cela inclut un service de base de données qui s’exécute en dehors du processus SQL Server et communique de façon sécurisée avec le runtime R.It includes a database service that runs outside the SQL Server process and communicates securely with the R runtime.

Ce modèle de solution explique comment créer et nettoyer un ensemble de données simulées, utiliser différents algorithmes pour former les modèles R, sélectionner le modèle le plus performant et effectuer des prédictions de pertes sèches, puis enregistrer les résultats de prédiction dans SQL Server.This solution template walks through how to create and clean up a set of simulated data, use various algorithms to train the R models, select the best performant model and perform chargeoff predictions and save the prediction results back to SQL Server. Un rapport PowerBI se connecte à la table de résultats de prédiction et affiche des rapports interactifs à l’utilisateur de l’analyse prédictive.A PowerBI report connects to the prediction result table and show interactive reports with the user on the predictive analytics.

Perspective du scientifique des donnéesData Scientist Perspective

SQL Server R Services apporte le calcul aux données en exécutant R sur l’ordinateur qui héberge la base de données.SQL Server R Services brings the compute to the data by running R on the computer that hosts the database. Cela inclut un service de base de données qui s’exécute en dehors du processus SQL Server et communique de façon sécurisée avec le runtime R.It includes a database service that runs outside the SQL Server process and communicates securely with the R runtime.

Cette solution vous guide tout au long des étapes de création et d’affinage des données, de formation des modèles R et d’exécution des scores sur l’ordinateur SQL Server.This solution walks through the steps to create and refine data, train R models, and perform scoring on the SQL Server machine. Les résultats de prédiction finaux seront stockés dans SQL Server.The final prediction results will be stored in SQL Server . Ces données sont ensuite visualisées dans Power BI, qui contient également un résumé de l’analyse des pertes sèches sur prêt et de la prédiction des pertes sèches pour les trois prochains mois.This data is then visualized in PowerBI, which also contains a summary of the loan chargeoff analysis and chargeoff prediction for the next three months. (Les données simulées sont affichées dans ce modèle pour illustrer la fonctionnalité)(Simulated data is shown in this template to illustrate the feature)

Les scientifiques des données qui testent et développent des solutions peuvent exploiter leur environnement de développement intégré R sur leur ordinateur client, tout en transmettant les calculs vers l’ordinateur SQL Server.Data scientists who are testing and developing solutions can work from the convenience of their R IDE on their client machine, while pushing the compute to the SQL Server machine. Les solutions terminées sont déployées sur SQL Server 2016 en incorporant des appels à destination de R dans des procédures stockées.The completed solutions are deployed to SQL Server 2016 by embedding calls to R in stored procedures. Ces solutions peuvent ensuite être automatisées avec SQL Server Integration Services et SQL Server Agent.These solutions can then be further automated with SQL Server Integration Services and SQL Server agent.

Cliquez sur le bouton Déployer pour tester l’automatisation et la solution complète sera disponible dans votre abonnement Azure.Click on the Deploy button to test the automation and the entire solution will be made available in your Azure subscription.

TarifsPricing

L'abonnement Azure utilisé pour le déploiement entraînera des frais de consommation sur les services utilisés dans cette solution, soit environ 1,15 $/jour pour la machine virtuelle par défaut.Your Azure subscription used for the deployment will incur consumption charges on the services used in this solution, approximately $1.15/hour for the default VM.

Veillez à arrêter votre instance de machine virtuelle lorsque vous n’utilisez pas la solution.Please ensure that you stop your VM instance when not actively using the solution. L’exécution de la machine virtuelle augmente les coûts.Running the VM will incur higher costs.

Supprimez la solution si vous ne l’utilisez pas.Please delete the solution if you are not using it.