Predicción de préstamos incobrables con SQL Server

Data Science Virtual Machine
Power BI
SQL Server

Idea de solución Solution Idea

Si desea que ampliemos este artículo con más información, detalles de la implementación, guía de precios o ejemplos de código, háganoslo saber en GitHub Feedback (Comentarios de GitHub).If you'd like to see us expand this article with more information, implementation details, pricing guidance, or code examples, let us know with GitHub Feedback!

Esta solución muestra cómo crear e implementar un modelo de aprendizaje automático con SQL Server 2016 con R Services para predecir si será necesario declarar un préstamo bancario como incobrable en los próximos tres meses.This solution demonstrates how to build and deploy a machine learning model with SQL Server 2016 with R Services to predict if a Bank loan will need to be charged off within next 3 months.

ArchitectureArchitecture

Diagrama de la arquitectura Descargue un SVG de esta arquitectura.Architecture Diagram Download an SVG of this architecture.

Información generalOverview

Las instituciones de préstamo disfrutan de varias ventajas para equiparse con los datos de predicción de préstamos incobrables.There are multiple benefits for lending institutions to equip with loan chargeoff prediction data. Declarar un préstamo como impago es el último recurso del banco ante una situación de morosidad grave, con los datos de predicción a mano, el responsable de los préstamos podría ofrecer incentivos personalizados como una tasa de interés menor o un período de devolución más prolongado para ayudar a los clientes a continuar pagando el préstamo y así evitar caer en un impago.Charging off a loan is the last resort that the bank will do on a severely delinquent loan, with the prediction data at hand, the loan officer could offer personalized incentives like lower interest rate or longer repayment period to help customers to keep making loan payments and thus prevent the loan of getting charged off. Para obtener este tipo de datos de predicción, a menudo las cooperativas de crédito o los bancos preparan los datos a mano según el historial de pagos de los clientes y realizan un análisis de regresión estadística simple.To get to this type of prediction data, often credit unions or banks manually handcraft the data based on customers' past payment history and performed simple statistical regression analysis. Este método está sujeto a muchos errores de compilación de los datos y no es estadísticamente significativo.This method is highly subject to data compilation error and not statistically sound.

Esta plantilla de solución muestra una solución completa para ejecutar análisis predictivos en los datos de los préstamos y producir una puntuación de la probabilidad de impagos.This solution template demonstrates a solution end to end to run predictive analytics on loan data and produce scoring on chargeoff probability. Un informe de Power BI también le guiará por el análisis y la tendencia de los préstamos de crédito y la predicción de la probabilidad de impagos.A PowerBI report will also walk through the analysis and trend of credit loans and prediction of chargeoff probability.

Perspectiva del administrador empresarialBusiness Manager Perspective

Esta predicción de impagos de préstamos usa datos de historial de préstamos simulados para predecir la probabilidad de impagos en el futuro inmediato (en los próximos tres meses).This loan chargeoff prediction uses a simulated loan history data to predict probability of loan chargeoff in the immediate future (next three months). Cuanto mayor sea la puntuación, mayor será la probabilidad de que no se pague el préstamo en el futuro.The higher the score, the higher is the probability of the loan getting charged-off in the future.

Con los datos de análisis, al administrador de préstamos también se le presentan las tendencias y el análisis de los préstamos impagados por ubicación de las sucursales.With the analytics data, loan manager is also presented with the trends and analytics of the chargeoff loans by branch locations. Las características de los préstamos de alto riesgo de impago ayudarán a los administradores de préstamos a realizar el plan de negocio para la oferta de préstamos en esa zona geográfica específica.Characteristics of the high chargeoff risk loans will help loan managers to make business plan for loan offering in that specific geographical area.

SQL Server R Services permite el proceso de los datos al permitir que R se ejecute en el mismo equipo que la base de datos.SQL Server R Services brings the compute to the data by allowing R to run on the same computer as the database. Incluye un servicio de base de datos que se ejecuta aparte del proceso de SQL Server y que se comunica de forma segura con el motor de tiempo de ejecución de R.It includes a database service that runs outside the SQL Server process and communicates securely with the R runtime.

Esta plantilla de solución muestra cómo crear y limpiar un conjunto de datos simulados, utilizar varios algoritmos para entrenar los modelos de R, seleccionar el modelo de mejor rendimiento y realizar predicciones de impagos y guardar los resultados de la predicción de nuevo en SQL Server.This solution template walks through how to create and clean up a set of simulated data, use various algorithms to train the R models, select the best performant model and perform chargeoff predictions and save the prediction results back to SQL Server. Un informe de Power BI se conecta a la tabla de resultados de la predicción y muestra informes interactivos con el usuario sobre el análisis predictivo.A PowerBI report connects to the prediction result table and show interactive reports with the user on the predictive analytics.

Perspectiva del científico de datosData Scientist Perspective

SQL Server R Services aplica cálculos a los datos mediante la ejecución de R en el equipo que hospeda la base de datos.SQL Server R Services brings the compute to the data by running R on the computer that hosts the database. Incluye un servicio de base de datos que se ejecuta aparte del proceso de SQL Server y que se comunica de forma segura con el tiempo de ejecución de R.It includes a database service that runs outside the SQL Server process and communicates securely with the R runtime.

Esta solución le guía por los pasos necesarios para crear y perfeccionar los datos, entrenar modelos de R y realizar puntuaciones en la máquina SQL Server.This solution walks through the steps to create and refine data, train R models, and perform scoring on the SQL Server machine. Los resultados finales de la predicción se almacenarán en SQL Server.The final prediction results will be stored in SQL Server . Estos datos se visualizan después en Power BI, que también contiene un resumen del análisis de impagos de préstamos y la predicción de incobrables para los tres meses siguientes.This data is then visualized in PowerBI, which also contains a summary of the loan chargeoff analysis and chargeoff prediction for the next three months. (Los datos simulados se muestran en esta plantilla para ilustrar la característica).(Simulated data is shown in this template to illustrate the feature)

Los científicos de datos que prueban y desarrollan las soluciones pueden trabajar desde el IDE de R en su máquina cliente, mientras insertan el proceso en la máquina de SQL Server.Data scientists who are testing and developing solutions can work from the convenience of their R IDE on their client machine, while pushing the compute to the SQL Server machine. Las soluciones completadas se implementan en SQL Server 2016 al integrar las llamadas a R en los procedimientos almacenados.The completed solutions are deployed to SQL Server 2016 by embedding calls to R in stored procedures. Estas soluciones se pueden automatizar posteriormente con SQL Server Integration Services y el agente de SQL Server.These solutions can then be further automated with SQL Server Integration Services and SQL Server agent.

Haga clic en el botón Implementar para probar la automatización y toda la solución estará disponible en su suscripción de Azure.Click on the Deploy button to test the automation and the entire solution will be made available in your Azure subscription.

PreciosPricing

La suscripción de Azure usada para la implementación incurrirá en cargos por el consumo de los servicios que se usen en esta solución, aproximadamente 1,15 USD/hora, para la máquina virtual predeterminada.Your Azure subscription used for the deployment will incur consumption charges on the services used in this solution, approximately $1.15/hour for the default VM.

Asegúrese de detener la instancia de la máquina virtual cuando no esté utilizando la solución.Please ensure that you stop your VM instance when not actively using the solution. La ejecución de la máquina virtual incurrirá en costos mayores.Running the VM will incur higher costs.

Elimine la solución si no lo está usando.Please delete the solution if you are not using it.