Predição de Inadimplência de Crédito com o SQL Server

Máquinas Virtuais de Ciência de Dados
Power BI
SQL Server

Ideia de solução Solution Idea

Se quiser ver-nos expandir este artigo com mais informações, detalhes de implementação, orientação de preços ou exemplos de código, informe-nos com o Feedback do GitHub!If you'd like to see us expand this article with more information, implementation details, pricing guidance, or code examples, let us know with GitHub Feedback!

Esta solução demonstra como construir e implementar um modelo de machine learning com o SQL Server 2016 com os R Services para prever se um empréstimo do Banco terá de ser cobrado nos próximos 3 meses.This solution demonstrates how to build and deploy a machine learning model with SQL Server 2016 with R Services to predict if a Bank loan will need to be charged off within next 3 months.

ArquiteturaArchitecture

Diagrama de arquitetura Descarregue um SVG desta arquitetura.Architecture Diagram Download an SVG of this architecture.

Descrição GeralOverview

Existem múltiplos benefícios para as instituições de empréstimo para equipar com dados de previsão de cobrança de empréstimos.There are multiple benefits for lending institutions to equip with loan chargeoff prediction data. Cobrar um empréstimo é o último recurso que o banco fará num empréstimo severamente delinquente, com os dados de previsão em mãos, o responsável pelo empréstimo poderia oferecer incentivos personalizados, como uma taxa de juro mais baixa ou um período de reembolso mais longo para ajudar os clientes a continuarem a fazer pagamentos de empréstimos e, assim, impedir o empréstimo de serem cobrados.Charging off a loan is the last resort that the bank will do on a severely delinquent loan, with the prediction data at hand, the loan officer could offer personalized incentives like lower interest rate or longer repayment period to help customers to keep making loan payments and thus prevent the loan of getting charged off. Para chegar a este tipo de dados de previsão, muitas vezes as uniões de crédito ou os bancos manualmente artesanal os dados com base no histórico de pagamentos passado dos clientes e realizou uma simples análise de regressão estatística.To get to this type of prediction data, often credit unions or banks manually handcraft the data based on customers' past payment history and performed simple statistical regression analysis. Este método está altamente sujeito a erro de compilação de dados e não estatisticamente sólido.This method is highly subject to data compilation error and not statistically sound.

Este modelo de solução demonstra uma solução final para executar análises preditivas em dados de empréstimos e produzir pontuação na probabilidade de chargeoff.This solution template demonstrates a solution end to end to run predictive analytics on loan data and produce scoring on chargeoff probability. Um relatório do PowerBI também passará pela análise e tendência dos empréstimos de crédito e pela previsão da probabilidade de cobrança.A PowerBI report will also walk through the analysis and trend of credit loans and prediction of chargeoff probability.

Perspetiva do Gestor de NegóciosBusiness Manager Perspective

Esta previsão de cobrança de empréstimos usa um dado de histórico de empréstimo simulado para prever a probabilidade de cobrança de empréstimos no futuro imediato (próximos três meses).This loan chargeoff prediction uses a simulated loan history data to predict probability of loan chargeoff in the immediate future (next three months). Quanto maior for a pontuação, maior é a probabilidade de o empréstimo ser cobrado no futuro.The higher the score, the higher is the probability of the loan getting charged-off in the future.

Com os dados de análise, o gestor de empréstimos é também apresentado com as tendências e análises dos empréstimos de cobrança por sucursais.With the analytics data, loan manager is also presented with the trends and analytics of the chargeoff loans by branch locations. As características dos empréstimos de risco de elevado custo ajudarão os gestores de empréstimos a fazer um plano de negócios para a oferta de empréstimos nessa área geográfica específica.Characteristics of the high chargeoff risk loans will help loan managers to make business plan for loan offering in that specific geographical area.

Sql Server R Services traz o cálculo para os dados, permitindo que r seja executado no mesmo computador que a base de dados.SQL Server R Services brings the compute to the data by allowing R to run on the same computer as the database. Inclui um serviço de base de dados que funciona fora do processo SQL Server e comunica de forma segura com o tempo de execução R.It includes a database service that runs outside the SQL Server process and communicates securely with the R runtime.

Este modelo de solução percorre como criar e limpar um conjunto de dados simulados, usar vários algoritmos para treinar os modelos R, selecionar o melhor modelo de executante e executar previsões de chargeoff e guardar os resultados da previsão de volta para o SQL Server.This solution template walks through how to create and clean up a set of simulated data, use various algorithms to train the R models, select the best performant model and perform chargeoff predictions and save the prediction results back to SQL Server. Um relatório PowerBI liga-se à tabela de resultados de previsão e mostra relatórios interativos com o utilizador sobre a análise preditiva.A PowerBI report connects to the prediction result table and show interactive reports with the user on the predictive analytics.

Perspetiva do Cientista de DadosData Scientist Perspective

Sql Server R Services traz o cálculo para os dados executando R no computador que hospeda a base de dados.SQL Server R Services brings the compute to the data by running R on the computer that hosts the database. Inclui um serviço de base de dados que funciona fora do processo SQL Server e comunica de forma segura com o tempo de execução R.It includes a database service that runs outside the SQL Server process and communicates securely with the R runtime.

Esta solução percorre os passos para criar e refinar dados, treinar modelos R e executar pontuação na máquina SQL Server.This solution walks through the steps to create and refine data, train R models, and perform scoring on the SQL Server machine. Os resultados finais da previsão serão armazenados no SQL Server .The final prediction results will be stored in SQL Server . Estes dados são então visualizados no PowerBI, que também contém um resumo da análise de cobrança de empréstimos e previsão de cobrança para os próximos três meses.This data is then visualized in PowerBI, which also contains a summary of the loan chargeoff analysis and chargeoff prediction for the next three months. (Os dados simulados são apresentados neste modelo para ilustrar a funcionalidade)(Simulated data is shown in this template to illustrate the feature)

Os cientistas de dados que estão a testar e a desenvolver soluções podem trabalhar a partir da conveniência do seu R IDE na sua máquina cliente, enquanto empurram o cálculo para a máquina do SQL Server.Data scientists who are testing and developing solutions can work from the convenience of their R IDE on their client machine, while pushing the compute to the SQL Server machine. As soluções concluídas são implementadas no SQL Server 2016 incorporando chamadas para R em procedimentos armazenados.The completed solutions are deployed to SQL Server 2016 by embedding calls to R in stored procedures. Estas soluções podem então ser automatizadas com serviços de integração de servidores SQL e agente do SQL Server.These solutions can then be further automated with SQL Server Integration Services and SQL Server agent.

Clique no botão Implementar para testar a automatização e toda a solução será disponibilizada na sua subscrição Azure.Click on the Deploy button to test the automation and the entire solution will be made available in your Azure subscription.

PreçosPricing

A sua subscrição Azure utilizada para a implementação incorrerá em custos de consumo nos serviços utilizados nesta solução, aproximadamente $1,15/hora para o VM predefinido.Your Azure subscription used for the deployment will incur consumption charges on the services used in this solution, approximately $1.15/hour for the default VM.

Certifique-se de que para a sua instância em VM quando não utilizar ativamente a solução.Please ensure that you stop your VM instance when not actively using the solution. A execução do VM incorrerá em custos mais elevados.Running the VM will incur higher costs.

Por favor, elimine a solução se não a estiver a utilizar.Please delete the solution if you are not using it.