Прогнозирование вероятности списания кредита с помощью SQL Server

Виртуальные машины для обработки и анализа данных
Power BI
SQL Server

Концепция решения Solution Idea

Если вы хотите ознакомиться с этой статьей, дополнительные сведения, сведения о реализации, рекомендации по ценам или примеры кода, сообщите нам о них.If you'd like to see us expand this article with more information, implementation details, pricing guidance, or code examples, let us know with GitHub Feedback!

В этом решении показано, как создать и развернуть модель машинного обучения с помощью SQL Server 2016 со службами R, чтобы предсказать, нужно ли выставлять оплату за банковские займы в течение следующих 3 месяцев.This solution demonstrates how to build and deploy a machine learning model with SQL Server 2016 with R Services to predict if a Bank loan will need to be charged off within next 3 months.

ArchitectureArchitecture

Схема архитектуры . Скачайте SVG этой архитектуры.Architecture Diagram Download an SVG of this architecture.

ОбзорOverview

Существует несколько преимуществ для организации сдачи в аренду с помощью данных о прогнозировании ссуд списания.There are multiple benefits for lending institutions to equip with loan chargeoff prediction data. Взятие ссуды — это последнее средство, которое банк будет выполнять в долгосрочной безнадежным ссуды с прогнозируемыми данными. Директор по займу может предложить персонализированную стимул, например снижение процентной ставки или более длительный период выплат, чтобы помочь клиентам в обеспечении оплаты кредита и, таким образом, предотвратить оплату за аренду.Charging off a loan is the last resort that the bank will do on a severely delinquent loan, with the prediction data at hand, the loan officer could offer personalized incentives like lower interest rate or longer repayment period to help customers to keep making loan payments and thus prevent the loan of getting charged off. Чтобы получить данные этого типа, часто кредитные союзы или банки вручную формируют данные на основе истории платежей клиентов и выполнили простой статистический анализ.To get to this type of prediction data, often credit unions or banks manually handcraft the data based on customers' past payment history and performed simple statistical regression analysis. Этот метод высоко подвержен ошибкам компиляции данных и не имеет статистических эффектов.This method is highly subject to data compilation error and not statistically sound.

Этот шаблон решения демонстрирует комплексное решение для выполнения прогнозной аналитики в данных о займах и оценки вероятности списания.This solution template demonstrates a solution end to end to run predictive analytics on loan data and produce scoring on chargeoff probability. В отчете Power BI также будет рассмотрен анализ и тренд кредитных кредитов и прогноза вероятности списания.A PowerBI report will also walk through the analysis and trend of credit loans and prediction of chargeoff probability.

Перспектива Business ManagerBusiness Manager Perspective

В этом прогнозе списанияа ссуды используются смоделированные данные журнала ссуды для предсказания вероятности списания в будущем (в ближайшие три месяца).This loan chargeoff prediction uses a simulated loan history data to predict probability of loan chargeoff in the immediate future (next three months). Чем выше оценка, тем выше будет вероятность оплаты ссуды в будущем.The higher the score, the higher is the probability of the loan getting charged-off in the future.

С помощью данных аналитики менеджер по ссуде также представляет тенденции и аналитику списания займов по расположениям филиалов.With the analytics data, loan manager is also presented with the trends and analytics of the chargeoff loans by branch locations. Характеристики списанияных займов с высокой степенью риска помогут менеджерам по займам создать бизнес-план для предложения по займу в определенной географической области.Characteristics of the high chargeoff risk loans will help loan managers to make business plan for loan offering in that specific geographical area.

SQL Server R Services выводит вычислительные данные, позволяя запускать R на том же компьютере, что и база данных.SQL Server R Services brings the compute to the data by allowing R to run on the same computer as the database. Она включает службу базы данных, которая работает вне процесса SQL Server и безопасно взаимодействует со средой выполнения R.It includes a database service that runs outside the SQL Server process and communicates securely with the R runtime.

В этом шаблоне решения рассматривается создание и очистка набора смоделированных данных, использование различных алгоритмов для обучения моделей R, выбор лучшей модели и выполнение списания прогнозов и сохранение результатов прогноза в SQL Server.This solution template walks through how to create and clean up a set of simulated data, use various algorithms to train the R models, select the best performant model and perform chargeoff predictions and save the prediction results back to SQL Server. Отчет PowerBI подключается к таблице результатов прогноза и отображает Интерактивные отчеты с пользователем в прогнозной аналитике.A PowerBI report connects to the prediction result table and show interactive reports with the user on the predictive analytics.

Перспектива "анализу данных"Data Scientist Perspective

SQL Server R Services выводит вычислительные данные, выполняя R на компьютере, на котором размещена база данных.SQL Server R Services brings the compute to the data by running R on the computer that hosts the database. Она включает службу базы данных, которая работает вне процесса SQL Server и безопасно взаимодействует со средой выполнения R.It includes a database service that runs outside the SQL Server process and communicates securely with the R runtime.

В этом решении описаны шаги по созданию и уточнению данных, обучению моделей R и выполнению оценки на SQL Server компьютере.This solution walks through the steps to create and refine data, train R models, and perform scoring on the SQL Server machine. Окончательные результаты прогноза будут храниться в SQL Server.The final prediction results will be stored in SQL Server . Затем эти данные будут визуально представлены в PowerBI, который также содержит сводку по анализу списания кредита и прогнозированию списания на ближайшие три месяца.This data is then visualized in PowerBI, which also contains a summary of the loan chargeoff analysis and chargeoff prediction for the next three months. (Смоделированные данные показаны в этом шаблоне для иллюстрации этой функции).(Simulated data is shown in this template to illustrate the feature)

Специалисты по обработке и анализу данных, которые проверяют и разрабатывают решения, могут работать с удобством их интегрированной среды разработки R на клиентском компьютере, при этом выполняя вычисление на SQL Server компьютере.Data scientists who are testing and developing solutions can work from the convenience of their R IDE on their client machine, while pushing the compute to the SQL Server machine. Завершенные решения развертываются в SQL Server 2016 путем встраивания вызовов R в хранимые процедуры.The completed solutions are deployed to SQL Server 2016 by embedding calls to R in stored procedures. Эти решения можно дополнительно автоматизировать с помощью SQL Server Integration Services и SQL Server Agent.These solutions can then be further automated with SQL Server Integration Services and SQL Server agent.

Нажмите кнопку "развернуть", чтобы протестировать автоматизацию, и все решение будет доступно в вашей подписке Azure.Click on the Deploy button to test the automation and the entire solution will be made available in your Azure subscription.

ЦеныPricing

Ваша подписка Azure, используемая для развертывания, будет взимать плату за использование служб, используемых в этом решении, приблизительно $1,15 доллара/час для виртуальной машины по умолчанию.Your Azure subscription used for the deployment will incur consumption charges on the services used in this solution, approximately $1.15/hour for the default VM.

Убедитесь, что вы останавливаете экземпляр виртуальной машины, когда не активно используете решение.Please ensure that you stop your VM instance when not actively using the solution. При выполнении виртуальной машины будет взиматься более высокая стоимость.Running the VM will incur higher costs.

Если вы не используете решение, удалите его.Please delete the solution if you are not using it.