SQL Server でのローン償却予測

Data Science Virtual Machine
Power BI
SQL Server

ソリューションのアイデア Solution Idea

さらなる情報、実装の詳細、価格ガイダンス、コード例を追加してこの記事を拡張することをお望みの場合は、GitHub のフィードバックでご連絡ください。If you'd like to see us expand this article with more information, implementation details, pricing guidance, or code examples, let us know with GitHub Feedback!

このソリューションでは、R Services を使用した SQL Server 2016 で機械学習モデルを構築およびデプロイし、次の 3 か月以内に銀行ローンの償却が必要であるかどうかを予測する方法を示します。This solution demonstrates how to build and deploy a machine learning model with SQL Server 2016 with R Services to predict if a Bank loan will need to be charged off within next 3 months.

アーキテクチャArchitecture

アーキテクチャ図 このアーキテクチャの SVG をダウンロードしてください。Architecture Diagram Download an SVG of this architecture.

概要Overview

貸出機関がローン償却予測データを備えている場合、複数のメリットがあります。There are multiple benefits for lending institutions to equip with loan chargeoff prediction data. ローンの償却は、銀行が深刻な延滞債権に対して行う最後の手段です。予測データがあれば、ローン担当者は金利の引き下げや返済期間の延長などのパーソナライズされたインセンティブを提供して、顧客がローンの返済を続けられるよう支援できるため、ローンの償却を防ぐことができます。Charging off a loan is the last resort that the bank will do on a severely delinquent loan, with the prediction data at hand, the loan officer could offer personalized incentives like lower interest rate or longer repayment period to help customers to keep making loan payments and thus prevent the loan of getting charged off. この種の予測データを取得するために、多くの場合、信用組合や銀行では、顧客の過去の返済履歴と実行した単純な統計回帰分析に基づいてデータを手動で作成しています。To get to this type of prediction data, often credit unions or banks manually handcraft the data based on customers' past payment history and performed simple statistical regression analysis. この方法はデータ編集の誤りが生じやすく、統計的に有効ではありません。This method is highly subject to data compilation error and not statistically sound.

このソリューション テンプレートは、ローン データに対して予測分析を実行し、償却の可能性に関するスコアリングを作成するソリューションをエンド ツー エンドで示します。This solution template demonstrates a solution end to end to run predictive analytics on loan data and produce scoring on chargeoff probability. また、PowerBI レポートにより、信用貸付の分析と傾向、および償却の可能性の予測も示されます。A PowerBI report will also walk through the analysis and trend of credit loans and prediction of chargeoff probability.

ビジネス マネージャーのパースペクティブBusiness Manager Perspective

このローン償却予測では、シミュレートされたローン履歴データを使用して、近い将来 (次の 3 か月) のローン償却の可能性を予測します。This loan chargeoff prediction uses a simulated loan history data to predict probability of loan chargeoff in the immediate future (next three months). スコアが高いほど、将来、ローンが償却される可能性が高くなります。The higher the score, the higher is the probability of the loan getting charged-off in the future.

分析データを使用して、支店の場所ごとの償却ローンの傾向と分析もローン管理者に示されます。With the analytics data, loan manager is also presented with the trends and analytics of the chargeoff loans by branch locations. 償却リスクの高いローンの特性は、ローン管理者がその特定の地域でのローン提供のビジネス プランを作成する際に役立ちます。Characteristics of the high chargeoff risk loans will help loan managers to make business plan for loan offering in that specific geographical area.

SQL Server R Services は、R をデータベースと同じコンピューターで実行できるようにして、データにコンピューティングを適用します。SQL Server R Services brings the compute to the data by allowing R to run on the same computer as the database. これには、SQL Server プロセスの外部で実行され、R ランタイムと安全に通信を行うデータベース サービスが含まれます。It includes a database service that runs outside the SQL Server process and communicates securely with the R runtime.

このソリューション テンプレートでは、シミュレートされた一連のデータを作成してクリーンアップする方法、さまざまなアルゴリズムを使用して R モデルをトレーニングする方法、最適なパフォーマンス モデルを選択して、予測結果を SQL Server に保存する方法について説明します。This solution template walks through how to create and clean up a set of simulated data, use various algorithms to train the R models, select the best performant model and perform chargeoff predictions and save the prediction results back to SQL Server. PowerBI レポートは、予測結果テーブルに接続し、予測分析についてユーザーにインタラクティブなレポートを表示します。A PowerBI report connects to the prediction result table and show interactive reports with the user on the predictive analytics.

データ サイエンティストの観点Data Scientist Perspective

SQL Server R Services は、データベースをホストするコンピューターで R を実行して、データにコンピューティングを提供します。SQL Server R Services brings the compute to the data by running R on the computer that hosts the database. これには、SQL Server プロセスの外部で実行され、R ランタイムと安全に通信を行うデータベース サービスが含まれます。It includes a database service that runs outside the SQL Server process and communicates securely with the R runtime.

このソリューションでは、データの作成と調整、R モデルのトレーニング、SQL Server マシンでのスコアリングの実行を行う手順について説明します。This solution walks through the steps to create and refine data, train R models, and perform scoring on the SQL Server machine. 最終的な予測結果は SQL Server に格納されます。The final prediction results will be stored in SQL Server . 次に、このデータは PowerBI で視覚化されます。これには、次の 3 か月のローン償却分析と償却予測の概要も含まれます。This data is then visualized in PowerBI, which also contains a summary of the loan chargeoff analysis and chargeoff prediction for the next three months. (このテンプレートでは、機能を説明するためにシミュレートされたデータを示しています)(Simulated data is shown in this template to illustrate the feature)

ソリューションのテストと開発を行っているデータ サイエンティストは、クライアント コンピューターで R IDE の利便性を活用すると同時に、 コンピューティングを SQL Server マシンにプッシュできますData scientists who are testing and developing solutions can work from the convenience of their R IDE on their client machine, while pushing the compute to the SQL Server machine. 完成したソリューションは、ストアド プロシージャに R の呼び出しを埋め込むことによって、SQL Server 2016 にデプロイされます。The completed solutions are deployed to SQL Server 2016 by embedding calls to R in stored procedures. これらのソリューションは、SQL Server Integration Services および SQL Server エージェントを使用してさらに自動化できます。These solutions can then be further automated with SQL Server Integration Services and SQL Server agent.

[デプロイ] ボタンをクリックして自動化をテストすると、ソリューション全体が Azure サブスクリプションで使用できるようになります。Click on the Deploy button to test the automation and the entire solution will be made available in your Azure subscription.

価格Pricing

デプロイに使用される Azure サブスクリプションでは、このソリューションで使用されるサービスの従量課金が発生します。既定の VM の場合、1 時間あたり約 1.15 ドルです。Your Azure subscription used for the deployment will incur consumption charges on the services used in this solution, approximately $1.15/hour for the default VM.

ソリューションを積極的に使用していない場合は、VM インスタンスを必ず停止してください。Please ensure that you stop your VM instance when not actively using the solution. VM を実行すると、コストが高くなります。Running the VM will incur higher costs.

使用していない場合、ソリューションを削除してください。Please delete the solution if you are not using it.