使用 SQL Server 進行貸款壞帳預測

資料科學虛擬機器
Power BI
SQL Server

解決方案構想

如果您想要瞭解如何使用詳細資訊來擴充本文,例如可能的使用案例、替代服務、實行考慮或定價指引,請讓我們知道 GitHub 的意見反應!

此解決方案示範如何使用 SQL Server 2016 搭配 R 服務來建立和部署機器學習模型,以預測在接下來的3個月內是否需要支付銀行貸款的費用。

架構

架構圖表會 下載此架構的SVG

概觀

貸款機構有許多優點可提供貸款壞帳預測資料。 向帳單收費是銀行在嚴重滯納貸款上的最後手段,其中有預測資料,貸款專員可以提供個人化的獎勵,例如較低的利率或較長的償還期間,以協助客戶繼續進行貸款款項,從而防止計費的貸款。 若要取得這種類型的預測資料,通常會根據客戶過去的付款記錄來手動製作資料,並執行簡單的統計迴歸分析。 這個方法非常受限於資料編譯錯誤,而不是統計音效。

此解決方案範本會示範端對端的解決方案,以執行貸款資料的預測性分析,並產生壞帳機率的評分。 PowerBI 報表也會逐步解說點數貸款的分析和趨勢,以及壞帳機率的預測。

商務經理觀點

這項貸款壞帳預測會使用模擬的貸款歷程記錄資料,在未來三個月) 的未來 (預測貸款壞帳的機率。 分數愈高,則會在未來收取貸款的機率。

流量分析資料時,貸款經理也會看到依分支位置壞帳貸款的趨勢和分析。 高壞帳風險貸款的特性可協助貸款經理在該特定地理區域中制定貸款供應專案的商務計畫。

SQL Server R Services 藉由允許 R 在與資料庫相同的電腦上執行,來將計算帶入資料。 它包含在 SQL Server 進程之外執行的資料庫服務,並與 R 執行時間安全地通訊。

此解決方案範本會逐步解說如何建立和清除一組模擬的資料、使用各種演算法來定型 R 模型、選取最佳效能模型並執行壞帳預測,並將預測結果儲存回 SQL Server。 PowerBI 報表會連接到預測結果資料表,並向使用者顯示預測性分析的互動式報表。

資料科學家的觀點

SQL Server R Services 在裝載資料庫的電腦上執行 R,以將計算帶入資料。 它包含在 SQL Server 進程之外執行的資料庫服務,並與 R 執行時間安全地通訊。

此解決方案會逐步引導您建立及精簡資料、訓練 R 模型,以及在 SQL Server 電腦上執行評分。 最終的預測結果將會儲存在 SQL Server 中。 這項資料接著會在 PowerBI 中視覺化,其中也包含接下來三個月的貸款壞帳分析和壞帳預測摘要。 此範本中會顯示 (模擬的資料,以說明此功能)

測試和開發解決方案的資料科學家,可以從其用戶端電腦上的 R IDE 方便使用,同時將計算推送至 SQL Server 機。 已完成的解決方案會藉由在預存程式中內嵌對 R 的呼叫,部署到 SQL Server 2016。 然後,您可以使用 SQL Server Integration Services 和 SQL Server 代理程式,進一步自動化這些解決方案。

按一下 [部署] 按鈕以測試自動化,整個解決方案將會在您的 Azure 訂用帳戶中提供。

定價

您用於部署的 Azure 訂用帳戶將會在此解決方案中使用的服務上產生耗用量費用,預設 VM 大約每小時 $ 1.15。

請勿主動使用解決方案時,請務必停止您的 VM 實例。 執行 VM 將會產生較高的成本。

如果不使用解決方案,請將其刪除。