SQL Server를 사용한 대출 상각 예측

Data Science Virtual Machine
Power BI
SQL Server

솔루션 아이디어

잠재적인 사용 사례, 대체 서비스, 구현 고려 사항 또는 가격 책정 지침과 같은 추가 정보를 사용하여 이 문서를 확장하려는 경우 GitHub 피드백을통해 알려주세요!

이 솔루션은 R Services에서 SQL Server 2016을 사용하여 기계 학습 모델을 빌드하고 배포하여 향후 3개월 이내에 은행 대출이 상환되어야 하는지 예측하는 방법을 보여줍니다.

Architecture

아키텍처 다이어그램 이 아키텍처의 SVG를 다운로드합니다.

개요

대출 상환 예측 데이터를 갖추는 기관에는 여러 가지 혜택이 있습니다. 대출 상환은 은행에서 엄밀히 체감된 대출에 대해 수행하는 마지막 수단이며, 예측 데이터를 통해 대출 담당자는 고객이 대출 상환을 계속할 수 있도록 낮은 이자율 또는 더 긴 상환 기간과 같은 맞춤형 인센티브로 대출 상환을 방지할 수 있습니다. 이러한 유형의 예측 데이터를 얻기 위해 신용 조합 또는 은행에서 고객의 과거 결제 내역을 기반으로 데이터를 수동으로 만들고 간단한 통계 회귀 분석을 수행하는 경우가 많습니다. 이 메서드는 데이터 컴파일 오류의 영향을 크게 받으며 통계적으로 건전하지 않습니다.

이 솔루션 템플릿은 대출 데이터에 대한 예측 분석을 실행하고 상환 확률에 대한 점수 매기기를 생성하는 엔드투엔드 솔루션을 보여줍니다. 또한 PowerBI 보고서는 신용 대출의 분석 및 추세와 상환 확률 예측을 안내합니다.

비즈니스 관리자 관점

이 대출 상환 예측은 시뮬레이션된 대출 기록 데이터를 사용하여 즉시 미래(향후 3개월)의 대출 상환 확률을 예측합니다. 점수가 높을수록 향후 대출 상환 가능성이 높아질 수 있습니다.

분석 데이터를 통해 대출 관리자는 지점별 상환 대출의 추세 및 분석도 제공합니다. 높은 상환 위험 대출의 특징은 대출 관리자가 특정 지리적 영역에서 대출 제공을 위한 비즈니스 계획을 수립하는 데 도움이 됩니다.

SQL Server R Services R이 데이터베이스와 동일한 컴퓨터에서 실행되도록 허용하여 컴퓨팅을 데이터에 제공합니다. SQL Server 프로세스 외부에서 실행되고 R 런타임과 안전하게 통신하는 데이터베이스 서비스를 포함합니다.

이 솔루션 템플릿은 시뮬레이션된 데이터 집합을 만들고 정리하고, 다양한 알고리즘을 사용하여 R 모델을 학습하고, 최상의 성과 모델을 선택하고, 차지오프 예측을 수행하고, 예측 결과를 다시 SQL Server 저장하는 방법을 안내합니다. PowerBI 보고서는 예측 결과 테이블에 연결하고 예측 분석에 대해 사용자와 대화형 보고서를 표시합니다.

데이터 과학자 큐브 뷰

SQL Server R Services 데이터베이스를 호스트하는 컴퓨터에서 R을 실행하여 컴퓨팅을 데이터로 가져옵니다. SQL Server 프로세스 외부에서 실행되고 R 런타임과 안전하게 통신하는 데이터베이스 서비스를 포함합니다.

이 솔루션은 데이터를 만들고 구체화하고, R 모델을 학습시키고, SQL Server 머신에서 채점을 수행하는 단계를 안내합니다. 최종 예측 결과는 SQL Server 에 저장됩니다. 그런 다음 이 데이터는 PowerBI에서 시각화되며, 향후 3개월 동안의 대출 상환 분석 및 상환 예측에 대한 요약도 포함합니다. (시뮬레이션된 데이터는 이 템플릿에 표시되어 기능을 보여 줍니다.)

솔루션을 테스트하고 개발하는 데이터 과학자는 클라이언트 컴퓨터에서 R IDE의 편의성으로 작업하면서 컴퓨팅을 SQL Server 머신에 푸시할수 있습니다. 완료된 솔루션은 저장 프로시저에 R에 대한 호출을 포함시켜 SQL Server 2016에 배포됩니다. 그런 다음 SQL Server Integration Services 및 SQL Server 에이전트를 통해 이러한 솔루션을 추가로 자동화할 수 있습니다.

배포 단추를 클릭하여 자동화를 테스트하면 전체 솔루션을 Azure 구독에서 사용할 수 있습니다.

가격 책정

배포에 사용되는 Azure 구독은 이 솔루션에 사용된 서비스에 대해 기본 VM의 경우 시간당 약 $1.15의 사용 요금이 부과됩니다.

솔루션을 적극적으로 사용하지 않을 때 VM 인스턴스를 중지해야 합니다. VM을 실행하면 비용이 더 높아질 수 있습니다.

솔루션을 사용하지 않는 경우 삭제하십시오.