Przewidywanie spisania pożyczek na straty przy użyciu programu SQL Server

Maszyny wirtualne Data Science Virtual Machine
Power BI
SQL Server

Pomysł na rozwiązanie

Jeśli chcesz, abyśmy rozszerzyli ten artykuł o więcej informacji, takich jak potencjalne przypadki użycia, alternatywne usługi, zagadnienia dotyczące implementacji lub wskazówki dotyczące cen, daj nam znać, GitHub opinie!

To rozwiązanie pokazuje, jak utworzyć i wdrożyć model uczenia maszynowego z usługami języka R w ramach systemu SQL Server 2016, aby przewidzieć, czy konieczne będzie obciążanie pożyczki bankowej w ciągu następnych 3 miesięcy.

Architektura

Diagram architektury Pobierz format SVG tej architektury.

Omówienie

Istnieje wiele korzyści dla instytucji finansowych, które mogą przygotować się na dane przewidywania obciążenia pożyczek. Naliczanie pożyczki to ostateczność, w przypadku gdy bank będzie wykonywować poważnie nieliniową pożyczkę, przy użyciu posiadanych danych przewidywania, inspektor kredytowy może zaoferować spersonalizowane zachęty, takie jak niższa stopa procentowa lub dłuższy okres spłaty, aby pomóc klientom w podejmowaniu spłat pożyczek i w ten sposób zapobiec spłatom pożyczki. Aby uzyskać dostęp do tego typu danych przewidywania, często instytucje kredytowe lub banki ręcznie ręcznie przygotowywały dane na podstawie historii płatności klientów i wykonywały prostą statystyczną analizę regresji. Ta metoda w dużym stopniu podlega błędom kompilacji danych i nie jest statystycznie skuteczna.

Ten szablon rozwiązania przedstawia rozwiązanie, które pozwala uruchomić analizę predykcyjną danych pożyczek i uzyskać wyniki na podstawie prawdopodobieństwa obciążenia. Raport usługi PowerBI zawiera również analizę i trend pożyczek kredytowych oraz przewidywanie prawdopodobieństwa obciążenia.

Perspektywa menedżera biznesowego

To przewidywanie obciążenia pożyczkami wykorzystuje symulowane dane historii pożyczki do przewidywania prawdopodobieństwa obciążenia pożyczki w najbliższej przyszłości (następnych trzech miesięcy). Im wyższa ocena, tym wyższe jest prawdopodobieństwo, że pożyczka zostanie obciążona w przyszłości.

Przy użyciu danych analitycznych menedżer pożyczek przedstawia również trendy i analizę pożyczek na obciążenie dla lokalizacji oddziałów. Charakterystyka pożyczek na ryzyko wysokiego obciążenia pomoże menedżerom pożyczek w planowaniu biznesowym oferty pożyczek w tym konkretnym obszarze geograficznym.

SQL Server R Services dane obliczeniowe, umożliwiając uruchamianie programu R na tym samym komputerze co baza danych. Obejmuje usługę bazy danych, która działa poza SQL Server i bezpiecznie komunikuje się ze środowiskiem uruchomieniowym języka R.

W tym szablonie rozwiązania opisano sposób tworzenia i czyszczenia zestawu symulowanych danych, używania różnych algorytmów do trenowania modeli R, wybierania najlepszego modelu i przewidywania obciążenia oraz zapisywania wyników przewidywania z powrotem do SQL Server. Raport usługi PowerBI łączy się z tabelą wyników przewidywania i wyświetla interaktywne raporty z użytkownikiem na temat analizy predykcyjnej.

badacze dancyh perspektywa

SQL Server R Services dane obliczeniowe, uruchamiając R na komputerze, który hostuje bazę danych. Obejmuje usługę bazy danych, która działa poza SQL Server i bezpiecznie komunikuje się ze środowiskiem uruchomieniowym języka R.

To rozwiązanie przeprowadza przez kroki tworzenia i uściślania danych, trenowania modeli R i przeprowadzania oceniania na SQL Server wirtualnej. Końcowe wyniki przewidywania będą przechowywane w SQL Server . Te dane są następnie wizualizowane w u usługi PowerBI, która zawiera również podsumowanie analizy obciążenia pożyczek i przewidywania obciążenia na następne trzy miesiące. (Symulowane dane są wyświetlane w tym szablonie, aby zilustrować tę funkcję)

Naukowcy zajmujący się danymi, którzy testują i opracowują rozwiązania, mogą pracować z wygodą środowiska IDE r na komputerze klienckim, wypychając obliczenia na maszynę SQL Server maszynę. Ukończone rozwiązania są wdrażane do SQL Server 2016 r. przez osadzanie wywołań do R w procedurach składowanych. Te rozwiązania można następnie dodatkowo zautomatyzować za pomocą SQL Server Integration Services i SQL Server agenta.

Kliknij przycisk Wd wdrażaj, aby przetestować automatyzację. Całe rozwiązanie zostanie udostępnione w ramach subskrypcji platformy Azure.

Cennik

Twoja subskrypcja platformy Azure używana na potrzeby wdrożenia spowoduje naliczenie opłat za zużycie usług używanych w tym rozwiązaniu, czyli około 1,15 USD/godzinę dla domyślnej maszyny wirtualnej.

Upewnij się, że wystąpienie maszyny wirtualnej zostało zatrzymane, gdy nie korzystasz aktywnie z rozwiązania. Uruchomienie maszyny wirtualnej spowoduje poniesienie wyższych kosztów.

Usuń rozwiązanie, jeśli nie korzystasz z niego.