Hitelhitel-fel számolás előrejelzése Azure HDInsight Spark fürtökön

HDInsight
Power BI

Solution Idea

Ha szeretné látni, hogyan bővítjük ki ezt a cikket olyan további információkkal, mint a lehetséges esetek, az alternatív szolgáltatások, az implementációval kapcsolatos megfontolások vagy a díjszabási útmutató, GitHub visszajelzéssel!

A kölcsöntörlesztés egy olyan kölcsön, amelyet egy kamatos intézmény (általában egy intézmény) deklarál, hogy nem valószínű, hogy egy adott tartozást be kell gyűjteni, általában akkor, ha a hiteltörlesztést a hitel törlesztése súlyosan terheli. Mivel a magas leszámozás negatív hatással van az intézmények év végi pénzügyi kimutatásaira, az intézmények gyakran nagyon szorosan figyelik a hitelbevallással kapcsolatos kockázatokat, hogy megakadályozzák a kölcsön felszámozását. A ML Services on Azure HDInsight használatával egy intézmény gépi tanulási prediktív elemzéssel előrejelezheti a kölcsön felszámítódhat, és jelentést futtathat a HDFS- és Hive-táblákban tárolt elemzési eredményekről.

Architektúra

Architektúradiagram

Töltse le az architektúra SVG-ját.

Adatfolyam

  1. Adatok létrehozása és adatforrások definiálása a ML előrejelzéshez
  2. Logisztikai regresszió futtatása az adatokon a helyi számítási (vagy Spark-) környezet használatával a hitel felszámozásának előrejelzéséhez változó alapján
  3. Csatlakozás a táblához az Azure HDInsights Spark-összekötő használatával
  4. Az Power BI az adatok értelmezéséhez és új vizualizációk létrehozásához
  5. (Nem kötelező) A modell üzembe helyezése webszolgáltatásként, amely népszerű eszközökön, például PC-n és mobileszközökön is használható

Leírás

Ez a megoldás létrehoz egy ML típusú fürtöt a Azure HDInsight. Ez a fürt 2 főcsomópontot, 2 munkavégző csomópontot és 1 élcsomópontot fog tartalmazni, összesen 32 maggal. A HDInsight Spark-fürt hozzávetőleges költsége 8,29 dollár/óra. A számlázás a fürt létrehozása után kezdődik, és a fürt törlésekor leáll. A számlázás percalapú, ezért mindig érdemes törölni a fürtöt, ha az már nincs használatban. Ha végzett, az Üzemelő példányok lapon törölheti a teljes megoldást.

Áttekintés

Az intézményeknek több előnye is van a hiteljóslási előrejelzési adatokkal való ellátásban. A hitel felszámíthatóvá tehető utolsó lehetőségként a bank egy súlyosan delinektált hitelt nyújt, az előrejelzési adatokkal együtt a hitel-felelős személyre szabott ösztönzőket kínálhat, például alacsonyabb kamatlábat vagy hosszabb törlesztési időszakot, hogy az ügyfelek továbbra is törlesztéseket tudjanak nyújtani, így megelőzve a hitel hitelkifizetését. Az ilyen típusú előrejelzési adatokhoz gyakran a hitelkeret-uniók vagy bankok manuálisan, az ügyfelek korábbi fizetési előzményei alapján készítették az adatokat, és egyszerű statisztikai regressziós elemzést végeztek. Ez a módszer nagy mértékben ki van téve az adatfordítási hibáknak, és statisztikailag nem megfelelő.

Ez a megoldássablon egy teljes megoldást mutat be, amely prediktív elemzést futtat a hiteladatokon, és pontozást hoz létre a felszámítási valószínűség alapján. A PowerBI-jelentések a hitelkeretek elemzését és trendjét, valamint a hitelkeret valószínűségének előrejelzését is végigkik.

Üzleti perspektíva

Ez a hitel-felszámítási előrejelzés egy szimulált hitelelőzmény-adatok alapján előrejelzi a hitel felszámításának valószínűségét a közvetlen jövőben (a következő három hónapban). Minél magasabb a pontszám, annál nagyobb annak a valószínűsége, hogy a hitelt a jövőben felszám off-offként számolják fel.

Az elemzési adatok alapján a hitelkezelő a hiteltitkozás trendjeit és elemzéseit is mutatja be fiókirodák szerint. A magas hitelkockázati kölcsön jellemzői segítenek a hitelkezelőknek abban, hogy az adott földrajzi területen üzleti tervet tervezzenek a hitelajánlatok területére.

Power BI a hitelkifizetések és a hitelkifizetési előrejelzések vizuális összegzését is bemutatja (itt szimulált adatokkal látható). Ezt az irányítópultot a jobb oldalon található "Kipróbálom most" gombra kattintva próbálhatja ki.

Adattudós perspektívája

Ez a megoldássablon végigvezeti azon a teljes folyamaton, amely végigvezeti az előrejelzési elemzések szimulált hitelelőzmény-adatok készletével való fejlesztésén, hogy előrejelezni tudja a hitelkockázatot. Az adatok olyan információkat tartalmaznak, mint a hiteltulajdonos demográfiai adatai, a kölcsön összege, a szerződéses kölcsön időtartama és a hitelfizetési előzmények. A megoldássablon olyan R-szkripteket is tartalmaz, amelyek adatfeldolgozást, funkciótervezést végeznek, és számos különböző algoritmust tartalmaznak az adatok betanítása érdekében, végül pedig kiválasztják a legjobb teljesítő modellt az adatok pontozásához, hogy minden hitelhez valószínűségi pontszámot adjanak.

A megoldást tesztelő adattudósok az RStudio Server böngészőalapú nyílt forráskódú kiadásában található, az ML Services peremcsomópontján futó R-kódot Azure HDInsight használni. A számítási környezet beállításával a felhasználó eldöntheti, hogy hol fog végrehajtani a számítás: helyileg az élcsomóponton, vagy elosztva a Spark-fürt csomópontjai között. Az összes R-kód megtalálható a nyilvános GitHub is. Jó munkát!

Összetevők

  • Azure HDInsight:Azure HDInsight egy felügyelt, teljes spektrumú, nyílt forráskódú elemzési szolgáltatás a felhőben vállalatok számára. Olyan nyílt forráskódú keretrendszereket használhat, mint a Hadoop, Apache Spark, Apache Hive, LLAP, Apache Kafka, Apache Storm, R stb.
  • Power BI interaktív irányítópultot biztosít olyan vizualizációval, amely a SQL Server tárolt adatok alapján hoz döntéseket az előrejelzések alapján.

Lásd még

  • R fejlesztői útmutató az Azure-hoz:Ez a cikk áttekintést nyújt arról, hogy az adattudósok milyen módokon használhatja a meglévő készségeiket az Azure R programozási nyelvével.
  • Adatelemzés Apache Spark HDInsight Power BIhasználatával: A Microsoft Power BI használata adatok vizualizálására egy Apache Spark fürtben a Azure HDInsight.
  • ML Services-fürtüzemeltetése a Azure HDInsight: A modell üzemeltetése előrejelzéshez egy ML Services-fürt használatával a Azure HDInsight.