Счет за аренду с Azure HDInsight Spark кластерами

HDInsight
Power BI

Концепция решения

если вы хотите узнать больше о том, как получить дополнительные сведения о возможных вариантах использования, альтернативных службах, рекомендациях по реализации или ценах, сообщите нам о GitHub.

Ссуда за оплату — это ссуда, которая объявляется кредитором (обычно это учреждение), в котором не собирается сумма задолженностей, обычно если возмещение ссуды значительно безнадежнымо кредита. Учитывая, что высокий списания негативно сказывается на работе с финансами за год, Организация за аренду часто следит за списанияом ссуды, чтобы предотвратить оплату займов. используя ML Services в Azure HDInsight, вы можете использовать прогнозную аналитику машинного обучения для прогнозирования вероятности займов и выполнения отчета по результатам аналитики, хранящимся в таблицах HDFS и hive.

Architecture

Диаграмма архитектуры

Скачайте SVG этой архитектуры.

Поток данных

  1. создание данных и определение источников данных для прогноза ML
  2. Выполнение логистической регрессии по данным с помощью контекста локального вычислений (или Spark) для прогнозирования стоимости аренды.
  3. Использование соединителя Spark Azure HDInsight для подключения к таблице
  4. используйте Power BI для интерпретации этих данных и создания новых визуализаций
  5. Используемых Разверните модель как веб-службу, которую можно использовать на популярных устройствах, таких как ПК и мобильные устройства.

Описание

это решение создаст кластер типа ML Services в Azure HDInsight. Этот кластер будет содержать 2 головных узла, 2 рабочих узла и 1 граничным узел с общим количеством 32 ядер. Приблизительная стоимость для этого кластера HDInsight Spark составляет $8.29/час. Выставление счетов начинается после создания кластера и останавливается при удалении кластера. Кластеры оплачиваются поминутно, поэтому всегда следует удалять кластер, когда он больше не нужен. Используйте страницу развертывания для удаления всего решения после завершения работы.

Общие сведения

Существует несколько преимуществ для организации сдачи в аренду с помощью данных о прогнозировании ссуд списания. Взятие ссуды — это последнее средство, которое банк будет выполнять в долгосрочной безнадежным ссуды с прогнозируемыми данными. Директор по займу может предложить персонализированную стимул, например снижение процентной ставки или более длительный период выплат, чтобы помочь клиентам в обеспечении оплаты кредита и, таким образом, предотвратить оплату за аренду. Чтобы получить данные этого типа, часто кредитные союзы или банки вручную формируют данные на основе истории платежей клиентов и выполнили простой статистический анализ. Этот метод высоко подвержен ошибкам компиляции данных и не имеет статистических эффектов.

Этот шаблон решения демонстрирует комплексное решение для выполнения прогнозной аналитики в данных о займах и оценки вероятности списания. В отчете Power BI также будет рассмотрен анализ и тренд кредитных кредитов и прогноза вероятности списания.

Перспектива бизнеса

В этом прогнозе списанияа ссуды используются смоделированные данные журнала ссуды для предсказания вероятности списания в будущем (в ближайшие три месяца). Чем выше оценка, тем выше будет вероятность оплаты ссуды в будущем.

С помощью данных аналитики менеджер по ссуде также представляет тенденции и аналитику списания займов по расположениям филиалов. Характеристики списанияных займов с высокой степенью риска помогут менеджерам по займам создать бизнес-план для предложения по займу в определенной географической области.

Power BI также предоставляет визуальные сводки выплат по займам и прогнозов списания (показанных здесь с помощью смоделированных данных). Вы можете испытать эту панель мониторинга, нажав кнопку "попробовать сейчас" справа.

Перспектива "анализу данных"

В этом шаблоне решения рассматривается комплексный процесс разработки прогнозирующих аналитиков с помощью набора смоделированных данных о кредитах ссуды для прогнозирования рисков списания. Данные содержат данные, такие как демографические данные о подсчете займа, сумма ссуды, продолжительность договорной ссуды и история оплаты кредита. Шаблон решения также включает набор сценариев R, которые выполняют обработку данных, проектирование признаков и несколько различных алгоритмов для обучения данных, и, наконец, выбирают лучшую модель, чтобы оценить данные для получения оценки вероятности для каждой ссуды.

специалисты по обработке и анализу данных, которые протестирут это решение, могут работать с предоставленным кодом R из выпусков RStudio Server на основе браузера, который работает на пограничном узле служб ML Services в кластере Azure HDInsight. Устанавливая контекст вычислений , пользователь может решить, где будет выполняться вычисление: локально на пограничном узле или распределить по узлам в кластере Spark. весь код R также можно найти в общедоступном репозитории GitHub. Желаю удачи!

Компоненты

  • Azure hdinsight. Azure hdinsight — это управляемая Полнофункциональная служба аналитики с открытым кодом в облаке для предприятий. Вы можете использовать такие платформы с открытым кодом, как Hadoop, Apache Spark, Apache Hive, LLAP, Apache Kafka, Apache Storm, R и др.
  • Power BI предоставляет интерактивную панель мониторинга с визуализацией, которая использует данные, хранящиеся в SQL Server, для принятия решений по прогнозам.

См. также раздел