Сценарий Lamna Healthcare для аналитики в масштабе облака в Azure

Эта эталонная архитектура написана для клиентов, которые хотят использовать аналитику облачного масштаба не только для обеспечения масштабируемости, но и для защиты своих данных. Она демонстрирует, как можно контролировать доступ к конфиденциальным данным и как должным образом обезличенные данные можно передавать аналитикам.

Профиль клиента

Lamna Healthcare (Lamna) предлагает поставщикам услуг в сфере здравоохранения услуги по управлению данными пациентов. Они обрабатывают особо конфиденциальные данные пациентов на протяжении всей своей деятельности. Доступ к подробным данным должен быть тщательно ограничен. Однако компания Lamna также хотела бы безопасно использовать некоторые версии этих данных для своей деловой практики. Им требуется механизм для обмена данными с аналитиками, который не нарушает законы о доверии пациентов или защите данных.

Текущая ситуация

Сегодня Lamna хранит все свои данные локально. Данные о пациентах хранятся в традиционной системе баз данных. Однако по мере роста их бизнеса и увеличения объема данных компания должна перенести свои приложения по обработке данных пациентов в облако. В рамках этого перехода они хотели бы скопировать данные из приложения в облачную платформу аналитики, которая позволит их аналитикам лучше использовать данные, не создавая дополнительной нагрузки на базу данных приложений.

Важнейшей задачей Lamna является безопасность данных пациентов. Как медицинская компания, она подчиняется нескольким различным законам о защите данных.

Архитектурное решение

Lamna реализует аналитику в масштабе облака в качестве решения для облачной аналитической платформы. Они будут полагаться на несколько целевых зон как для повышения масштабируемости, так и для четкого разделения продуктов с конфиденциальными данными.

Целевая зона управления данными

Критически важной концепцией для каждой реализации аналитики в масштабе облака является наличие одной целевой зоны управления данными. Эта подписка содержит ресурсы, которые будут использоваться во всех целевых зонах. Сюда входят общие сетевые компоненты, такие как брандмауэр и частные зоны DNS. Также включены ресурсы для управления данными и облаком, такие как Политика Azure и Azure Purview.

Целевая зона данных пациентов

В организационной структуре компании Lamna группа управления данными пациентов является частью рабочей группы. Однако, учитывая крайнюю чувствительность используемых ими данных, у них будет собственная целевая зона данных в архитектуре аналитики облачного масштаба.

В этой целевой зоне будет размещена копия подробных данных о пациентах и медицинских записей из приложения компании по управлению пациентами и связанных продуктов данных. Эти продукты данных будут загружаться в целевую зону приложениями данных, которые будут регулярно принимать данные в облако и помещают их в Azure Data Lake Storage.

Целевая зона рабочих данных

Рабочая группа Lamna отвечает за основное направление деятельности компании, а именно за предоставление консультационных услуг поставщикам услуг в сфере здравоохранения. В целевой зоне рабочих данных они хранят данные, связанные с этими поставщиками услуг в сфере здравоохранения и службами, с которыми ведется взаимодействие.

Как и все бизнес-данные, существует элемент конфиденциальности к этим продуктам данных, и Lamna of хочет защитить свой список клиентов. Однако, поскольку эти данные не включают информацию о состоянии здоровья отдельных лиц, на них не распространяются самые строгие законы о защите данных.

Приложения для работы с данными

Целевая зона операций содержит приложение данных , которое загружает данные поставщика медицинских услуг из локальной операционной системы Lamna. Как и все приложения для работы с данными, данные помещается в облако как есть и не применяет преобразования к продуктам данных.

Продукты для данных

Аналитикам в компании Lamna нужен доступ к данным для создания отчетов для бизнеса. Однако большая часть данных слишком конфиденциальна для широкой аудитории. Чтобы обеспечить безопасный доступ к особо конфиденциальным данным пациентов, рабочая команда создала набор данных пациентов с использованием токенов в своей целевой зоне. С помощью Фабрики данных Azure они копируют данные пациентов из целевой зоны пациентов. Тем не менее, команда позаботилась об удалении любых столбцов, содержащих личные данные, или создании для них токенов. Это позволяет аналитикам использовать данные в коммерческих целях, не раскрывая никаких личных данных пациентов.

Целевая зона маркетинговых данных

Маркетинговая группа занимается поиском новых клиентов и управлением положением компании Lamna в Marketplace. Их маркетинговая целевая зона в основном используется для хранения и анализа внешних продуктов данных о рынках, которые они обслуживают, и отрасли здравоохранения.

Однако, чтобы поддержать новый маркетинговый ход, команда хочет провести исследование состояния здоровья пациентов, которых обслуживают клиенты Lamna. Они надеются подготовить основанный на фактах отчет, подкрепленный убедительными статистическими данными, показывающими, что их подход к здравоохранению приводит к достижению лучших результатов.

Чтобы поддержать эту новую инициативу, исследователям из маркетинговой команды потребуется безопасный и соответствующий требованиям доступ к особо конфиденциальным данным пациентов, но при этом они должны иметь возможность получать необходимую им информацию.

Чтобы удовлетворить эту потребность, команда маркетинга создает агрегированные продукты данных из набора данных с маркерами пациентов, созданного операционной группой. Эти продукты данных не содержат отдельных медицинских записей. Вместо этого они группируют записи по разным осям. Это помогает исследователям проводить исследования населения в целом, без запрещенного получения доступа к информации о состоянии здоровья любого человека.

Схема архитектуры.

Рис. 1. Схема архитектуры. На схеме представлены не все службы Azure. Она была упрощена, чтобы выделить основные концепции организации ресурсов в архитектуре.

Правильно

Должны ли все конфиденциальные данные всегда иметь собственную целевую зону данных?

Нет. Только наиболее ограниченные данные, требующие особой защиты, такой как доступ JIT или ключи, управляемые клиентом, требуют собственной целевой зоны. В других сценариях другие функции защиты данных в Azure обеспечивают безопасную среду для ваших данных. К ним относится безопасность на уровне строк, безопасность на уровне столбцов и зашифрованные столбцы.

Шаблоны развертывания

Для развертывания архитектур используйте целевую зону управления данными и эталонные шаблоны реализации целевой зоны данных в следующих репозиториях GitHub:

Используйте следующие шаблоны для развертывания других приложений и продуктов данных в целевых зонах данных Lamna:

Название Целевая зона данных Тип Шаблон
Пациенты Пациенты Приложение данных Шаблон пакета продуктов данных
Медицинские карты Пациенты Приложение данных Шаблон пакета продуктов данных
Поставщики Операции Приложение данных Шаблон пакета продуктов данных
Пациенты с токенами Операции Продукт данных Шаблон пакета продуктов данных
Агрегированные данные о пациентах Marketing Продукт данных Шаблон пакета продуктов данных

Важно!

Не все из приведенных выше эталонных шаблонов реализации необходимо развернуть для удовлетворения требований компании Lamna. Для шаблонов потребуется некоторый уровень настройки. Ненужные службы должны быть удалены из шаблонов перед развертыванием.

Дальнейшие действия