Mivel az egészségügyi és élettudományi szervezetek arra törekszenek, hogy személyre szabottabb élményt nyújtsanak a betegeknek és a gondozóknak, kihívást jelent számukra, hogy a régi rendszerekből származó adatokat használva releváns, pontos és időszerű prediktív elemzéseket nyújtsanak. Az adatgyűjtés a hagyományos működési rendszereken és az elektronikus egészségügyi nyilvántartásokon (EHR)túlra került, és egyre inkább strukturálatlan formákká vált a fogyasztói egészségügyi alkalmazásokból, a fitnesz hordható eszközeiből és az intelligens orvosi eszközökből. A szervezeteknek szükségük van arra, hogy gyorsan központosíthassák ezeket az adatokat, és kihasználhassák az adatelemzés és a gépi tanulás erejét, hogy relevánsak maradjanak az ügyfeleik számára.
E célok elérése érdekében az egészségügyi és élettudományi szervezeteknek a következőkre kell törekedniük:
- Hozzon létre egy adatforrást, amelyből a prediktív elemzés valós idejű értéket biztosíthat az egészségügyi szolgáltatók, a kórházi rendszergazdák, a gyógyszergyártók és mások számára.
- Olyan iparági szakértők (KKV-k) számára, amelyek nem rendelkeznek adatelemzési és gépi tanulási ismeretekkel.
- Biztosítsa az adatelemzési és gépi tanulási (ML) kkv-k számára azokat a rugalmas eszközöket, amelyekre szükségük van a prediktív modellek hatékony, pontos és nagy léptékű létrehozásához és üzembe helyezéséhez.
Ez az architektúra prediktív állapotelemzési keretrendszert biztosít a felhőben a modell fejlesztésének, üzembe helyezésének és felhasználásának felgyorsításához.
Lehetséges használati esetek
- Kórházi visszafogadások előrejelzése
- A betegdiagnózis felgyorsítása ML-alapú képalkotással
- Szövegelemzés elvégzése orvosjegyzeteken
- Mellékhatások előrejelzése a betegek távoli monitorozási adatainak elemzésével az orvosi eszközök internetes hálózatáról (IoMT)
Architektúra
Ez az architektúra egy teljes körű mintafolyamatot képvisel a diabéteszes betegek kórházi visszafogadásának előrejelzéséhez, 1999 és 2008 között 130 amerikai kórház nyilvánosan elérhető adatainak felhasználásával. Először kiértékel egy bináris besorolási algoritmust a prediktív teljesítményhez, majd összehasonlítja az automatizált gépi tanulással létrehozott prediktív modellekkel. Olyan helyzetekben, amikor az automatizált gépi tanulás nem tudja kijavítani a kiegyensúlyozatlan adatokat, alternatív technikákat kell alkalmazni. A rendszer kiválaszt egy végső modellt az üzembe helyezéshez és a felhasználáshoz.
Ez a keretrendszer natív Azure Analytics-szolgáltatásokat használ az adatbetöltéshez, a tároláshoz, az adatfeldolgozáshoz, az elemzéshez és a modell üzembe helyezéséhez.
Töltse le az architektúra PowerPoint fájlját.
Az architektúra leírása a résztvevők szerepkörei alapján történik.
adatmérnök: Felelős az adatok forrásrendszerekből való betöltéséért és az adatfolyamatok vezényléséért, hogy adatokat helyezzenek át a forrásból a célba. A nyers adatokon adatátalakítások is végrehajthatók.
- Ebben a forgatókönyvben a korábbi kórházi visszafogadási adatokat egy helyszíni SQL Server adatbázisban tárolja a rendszer.
- A várt kimenet egy felhőalapú tárfiókban tárolt visszafogadási adatok.
adattudós: Felelős különböző feladatok elvégzéséért a céltároló réteg adatain, hogy előkészítse azokat a modell előrejelzéséhez. A feladatok közé tartozik a tisztítás, a jellemzőkiemelés és az adatok szabványosítása.
- Tisztító: Az adatok előzetes feldolgozása, null értékek eltávolítása, felesleges oszlopok elvetése stb. Ebben a forgatókönyvben elveti a túl sok hiányzó értéket tartalmazó oszlopokat.
- Jellemzőkiemelés:
- Határozza meg a kívánt kimenet előrejelzéséhez szükséges bemeneteket.
- Meghatározhatja a lehetséges előrejelzőket a visszafogadáshoz, például olyan szakembereknek szólva, mint az orvosok és nővérek. A valós bizonyítékok például arra utalhatnak, hogy a túlsúlyos diabéteszes beteg a kórházi visszafogadás előrejelzése.
- Adatszabványosítás:
- Az adatok helyének és változékonyságának jellemzése a gépi tanulási feladatok előkészítéséhez. A jellemzőknek tartalmazniuk kell az adateloszlást, a ferdeséget és a csúcsosságot.
- A ferdeség a következő kérdésre válaszol: Mi az eloszlás alakja?
- A kurtózis a következő kérdésre válaszol: Mi az eloszlás vastagságának vagy vastagságának mértéke?
- Azonosítsa és javítsa ki az adathalmaz rendellenességeit – az előrejelzési modellt normál eloszlású adathalmazon kell végrehajtani.
- A várt kimenet a következő betanítási adatkészletek:
- Az üzembe helyezésre kész, kielégítő előrejelzési modell létrehozásához használható.
- A Citizen adattudós automatikus modell-előrejelzéshez (AutoML) adható.
- Az adatok helyének és változékonyságának jellemzése a gépi tanulási feladatok előkészítéséhez. A jellemzőknek tartalmazniuk kell az adateloszlást, a ferdeséget és a csúcsosságot.
Citizen adattudós: Felelős a adattudós betanítási adatain alapuló előrejelzési modell elkészítéséért. A Citizen adattudós valószínűleg olyan AutoML-képességet használ, amely nem igényel nagy kódolási képességeket az előrejelzési modellek létrehozásához.
A várt kimenet egy megfelelő előrejelzési modell, amely készen áll az üzembe helyezésre.
Üzletiintelligencia- (BI-) elemző: A adatmérnök által előállított nyers adatok működési elemzéséért felelős. A BI-elemző részt vehet relációs adatok strukturálatlan adatokból való létrehozásában, SQL-szkriptek írásában és irányítópultok létrehozásában.
A várt kimenet a relációs lekérdezések, BI-jelentések és irányítópultok.
MLOps-mérnök: A modelleknek a adattudós vagy a Citizen adattudós által biztosított éles üzembe helyezéséért felelős.
A várt kimenet olyan modellek, amelyek készen állnak az éles környezetben való használatra, és reprodukálhatók.
Bár ez a lista átfogó képet nyújt az összes lehetséges szerepkörről, amely a munkafolyamat bármely pontján használhatja az egészségügyi adatokat, a szerepkörök szükség szerint konszolidálhatók vagy kibonthatók.
Összetevők
- Azure Data Factory egy vezénylési szolgáltatás, amely képes adatokat áthelyezni a helyszíni rendszerekből az Azure-ba, hogy más Azure-adatszolgáltatásokkal működjön együtt. A folyamatokat az adatáthelyezéshez, a leképezési adatfolyamokat pedig különféle átalakítási feladatok végrehajtására használják, például kinyeréshez, átalakításhoz, betöltéshez (ETL) és kinyeréshez, betöltéshez, átalakításhoz (ELT). Ebben az architektúrában a adatmérnök a Data Factory használatával futtat egy folyamatot, amely a kórház korábbi visszafogadási adatait másolja egy helyszíni SQL Server a felhőtárhelyre.
- Az Azure Databricks egy Spark-alapú elemzési és gépi tanulási szolgáltatás, amely adatfeldolgozáshoz és ML számítási feladatokhoz használható. Ebben az architektúrában a adatmérnök Databricks hív meg egy Data Factory-folyamatot egy Databricks-jegyzetfüzet futtatásához. A jegyzetfüzetet a adattudós fejleszti ki a kezdeti adattisztítási és jellemzőkiemelési feladatok kezelésére. A adattudós további jegyzetfüzetekben írhat kódot az adatok szabványosításához, valamint előrejelzési modellek létrehozásához és üzembe helyezéséhez.
- Azure Data Lake Storage egy nagymértékben skálázható és biztonságos tárolási szolgáltatás a nagy teljesítményű elemzési számítási feladatokhoz. Ebben az architektúrában a adatmérnök a Data Lakes Storage használatával határozza meg az Azure-ba betöltött helyszíni adatok kezdeti kezdőzónáját, valamint a betanítási adatok végső célzónát. Az adatok nyers vagy végső formában, készen állnak a különböző alárendelt rendszerek általi felhasználásra.
- Azure Machine Learning egy együttműködésen alapuló környezet, amely gépi tanulási modellek betanítása, üzembe helyezése, automatizálása, kezelése és nyomon követése gombra szolgál. Az automatizált gépi tanulás (AutoML) olyan képesség, amely automatizálja az ML modell fejlesztésében részt vevő időigényes és iteratív feladatokat. A adattudós Machine Learning használatával követi nyomon ML Databricks futtatásokat, és autoML-modelleket hoz létre, hogy teljesítménytesztként szolgáljon a adattudós ML modelljeihez. A Citizen adattudós ezzel a szolgáltatással gyorsan futtathatja a betanítási adatokat az AutoML-ben modellek létrehozásához anélkül, hogy részletes ismeretekre lenne szüksége a gépi tanulási algoritmusokról.
- A Azure Synapse Analytics egy olyan elemzési szolgáltatás, amely egyesíti az adatintegrációt, a vállalati adattárházakat és a big data-elemzéseket. A felhasználók szabadon kérdezhetnek le adatokat kiszolgáló nélküli vagy dedikált erőforrások használatával, nagy méretekben. Ebben az architektúrában:
- A adatmérnök a Synapse Analytics használatával egyszerűen hoz létre relációs táblákat a data lake-beli adatokból az operatív elemzés alapjaként.
- A adattudós segítségével gyorsan lekérdezheti a data lake-beli adatokat, és Spark-jegyzetfüzetekkel fejleszthet előrejelzési modelleket.
- A BI-elemző a már ismert SQL-szintaxist használó lekérdezések futtatására használja.
- A Microsoft Power BI olyan szoftverszolgáltatások, alkalmazások és összekötők gyűjteménye, amelyek együttműködve koherens, vizuálisan magával ragadó és interaktív elemzésekké alakítják a nem kapcsolódó adatforrásokat. A BI-elemző Power BI használ az adatokból származó vizualizációk fejlesztésére, például az egyes páciensek otthoni helyének és a legközelebbi kórháznak a térképére.
- A Azure Active Directory (Azure AD) egy felhőalapú identitás- és hozzáférés-kezelési szolgáltatás. Ebben az architektúrában az Azure-szolgáltatásokhoz való hozzáférést szabályozza.
- Az Azure Key Vault egy olyan felhőszolgáltatás, amely biztonságos tárat biztosít a titkos kódokhoz, például kulcsokhoz, jelszavakhoz és tanúsítványokhoz. Key Vault tartalmazza azokat a titkos kódokat, amelyekkel Databricks írási hozzáférést szerezhet a data lake-hez.
- Felhőhöz készült Microsoft Defender egy egységes infrastruktúrabiztonsági felügyeleti rendszer, amely megerősíti az adatközpontok biztonsági pozícióját, és fejlett fenyegetésvédelmet nyújt a felhőben és a helyszínen található hibrid számítási feladatokhoz. Segítségével monitorozhat biztonsági fenyegetéseket az Azure-környezettel szemben.
- A Azure Kubernetes Service (AKS) egy teljes körűen felügyelt Kubernetes-szolgáltatás tárolóalapú alkalmazások üzembe helyezéséhez és kezeléséhez. Az AKS egyszerűbben üzembe helyez egy felügyelt AKS-fürtöt az Azure-ban azáltal, hogy az üzemeltetési többletterhelést ki kell töltenie az Azure-ba.
Alternatív megoldások
Adatáthelyezés: A Databricks használatával adatokat másolhat egy helyszíni rendszerből a data lake-be. A Databricks általában olyan adatokhoz megfelelő, amelyek streameléssel vagy valós idejű igényléssel, például orvosi eszközről származó telemetriával kapcsolatosak.
Machine Learning: a H2O.ai, a DataRobot, a Dataiku és más szállítók automatizált gépi tanulási képességeket kínálnak, amelyek hasonlóak Machine Learning AutoML-hez. Ezeket a platformokat az Azure adatfeldolgozási és gépi tanulási tevékenységeinek kiegészítésére használhatja.
Megfontolandó szempontok
A magas rendelkezésre állású és biztonságos rendszer Microsoft Azure Well-Architected keretrendszerének következő pilléreit foglalja bele:
Rendelkezésre állás
A valós idejű klinikai adatok és megállapítások biztosítása számos egészségügyi szervezet számára kritikus fontosságú. Az állásidő minimalizálására és az adatok biztonságának megőrzésére az alábbi módszerek állnak rendelkezésre:
- Data Lake Storage mindig háromszor replikálódik az elsődleges régióban, és választhat helyileg redundáns tárolást (LRS) vagy zónaredundáns tárolást (ZRS).
- A Synapse Analytics adatbázis-visszaállítási pontokat és vészhelyreállítást biztosít.
- A Data Factory-adatok tárolása és replikálása egy Párosított Azure-régióban történik az üzletmenet folytonosságának és vészhelyreállításának biztosítása érdekében.
- Databricks vészhelyreállítási útmutatást nyújt az adatelemzési platformhoz.
- A Machine Learning üzembe helyezése többrégiós is lehet.
Teljesítmény
A Data Factory saját üzemeltetésű integrációs modulja vertikálisan felskálázható a magas rendelkezésre állás és a méretezhetőség érdekében.
Biztonság
Az egészségügyi adatok gyakran tartalmaznak bizalmas, védett egészségügyi információkat (PHI) és személyes adatokat. Az alábbi erőforrások érhetők el ezen adatok védelméhez:
- Data Lake Storage azure-beli szerepköralapú hozzáférés-vezérlés (RBAC) és hozzáférés-vezérlési listák (ACL-ek) használatával hoz létre hozzáférés-vezérlési modellt.
- A Synapse Analytics számos hozzáférési és biztonsági vezérlőt biztosít az adatbázis, az oszlop és a sor szintjén. Az adatok cellaszinten és adattitkosítással is védhetők.
- A Data Factory alapszintű biztonsági infrastruktúrát biztosít az adatáthelyezéshez hibrid és felhőalapú forgatókönyvekben is.
Díjszabás
A megoldás díjszabása a következőn alapul:
- A használt Azure-szolgáltatások.
- Az adatok mennyisége.
- Kapacitásra és átviteli sebességre vonatkozó követelmények.
- Szükséges ETL-/ELT-átalakítások.
- A gépi tanulási feladatok végrehajtásához szükséges számítási erőforrások.
A költségeket az Azure díjkalkulátorával becsülheti meg.
Közreműködők
Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.
Fő szerzők:
- Matt Hansen | Vezető felhőmegoldás-tervező
- Sandy Su | Felhőmegoldás-tervező
Következő lépések
Azure-szolgáltatások
- Mi az az Azure Data Factory?
- Mi az az Azure Databricks?
- ML modellek nyomon követése az MLflow és a Azure Machine Learning használatával
- Az Azure Data Lake Storage Gen2 bemutatása
- Mi az Azure Machine Learning?
- Mi az az automatizált gépi tanulás (AutoML)?
- Mi az az Azure Synapse Analytics?
- A prediktív elemzések erejének felszabadítása a Azure Synapse gépi tanulással és AI-val
- Fejlett elemzési architektúra
- Mi az a Power BI?
- Mi az az Azure Active Directory?
- Információk az Azure Key Vaultról
- Mi az a Felhőhöz készült Microsoft Defender?
Egészségügyi megoldások
- Microsoft Cloud for Healthcare
- Azure egészségügyi célokra
- Azure API for FHIR
- IoMT FHIR-összekötő az Azure-hoz
- Távoli betegfigyelés az orvosi eszközök internetes hálózatával (IoMT)
Kapcsolódó források (lehet, hogy a cikkek angol nyelvűek)
- Python modellek kötegelt pontozása az Azure-ban
- Citizen AI a Power Platformmal
- AI és ML számítástechnika üzembe helyezése a helyszínen és a peremhálózaton
- Python-modellek modellkezelése az Azure Machine Learninggel
- Adatelemzés és gépi tanulás az Azure Databricks
- A tartózkodás és a betegáramlás előrejelzése
- Population Health Management for Healthcare
