預測患者停留和流動的長度

Azure Data Factory
Azure Data Lake 儲存體
Azure Machine Learning
Azure Synapse Analytics
Power BI

此 Azure 解決方案能夠協助醫院管理人士使用機器學習服務的能力,來預測住院天數的長短,進而改善容量規劃與資源使用率。 首席醫療資訊官可能會使用預測模型來判斷哪些設施超額,以及哪些資源可在這些設施內加強。 護理線經理可能會使用模型來判斷是否有足夠的員工資源來處理病人的釋放。

架構

使用醫療保健裝置和 Azure 服務的遠端患者監視架構圖表。

下載此架構的 Visio 檔案

資料流程

下列數據流對應至上圖:

  1. 使用 Azure Data Factory 搭配適當的運行時間,擷取來自電子健康記錄 (EHR) 和電子醫療記錄 (EMR) 的匿名健康數據(例如:Azure、自我裝載)。 在此案例中,我們假設可以使用其中一個 Azure Data Factory 連接器,例如 ODBC、Oracle、SQL 來存取批次擷取匿名數據。 FHIR 數據等其他數據源可能需要包含 Azure Functions 之類的中繼擷取服務。

  2. Azure Data Factory 數據會流經 Data Factory 到 Azure Data Lake 儲存體 (gen 2) 。 在此程式期間,Azure Data Factory 中不會儲存任何數據,而且在此步驟期間可以處理/重試中斷連線等失敗。

  3. Azure 機器學習 可用來將機器學習演算法/管線套用至步驟 2 中內嵌的數據。 演算法可以根據需求,根據事件、排程或手動套用。 具體來說,這包括:

    3.1 定 型 - 內嵌的數據是用來使用線性回歸和漸層提升判定樹等演演算法組合來定型機器學習模型。 這些演算法是透過管線中的各種架構提供(例如 scikit-learn),而且可能包含前置/後置處理管線步驟。 例如,來自現有預先處理 (例如,卸除 Null 數據列) EMR/EHR 數據的住院類型等患者健康因素可用來定型回歸模型,例如線性回歸。 然後,此模型就能夠預測新的患者停留時間。

    3.2 驗證 - 模型效能會與現有的模型/測試數據進行比較,以及針對任何下游耗用量目標,例如應用程式開發介面(API)。

    3.3 部署 - 模型會使用容器封裝,以用於不同的目標環境。

    3.4 監視器 - 會收集並監視模型預測,以確保效能不會隨著時間降低。 您可以視需要使用此監視數據,將警示傳送至觸發手動或自動重新定型/更新模型。 請注意,視擷取的監視數據類型而定,可能需要 Azure 監視器等其他服務。

  4. Azure 機器學習 輸出會流向 Azure Synapse Analytics。 模型輸出(預測患者停留時間長度)會與可調整的現有病患數據結合在一起,提供一層,例如專用 SQL 集區以供下游取用。 此時可透過 Synapse Analytics 來完成其他分析,例如每個醫院的平均停留時間長度。

  5. Azure Synapse Analytics 會將數據提供給 Power BI。 具體而言,Power BI 會連線到步驟 (4) 中的服務層,以擷取數據並套用所需的其他語意模型。

  6. Power BI 用於護理線經理和醫院資源協調器的分析

元件

  • Azure Data Factory (ADF) 提供完全受控、無伺服器的數據整合和協調流程服務,能夠以可視化方式將數據源與超過 90 個以上的內建、無維護連接器整合,且不加任何成本。 在此案例中,ADF 是用來內嵌數據並協調數據流。

  • Azure Data Lake (ADLS) 為高效能分析提供可調整的安全數據湖。 在此案例中,ADLS 會作為可調整且符合成本效益的數據儲存層使用。

  • Azure 機器學習 (AML) 服務可透過下列方式加速端對端 LOS 預測機器學習生命週期:

    • 讓具有各種生產力體驗的數據科學家和開發人員能夠建置、定型和部署機器學習模型,並培養小組共同作業。
    • 使用領先業界的 MLOps 加速上市時間—機器學習作業,或機器學習的 DevOps。
    • 在安全且受信任的平臺上進行創新,專為負責任的機器學習而設計。

    在此案例中,AML 是用來產生用來預測患者停留時間的模型,以及管理端對端模型生命周期的服務。

  • Azure Synapse Analytics:一項無限制的分析服務,可將數據整合、企業數據倉儲和巨量數據分析整合在一起。 在此案例中,Synapse 可用來將模型預測併入現有的數據模型中,並提供高速服務層以供下游取用。

  • Power BI 提供企業級自助分析,可讓您:

    • 為所有人建立具有商業智慧的數據驅動文化特性。
    • 使用領先業界的數據安全性功能來保護您的數據,包括敏感度標籤、端對端加密,以及即時存取監視。

    在此案例中,Power BI 可用來建立用戶儀錶板,並套用這些儀錶板中所需的任何語意模型。

替代項目

  • 根據數據科學小組的數據規模和技能集,Azure Synapse Analytics Spark 和 Azure Databricks 等 Spark 服務可用來作為執行機器學習的替代方案。
  • MLFlow 可用來管理端對端生命週期,以替代 Azure 機器學習,視客戶技能集/環境而定。
  • 在大部分情況下,Azure Synapse Analytics 管線 可作為 Azure Data Factory 的替代方案,主要取決於特定的客戶環境。

案例詳細資料

對於經營醫療保健設施的人來說,停留時間(LOS)——從病人入院到出院的天數——很重要。 然而,該數位可能會因設施和疾病狀況和專業而有所不同,即使在相同的醫療保健系統中,也很難追蹤患者流動,並據此規劃。

此解決方案為 LOS 啟用住院住院的預測模型。 LOS 的定義是從初始住院日期到病人從任何指定的醫院設施出院的日期的天數。 LOS 在各種設施、疾病狀況和專業之間可能會有很大的變化,即使在相同的醫療保健系統中也是如此。

患者住院時間是否與護理質量有關? 等研究表明,經風險調整較長的 LOS 與接受的護理品質較低有關。 入院時的進階 LOS 預測可藉由為提供者提供預期的 LOS,藉此提升患者護理品質,讓提供者能夠用來作為與目前患者 LOS 進行比較的計量。 這有助於確保超過預期的 LOS 患者獲得適當的注意。 LOS 預測也有助於準確規劃出院,從而降低各種其他品質措施,例如再委任。

潛在使用案例

醫院管理中有兩個不同的業務使用者,他們期望受益於更可靠的停留時間預測,以及患者家屬:

  • 首席醫療資訊官(CMIO)跨越了醫療保健組織中的資訊學/技術和醫療保健專業人員之間的分歧。 其職責通常包括利用分析來判斷是否適當分配醫院網路中的資源。 CMIO 必須能夠判斷哪些設施超額,特別是那些設施的資源可能需要加強,才能以需求重新調整這些資源。
  • 護理線經理,誰直接參與病人的護理。 此角色需要監視個別患者的狀態,並確保員工能夠符合患者的特定護理需求。 護理線經理可以做出準確的醫療決策,並提前對齊正確的資源。 例如,預測 LOS 的能力:
    • 作為患者風險的初始評估,對於更好的 資源規劃和配置至關重要,特別是當資源有限時,就像ICU一樣。
    • 可讓護理線經理判斷員工資源是否足以處理病人的釋放。
  • 預測ICU中的 LOS 也有利於患者及其家屬,以及保險公司。 醫院出院的預期日期有助於患者及其家屬了解和估計醫療費用。 這也給家庭一個關於病人恢復速度的想法,並幫助他們計劃出院和管理他們的預算。

考量

這些考量能實作 Azure Well-Architected Framework 的要素,其為一組指導原則,可以用來改善工作負載的品質。 如需詳細資訊,請參閱 Microsoft Azure Well-Architected Framework (部分機器翻譯)。

成本最佳化

成本最佳化是關於考慮如何減少不必要的費用,並提升營運效率。 如需詳細資訊,請參閱成本最佳化要素的概觀

此解決方案最昂貴的元件是計算,而且有數種方式可透過數據量以符合成本效益的方式調整計算。 其中一個範例是針對數據工程工作使用 Azure Synapse Analytics Spark 或 Azure Databricks 等 Spark 服務,而不是單一節點解決方案。 相較於大型垂直調整的單一節點解決方案,Spark 會水平調整,且更具成本效益。

您可以在此 Azure 定價計算機儲存的估計中找到此架構中所設定的所有 Azure 元件定價。 此估計值設定為顯示預估的預付和每月成本,以執行週一至星期五上午 9 點至 5 點的基本實作。

卓越營運

卓越營運涵蓋部署應用程式並使其持續在生產環境中執行的作業流程。 如需詳細資訊,請參閱卓越營運要素的概觀 (部分機器翻譯)。

紮實的 機器學習 作業(MLOps)實務和實作在生產化中扮演著這種解決方案的重要角色。 如需詳細資訊,請參閱機器學習作業(MLOps)。

效能效益

效能效率可讓您的工作負載進行調整,以有效率的方式符合使用者對其放置的需求。 如需詳細資訊,請參閱效能效率要件概觀

在此案例中,會在 Azure 機器學習 中執行數據前置處理。 雖然此設計適用於小型到中型數據量,但具有近乎即時 SLA 的大型數據磁碟區或案例可能會從效能的觀點來看難以運作。 解決這類問題的方法之一,是針對數據工程或數據科學工作負載使用 Azure Synapse Analytics Spark 或 Azure Databricks 等 Spark 服務。 Spark 會水平縮放,並依設計散發,使其能非常有效地處理大型數據集。

安全性

安全性可提供保證,以避免刻意攻擊和濫用您寶貴的資料和系統。 如需詳細資訊,請參閱安全性要素的概觀

重要

此架構將同時處理匿名和非匿名健康數據。 不過,為了安全實作,我們建議您以匿名形式從 EHR 和 EMR 來源提供健康情況數據。

如需 Azure 機器學習 可用安全性和治理功能的詳細資訊,請參閱 Azure 機器學習 的企業安全性和治理

參與者

本文由 Microsoft 維護。 原始投稿人如下。

主要作者:

若要查看非公開的 LinkedIn 設定檔,請登入 LinkedIn。

下一步

與實作此架構相關的技術和資源:

請參閱與此架構相關的其他 Azure 架構中心內容: