A DICOM-adatok használatának első lépései az elemzési számítási feladatokban

Ez a cikk bemutatja, hogyan kezdheti meg a DICOM-adatok® használatát elemzési számítási feladatokban az Azure Data Factory és a Microsoft Fabric használatával.

Előfeltételek

Első lépésként hajtsa végre az alábbi lépéseket:

  • Hozzon létre egy tárfiókot az Azure Data Lake Storage Gen2 képességeivel egy hierarchikus névtér engedélyezésével:
    • Hozzon létre egy tárolót a DICOM-metaadatok tárolásához, például elnevezve dicom.
  • Telepítse a DICOM szolgáltatás egy példányát.
    • (Nem kötelező) Helyezze üzembe a DICOM szolgáltatást a Data Lake Storage-tal a DICOM-fájlokhoz való közvetlen hozzáférés engedélyezéséhez.
  • Data Factory-példány létrehozása:
  • Hozzon létre egy tóházat a Fabricben.
  • Szerepkör-hozzárendelések hozzáadása a Data Factory rendszer által hozzárendelt felügyelt identitásához a DICOM szolgáltatáshoz és a Data Lake Storage Gen2-tárfiókhoz:
    • Adja hozzá a DICOM adatolvasó szerepkört, hogy engedélyt adjon a DICOM szolgáltatásnak.
    • Adja hozzá a Storage Blob Data Contributor szerepkört, hogy engedélyt adjon a Data Lake Storage Gen2-fióknak.

Data Factory-folyamat konfigurálása a DICOM szolgáltatáshoz

Ebben a példában egy Data Factory-folyamatot használunk a példányok, adatsorok és tanulmányok DICOM-attribútumainak delta táblaformátumú tárfiókba való írására.

Az Azure Portalon nyissa meg a Data Factory-példányt, és a kezdéshez válassza a Launch studio (Stúdió indítása) lehetőséget.

Screenshot that shows the Launch studio button in the Azure portal.

Társított szolgáltatások létrehozása

A Data Factory-folyamatok adatforrásokból olvasnak, és adatgyűjtőkbe írnak, amelyek általában más Azure-szolgáltatások. Ezek a kapcsolatok más szolgáltatásokkal társított szolgáltatásokként vannak kezelve.

A példában szereplő folyamat adatokat olvas be egy DICOM-szolgáltatásból, és a kimenetét egy tárfiókba írja, így mindkettőhöz létre kell hozni egy társított szolgáltatást.

Társított szolgáltatás létrehozása a DICOM szolgáltatáshoz

  1. Az Azure Data Factory Studióban válassza a Bal oldali menü Kezelés elemét. A Csatlakozás ions területen válassza a Csatolt szolgáltatások elemet, majd az Új lehetőséget.

    Screenshot that shows the Linked services screen in Data Factory.

  2. Az Új társított szolgáltatás panelen keresse meg a REST-et. Jelölje ki a REST csempét, majd válassza a Folytatás lehetőséget.

    Screenshot that shows the New linked service pane with the REST tile selected.

  3. Adja meg a társított szolgáltatás nevét és leírását .

    Screenshot that shows the New linked service pane with DICOM service details.

  4. Az Alap URL-cím mezőben adja meg a DICOM szolgáltatás szolgáltatás URL-címét. A munkaterületen contosohealth elnevezett contosoclinic DICOM-szolgáltatás például rendelkezik a szolgáltatás URL-címévelhttps://contosohealth-contosoclinic.dicom.azurehealthcareapis.com.

  5. A hitelesítés típusához válassza a rendszer által hozzárendelt felügyelt identitást.

  6. Az AAD-erőforráshoz írja be a következőthttps://dicom.healthcareapis.azure.com: . Ez az URL-cím megegyezik az összes DICOM-szolgáltatáspéldány esetében.

  7. Miután kitöltötte a szükséges mezőket, válassza a Kapcsolat tesztelése lehetőséget az identitás szerepköreinek megfelelő konfigurálásához.

  8. Ha a kapcsolati teszt sikeres, válassza a Létrehozás lehetőséget.

Társított szolgáltatás létrehozása az Azure Data Lake Storage Gen2-hez

  1. A Data Factory Studióban válassza a Bal oldali menü Kezelés elemét. A Csatlakozás ions területen válassza a Csatolt szolgáltatások elemet, majd az Új lehetőséget.

  2. Az Új társított szolgáltatás panelen keresse meg az Azure Data Lake Storage Gen2-t. Válassza az Azure Data Lake Storage Gen2 csempét, majd a Folytatás lehetőséget.

    Screenshot that shows the New linked service pane with the Azure Data Lake Storage Gen2 tile selected.

  3. Adja meg a társított szolgáltatás nevét és leírását .

    Screenshot that shows the New linked service pane with Data Lake Storage Gen2 details.

  4. A hitelesítés típusához válassza a rendszer által hozzárendelt felügyelt identitást.

  5. Adja meg a tárfiók adatait a tárfiók URL-címének manuális megadásával. Vagy kiválaszthatja az Azure-előfizetést és a tárfiókot a legördülő listákból.

  6. Miután kitöltötte a szükséges mezőket, válassza a Kapcsolat tesztelése lehetőséget az identitás szerepköreinek megfelelő konfigurálásához.

  7. Ha a kapcsolati teszt sikeres, válassza a Létrehozás lehetőséget.

Folyamat létrehozása DICOM-adatokhoz

A Data Factory-folyamatok olyan tevékenységek gyűjteményei, amelyek egy feladatot hajtanak végre, például DICOM-metaadatok másolása Delta-táblákba. Ez a szakasz egy olyan folyamat létrehozását ismerteti, amely rendszeresen szinkronizálja a DICOM-adatokat a Delta-táblákkal, amikor az adatokat hozzáadják, frissítik és törölik egy DICOM-szolgáltatásból.

  1. A bal oldali menüben válassza a Szerző lehetőséget. A Gyári erőforrások panelen válassza a pluszjelet (+) egy új erőforrás hozzáadásához. Válassza a Folyamat lehetőséget, majd válassza a Sablongyűjtemény lehetőséget a menüből.

    Screenshot that shows Template gallery selected under Pipeline.

  2. A Sablontárban keresse meg a DICOM-t. Válassza a DiCOM Metaadatok másolása az ADLS Gen2-be a Delta Format csempén, majd válassza a Folytatás lehetőséget.

    Screenshot that shows the DICOM template selected in the Template gallery.

  3. A Bemenetek szakaszban válassza ki a DICOM szolgáltatáshoz és a Data Lake Storage Gen2-fiókhoz korábban létrehozott társított szolgáltatásokat.

    Screenshot that shows the Inputs section with linked services selected.

  4. Válassza a Sablon használata lehetőséget az új folyamat létrehozásához.

Folyamat létrehozása DICOM-adatokhoz

Ha a DICOM szolgáltatást az Azure Data Lake Storage-nal hozta létre, egy egyéni sablont kell használnia, hogy új fileName paramétert tartalmazzon a metaadat-folyamatba. A sablongyűjtemény sablonjának használata helyett kövesse az alábbi lépéseket a folyamat konfigurálásához.

  1. Töltse le a sablont a GitHubról. A sablonfájl tömörített (tömörített) mappa. Nem kell kibontania a fájlokat, mert már tömörített formában vannak feltöltve.

  2. Az Azure Data Factoryben válassza a Bal oldali menü Szerző elemét . A Gyári erőforrások panelen válassza a pluszjelet (+) egy új erőforrás hozzáadásához. Válassza a Folyamat lehetőséget, majd válassza az Importálás folyamatsablonból lehetőséget.

  3. A Megnyitás ablakban válassza ki a letöltött sablont. Válassza a Megnyitás lehetőséget.

  4. A Bemenetek szakaszban válassza ki a DICOM szolgáltatáshoz és az Azure Data Lake Storage Gen2-fiókhoz létrehozott társított szolgáltatásokat.

    Screenshot showing the Inputs section with linked services selected.

  5. Válassza a Sablon használata lehetőséget az új folyamat létrehozásához.

Folyamat ütemezése

A folyamatokat eseményindítók ütemezik. Különböző típusú triggerek léteznek. Az ütemezési eseményindítók lehetővé teszik, hogy a folyamatok egy fali óra ütemezés szerint aktiválódjanak, ami azt jelenti, hogy a folyamatok a nap meghatározott időszakaiban, például óránként vagy minden nap éjfélkor futnak. A manuális triggerek igény szerint aktiválják a folyamatokat, ami azt jelenti, hogy mindig futnak, amikor csak szeretné.

Ebben a példában egy ugróablak-eseményindítót használunk a folyamat rendszeres futtatásához egy kezdőpont és egy rendszeres időintervallum alapján. Az eseményindítókról további információt az Azure Data Factory vagy az Azure Synapse Analytics folyamatvégrehajtási és eseményindítói című témakörben talál.

Új átfedésmentes ablak eseményindító létrehozása

  1. A bal oldali menüben válassza a Szerző lehetőséget. Válassza ki a DICOM szolgáltatás folyamatát, és válassza az Eseményindító hozzáadása és az Új/Szerkesztés lehetőséget a menüsávon.

    Screenshot that shows the pipeline view of Data Factory Studio with the Add trigger button on the menu bar selected.

  2. Az Eseményindítók hozzáadása panelen válassza az Eseményindító kiválasztása legördülő menüt, majd az Új lehetőséget.

  3. Adja meg az eseményindító nevét és leírását .

    Screenshot that shows the New trigger pane with the Name, Description, Type, Date, and Recurrence fields.

  4. Típusként válassza a Átfedés ablak lehetőséget.

  5. Ha óránként futó folyamatot szeretne konfigurálni, állítsa az ismétlődés 1 óra értékre.

  6. Bontsa ki a Speciális szakaszt, és adjon meg 15 perces késleltetést. Ez a beállítás lehetővé teszi, hogy az egy óra végén függőben lévő műveletek befejeződjenek a feldolgozás előtt.

  7. A táblák konzisztenciájának biztosításához állítsa a maximális egyidejűséget 1-re.

  8. Az OK gombra kattintva folytathatja az eseményindító-futtatási paraméterek konfigurálását.

Eseményindító futtatási paramétereinek konfigurálása

Az eseményindítók határozzák meg, hogy mikor kell futtatni egy folyamatot. Emellett olyan paramétereket is tartalmaznak, amelyeket a rendszer átad a folyamat végrehajtásának. A DICOM metaadatok másolása deltasablonra történő módosítása néhány paramétert határoz meg, amelyeket az alábbi táblázatban ismertetünk. Ha a konfiguráció során nem ad meg értéket, a rendszer a felsorolt alapértelmezett értéket használja az egyes paraméterekhez.

Paraméter neve Leírás Alapértelmezett érték
BatchSize A változáscsatornából egyszerre beolvasandó módosítások maximális száma (legfeljebb 200) 200
ApiVersion Az Azure DICOM szolgáltatás API-verziója (legalább 2) 2
StartTime A DICOM-módosítások befogadó kezdési ideje 0001-01-01T00:00:00Z
EndTime A DICOM-módosítások kizárólagos befejezési ideje 9999-12-31T23:59:59Z
ContainerName Az eredményként kapott Delta-táblák tárolóneve dicom
InstanceTablePath A tárolón belüli DICOM SOP-példányok Delta táblájának elérési útja instance
SeriesTablePath A tárolón belüli DICOM-sorozat Delta tábláját tartalmazó elérési út series
StudyTablePath A tárolón belüli DICOM-vizsgálatokHoz tartozó Delta táblát tartalmazó elérési út study
RetentionHours A Delta-táblákban lévő adatok maximális megőrzési ideje órákban 720
  1. Az Eseményindító futtatási paraméterei panelen adja meg azt a ContainerName értéket, amely megfelel az előfeltételekben létrehozott tároló nevének.

    Screenshot that shows the Trigger Run Parameters pane, with StartTime and EndTime values entered.

  2. StartTime esetén használja a rendszerváltozót@formatDateTime(trigger().outputs.windowStartTime).

  3. EndTime esetén használja a rendszerváltozót@formatDateTime(trigger().outputs.windowEndTime).

    Feljegyzés

    A rendszerváltozókat csak a bukóablak-eseményindítók támogatják:

    • @trigger().outputs.windowStartTime És
    • @trigger().outputs.windowEndTime

    Az ütemezési eseményindítók különböző rendszerváltozókat használnak:

    • @trigger().scheduledTime És
    • @trigger().startTime

    További információ az eseményindítók típusairól.

  4. Válassza a Mentés lehetőséget az új eseményindító létrehozásához. A Közzététel lehetőséget választva elindíthatja az eseményindítót a megadott ütemezés szerint.

    Screenshot that shows the Publish button on the main menu bar.

Az eseményindító közzététele után manuálisan is aktiválható az Eseményindító most lehetőséggel. Ha a kezdési időpont a múltban egy értékre lett beállítva, a folyamat azonnal elindul.

Folyamatfuttatások monitorozása

A Monitor lapon figyelheti az eseményindító-futtatásokat és a hozzájuk tartozó folyamatfuttatásokat. Itt tallózhat, hogy mikor futottak az egyes folyamatok, és mennyi ideig tartott a futtatás. Az esetlegesen felmerülő problémákat is elháríthatja.

Screenshot that shows the Monitor view with a list of pipeline runs.

Microsoft Fabric

A Fabric egy teljes körű elemzési megoldás, amely a Microsoft OneLake-ra támaszkodik. A Fabric lakehouse használatával egyetlen helyen kezelheti, strukturálhatja és elemezheti az adatokat a OneLake-ben. A OneLake-en kívüli, a Data Lake Storage Gen2-be írt adatok billentyűparancsként csatlakoztathatók a OneLake-hez, hogy kihasználhassák a Fabric eszközkészletének előnyeit.

Parancsikonok létrehozása metaadattáblákhoz

  1. Nyissa meg az előfeltételekben létrehozott tóházat. Explorer nézetben válassza a Három pont menüt (...) a Táblák mappa mellett.

  2. Válassza az Új parancsikont a DICOM-elemzési adatokat tartalmazó tárfiók új parancsikonjának létrehozásához.

    Screenshot that shows the New shortcut option in the Explorer view.

  3. Válassza ki az Azure Data Lake Storage Gen2-t a parancsikon forrásaként.

    Screenshot that shows the New shortcut view with the Azure Data Lake Storage Gen2 tile.

  4. A Csatlakozás ion beállításai között adja meg a Csatolt szolgáltatások szakaszban használt URL-címet.

    Screenshot that shows the connection settings for the Azure Data Lake Storage Gen2 account.

  5. Válasszon ki egy meglévő kapcsolatot, vagy hozzon létre egy új kapcsolatot a használni kívánt hitelesítési típus kiválasztásával.

    Feljegyzés

    A Data Lake Storage Gen2 és a Fabric között többféleképpen is hitelesíthet. Használhat szervezeti fiókot vagy szolgáltatásnevet. Nem javasoljuk a fiókkulcsok vagy a közös hozzáférésű jogosultságkód-jogkivonatok használatát.

  6. Válassza a Tovább lehetőséget.

  7. Adjon meg egy parancsikonnevet , amely a Data Factory-folyamat által létrehozott adatokat jelöli. A Delta-tábla esetében instance például a parancsikon nevének valószínűleg példánynak kell lennie.

  8. Adja meg a paraméternek megfelelő alelérési útvonalat a ContainerName futtatási paraméterek konfigurációjából, valamint a parancsikon táblájának nevét. Használja például /dicom/instance a Delta táblát a tárolóban lévő dicom elérési úttalinstance.

  9. A parancsikon létrehozásához válassza a Létrehozás lehetőséget.

  10. Ismételje meg a 2–9. lépést a fennmaradó billentyűparancsok hozzáadásához a tárfiók többi Delta-táblájába (például series és study).

A billentyűparancsok létrehozása után bontsa ki a táblázatot az oszlopok nevének és típusának megjelenítéséhez.

Screenshot that shows the table columns listed in the Explorer view.

Parancsikonok létrehozása fájlokhoz

Ha DICOM szolgáltatást használ a Data Lake Storage szolgáltatással, létrehozhat egy parancsikont is a data lake-ben tárolt DICOM-fájladatokhoz.

  1. Nyissa meg az előfeltételekben létrehozott tóházat. Explorer nézetben válassza a Fájlok mappa melletti három pont menüt (...).

  2. Válassza az Új parancsikont a DICOM-adatokat tartalmazó tárfiók új parancsikonjának létrehozásához.

    Screenshot that shows the New shortcut option of the Files menu in the Explorer view.

  3. Válassza ki az Azure Data Lake Storage Gen2-t a parancsikon forrásaként.

    Screenshot that shows the New shortcut view with the Azure Data Lake Storage Gen2 tile.

  4. A Csatlakozás ion beállításai között adja meg a Csatolt szolgáltatások szakaszban használt URL-címet.

    Screenshot that shows the connection settings for the Azure Data Lake Storage Gen2 account.

  5. Válasszon ki egy meglévő kapcsolatot, vagy hozzon létre egy új kapcsolatot a használni kívánt hitelesítési típus kiválasztásával.

  6. Válassza a Tovább lehetőséget.

  7. Adjon meg egy parancsikonnevet , amely leírja a DICOM-adatokat. Például contoso-dicom-files.

  8. Adja meg a DICOM szolgáltatás által használt tároló és mappa nevével egyező alelérési útvonalat . Ha például a gyökérmappára szeretne hivatkozni, az alelérési útvonal a /dicom/AHDS lesz. Vegye figyelembe, hogy a gyökérmappa mindig AHDSlétezik, de igény szerint hivatkozhat egy gyermekmappára egy adott munkaterület vagy DICOM szolgáltatáspéldány esetében.

  9. A parancsikon létrehozásához válassza a Létrehozás lehetőséget.

Screenshot that shows the shortcut to the DICOM files.

Jegyzetfüzetek futtatása

Miután létrehozta a táblákat a lakehouse-ban, lekérdezheti őket Fabric-jegyzetfüzetekből. Jegyzetfüzeteket közvetlenül a lakehouse-ból is létrehozhat, ha a menüsávOn a Jegyzetfüzet megnyitása lehetőséget választja.

A jegyzetfüzet oldalán a tóház tartalma továbbra is megtekinthető a bal oldalon, beleértve az újonnan hozzáadott táblákat is. A lap tetején válassza ki a jegyzetfüzet nyelvét. A nyelv az egyes cellákhoz is konfigurálható. Az alábbi példa a Spark SQL-t használja.

Táblák lekérdezése a Spark SQL használatával

A cellaszerkesztőben adjon meg egy Spark SQL-lekérdezést utasításként SELECT .

SELECT * from instance

Ez a lekérdezés a tábla összes tartalmát kiválasztja instance . Ha elkészült, válassza a Futtatás elemet a lekérdezés futtatásához.

Screenshot that shows a notebook with a sample Spark SQL query.

Néhány másodperc elteltével a lekérdezés eredményei megjelennek a cella alatti táblázatban, mint az itt látható példa. Az idő hosszabb lehet, ha ez a Spark-lekérdezés az első a munkamenetben, mert a Spark-környezetet inicializálni kell.

Screenshot that shows a notebook with a sample Spark SQL query and results.

DICOM-fájladatok elérése jegyzetfüzetekben

Ha a sablonnal hozta létre a folyamatot, és létrehozott egy parancsikont a DICOM-fájladatokhoz, a filePath tábla oszlopával korrelálhatja a instance példány metaadatait az adatokkal.

SELECT sopInstanceUid, filePath from instance

Screenshot that shows a notebook with a sample Spark SQL query and results that includes the filePath.

Összegzés

Ebben a cikkben megtanulta, hogyan:

  • Data Factory-sablonok használatával hozzon létre egy folyamatot a DICOM szolgáltatásból egy Data Lake Storage Gen2-fiókba.
  • Konfiguráljon egy eseményindítót a DICOM-metaadatok óránkénti kinyeréséhez.
  • Parancsikonokkal csatlakoztathatja egy tárfiók DICOM-adatait egy Fabric lakehouse-hoz.
  • Jegyzetfüzetek használatával lekérdezheti a dicom-adatokat a lakehouse-ban.

Következő lépések

Feljegyzés

A DICOM® az Országos Elektromos Gyártók Országos Szövetségének bejegyzett védjegye az orvosi információk digitális kommunikációjával kapcsolatos szabványügyi kiadványaihoz.