Share via


Az Azure Synapse Analytics használata felhőalapú elemzéssel

Az Azure Synapse Analytics egy kiépített integrált elemzési szolgáltatás, amely felgyorsítja az adatraktárak és big data rendszerek áttekintésének idejét. Az Azure Synapse Analytics a következő elemeket egyesíti:

  • A vállalati adattárházakban használt legjobb SQL-technológiák.
  • A big data-hoz használt Spark-technológiák.
  • Folyamatok adatalkalmazáshoz (forráshoz igazított) és kinyeréshez, átalakításhoz és betöltéshez (ETL) vagy kinyeréshez, betöltéshez és átalakításhoz (ELT).

Az Azure Synapse Studio egy eszköz az Azure Synapse-ban, amely egységes felületet biztosít a felügyelethez, a monitorozáshoz, a kódoláshoz és a biztonsághoz. A Synapse Studio mély integrációval rendelkezik más Azure-szolgáltatásokkal, például a Power BI-val, az Azure Cosmos DB-vel és az Azure Machine-Tanulás.

Megjegyzés:

Ez a szakasz a felhőalapú elemzésekre jellemző, előírt konfigurációkat ismerteti. Ez egy bók az Azure Synapse Analytics hivatalos dokumentációjának.

Áttekintés

Az adat-kezdőzóna kezdeti beállítása során egyetlen Azure Synapse Analytics-munkaterületet helyezhet üzembe az összes elemző és adatelemző számára. Több munkaterületet is létrehozhat adott adatintegrációkhoz vagy adattermékekhez.

Szükség lehet további Azure Synapse Analytics-munkaterületekre, ha az adatterméknek sorszintű és oszlopszintű biztonsággal kell hozzáférést biztosítania a szabványosított adatokhoz . Ezeket a munkaterületeket Azure Synapse-készletekkel is elláthatja. Előfordulhat, hogy az adattermék-csapatoknak saját munkaterületre van szükségük az adattermékek létrehozásához, és egy külön munkaterületre, amely csak a hatókörön belüli fejlesztési hozzáféréssel rendelkező termékcsoportok számára érhető el.

Az Azure Synapse Analytics beállítása

Az Azure Synapse Analytics üzembe helyezésének első lépése egy Azure Purview-fiókhoz csatlakoztatott Azure Synapse-munkaterület beállítása.

Azure Synapse Analytics hálózatkezelés

Az adat-kezdőzóna egy Azure Synapse Analytics által felügyelt virtuális hálózattal rendelkező munkaterületeket hoz létre. Az Azure Synapse-jal való kommunikáció az általa elérhetővé tott három végponton keresztül történik: SQL-készlet, igény szerinti SQL és fejlesztési végpont.

A felhőalapú elemzések hálózati szinten synapse által felügyelt privát végpontokat használnak. Ezek a végpontok biztosítják, hogy az adat-kezdőzóna virtuális hálózata és az Azure Synapse-munkaterületek közötti összes forgalom teljes mértékben a Microsoft gerinchálózatán halad át.

Azure Synapse adathozzáférés-vezérlés

Hozzáférés-vezérlési listák használata a Microsoft Entra-átengedéssel az Azure Synapse Analyticsben a data lake-beli fájlokhoz való hozzáférés kezeléséhez.

Az olyan adatok esetében, ahol korlátoznia kell a visszaadott oszlopokat és sorokat, a sorszintű és az oszlopszintű biztonságot javasoljuk, hogy korlátozza a dedikált vagy kiszolgáló nélküli Azure Synapse SQL-készlet tábláihoz való adathozzáférést. A sorszintű biztonság és az oszlopszintű biztonság az adatbázis szintjén és az adatbázisszerepkörök mellett valósul meg.

A sorszintű biztonság például biztosítja, hogy egy adott (forráshoz igazított) vagy adattermékben lévő felhasználók csak a saját adataikat lássák. Még akkor is, ha a tábla a teljes vállalat adatait tartalmazza.

A sorszintű biztonság és az oszlopszintű biztonság kombinálásával korlátozhatja a bizalmas adatokkal rendelkező oszlopokhoz való hozzáférést. Így a sorszintű biztonság és az oszlopszintű biztonság is az adatbázisszinten alkalmazza a hozzáférés-korlátozás logikáját az alkalmazásszint helyett. A rendszer minden alkalommal kiértékeli az engedélyt, amikor bármilyen szintről megkísérli az adathozzáférést.

Megjegyzés:

Az Azure Synapse kiszolgáló nélküli SQL-készlete a nézetek oszlopszintű biztonságát támogatja, külső táblák esetében nem. Külső táblák esetén a külső tábla tetején logikai nézetet hozhat létre, és nem alkalmazhat oszlopszintű biztonságot. Sorszintű biztonság esetén az egyéni nézetek áthidaló megoldásként használhatók.

További információ: Azure Synapse Analytics adathozzáférés-vezérlés.

Azure Synapse adathozzáférés-vezérlés az Azure Data Lake-ben

Azure Synapse Analytics-munkaterület üzembe helyezésekor szüksége lesz egy Azure Data Lake Storage-fiókra az előfizetésből, vagy manuálisan a tárfiók URL-címének használatával. A megadott tárfiók elsődlegesként van beállítva az üzembe helyezett Azure Synapse-munkaterület számára az adatok tárolásához. Az Azure Synapse egy olyan tárolóban tárolja az adatokat, amely Apache Spark-táblákat és Spark-alkalmazásnaplókat tartalmaz egy úgynevezett /synapse/{workspaceName}mappában. Emellett rendelkezik egy tárolóval a telepíteni kívánt kódtárak kezeléséhez.

Tipp.

Javasoljuk, hogy egy dedikált tárolót használjon a fejlesztési rétegben vagy a Data Lake Three-fiókban . Ez a tároló elsődleges tárolóként szolgál a Spark-metaadatok tárolásához.

Az adathozzáférés beállítására vonatkozó javaslatokért tekintse meg az Azure Synapse Analytics adathozzáférés-vezérlését .

Következő lépések