Mi az az 1. generációs Azure Data Lake Storage?
Megjegyzés
2024. február 29-én megszűnik Azure Data Lake Storage Gen1. További információért tekintse meg a hivatalos bejelentést. Ha az Azure Data Lake Storage Gen1-et használja, az adott dátum előtt mindenképpen térjen át Azure Data Lake Storage Gen2. Ennek módjáról a Azure Data Lake Storage migrálása Gen1-ből Gen2-be a Azure Portal használatával című témakörben olvashat.
Ha még nem rendelkezik Azure Data Lake Storage Gen1-fiókkal, nem hozhat létre újakat.
Azure Data Lake Storage Gen1 egy nagyvállalati szintű, nagyvállalati szintű, nagyvállalati szintű adattár big data elemzési számítási feladatokhoz. Az Azure Data Lake lehetővé teszi mindenféle méretű, típusú és feldolgozási sebességű adatok egy helyen történő műveleti és felderítési jellegű feldolgozását.
Data Lake Storage Gen1 a Hadoopból (a HDInsight-fürttel elérhető) a WebHDFS-kompatibilis REST API-k használatával érhető el. Úgy tervezték, hogy lehetővé tegye a tárolt adatok elemzését, és az adatelemzési forgatókönyvek teljesítményének megfelelően van hangolva. Data Lake Storage Gen1 minden nagyvállalati szintű képességet magában foglal: biztonság, kezelhetőség, méretezhetőség, megbízhatóság és rendelkezésre állás.

Főbb képességek
A Data Lake Storage Gen1 fő képességei közé tartoznak a következők.
Hadoop-kompatibilis
Data Lake Storage Gen1 egy Apache Hadoop fájlrendszer, amely kompatibilis a Hadoop elosztott fájlrendszerrel (HDFS), és együttműködik a Hadoop-ökoszisztémával. A WebHDFS API-t használó meglévő HDInsight-alkalmazások vagy -szolgáltatások könnyedén integrálhatók Data Lake Storage Gen1. Data Lake Storage Gen1 egy WebHDFS-kompatibilis REST-felületet is elérhetővé tesz az alkalmazásokhoz.
Az Data Lake Storage Gen1 tárolt adatokat egyszerűen elemezheti Olyan Hadoop-elemzési keretrendszerek használatával, mint a MapReduce vagy a Hive. Azure HDInsight-fürtöket építhet ki, és konfigurálhatja őket a Data Lake Storage Gen1 tárolt adatok közvetlen elérésére.
Korlátlan tárterület, petabájtnyi fájlok
Data Lake Storage Gen1 korlátlan tárterületet biztosít, és számos adatot tárolhat elemzés céljából. Nem korlátozza a fiókméreteket, a fájlméreteket és a data lake-ben tárolható adatok mennyiségét. Az egyes fájlok mérete kilobájttól petabájtig terjedhet. Az adatok tárolása tartósan történik több másolat készítésével. Nincs korlátozva, hogy az adatok mennyi ideig tárolhatók a data lake-ben.
A teljesítmény a big data koncepción alapuló adatelemzéshez lett igazítva
Data Lake Storage Gen1 nagy léptékű elemzési rendszerek futtatására készült, amelyek nagy átviteli sebességet igényelnek nagy mennyiségű adat lekérdezéséhez és elemzéséhez. A data lake több egyéni tárolókiszolgáló között osztja el egy fájl részeit. Ez javítja az olvasás átviteli sebességét a fájl adatelemzés céljából történő párhuzamos beolvasásakor.
Vállalati használatra kész: Magas rendelkezésre állású és biztonságos
Data Lake Storage Gen1 iparági szabványoknak megfelelő rendelkezésre állást és megbízhatóságot biztosít. Adatvagyonának tartós tárolását a redundáns másolatok teszik lehetővé, amelyek védelmet biztosítanak a váratlan meghibásodások esetén.
Data Lake Storage Gen1 vállalati szintű biztonságot is nyújt a tárolt adatokhoz. További információ: Adatok védelme az Azure Data Lake Storage Gen1-ben.
Minden adat
Data Lake Storage Gen1 bármilyen adatot tárolhat natív formátumban, előzetes átalakítások nélkül. Data Lake Storage Gen1 nem kell sémát definiálni az adatok betöltése előtt, az egyes elemzési keretrendszerre hagyva az adatok értelmezéséhez és a séma meghatározásához az elemzés időpontjában. A tetszőleges méretű és formátumú fájlok tárolásának lehetősége lehetővé teszi Data Lake Storage Gen1 számára a strukturált, részben strukturált és strukturálatlan adatok kezelését.
Data Lake Storage Gen1 adattárolók lényegében mappák és fájlok. A tárolt adatokat SDK-k, a Azure Portal és a Azure PowerShell használatával kezelheti. Ha ezeket a felületeket és a megfelelő tárolókat használva helyezi el az adatokat az adattárban, bármilyen típusú adatot tárolhat. Data Lake Storage Gen1 nem végez különleges adatkezelést az általa tárolt adatok típusa alapján.
Adatok védelme
Data Lake Storage Gen1 Azure Active Directory (Azure AD) használja a hitelesítéshez, valamint hozzáférés-vezérlési listákat (ACL-eket) az adatokhoz való hozzáférés kezeléséhez.
| Szolgáltatás | Leírás |
|---|---|
| Hitelesítés | Data Lake Storage Gen1 integrálható a Azure AD az identitás- és hozzáférés-kezeléshez a Data Lake Storage Gen1 tárolt összes adathoz. Az integrációnak köszönhetően Data Lake Storage Gen1 minden olyan Azure AD funkció előnyeit élvezheti, mint a többtényezős hitelesítés, a feltételes hozzáférés, az Azure szerepköralapú hozzáférés-vezérlése, az alkalmazáshasználat monitorozása, a biztonsági monitorozás és riasztások stb. Data Lake Storage Gen1 támogatja az OAuth 2.0 protokollt a REST-felületen belüli hitelesítéshez. Lásd Data Lake Storage Gen1 hitelesítést. |
| Hozzáférés-vezérlés | Data Lake Storage Gen1 a WebHDFS protokoll által közzétett POSIX-stílusú engedélyek támogatásával biztosítja a hozzáférés-vezérlést. Engedélyezheti az ACL-eket a gyökérmappában, az almappákban és az egyes fájlokon. Az ACL-ek Data Lake Storage Gen1 környezetében való működésével kapcsolatos további információkért lásd a hozzáférés-vezérlést a Data Lake Storage Gen1. |
| Titkosítás | Data Lake Storage Gen1 a fiókban tárolt adatok titkosítását is biztosítja. A titkosítási beállításokat Data Lake Storage Gen1-fiók létrehozásakor adhatja meg. Dönthet úgy, hogy titkosítja az adatokat, vagy nem választja a titkosítást. További információ: Titkosítás Data Lake Storage Gen1. A titkosítással kapcsolatos konfiguráció megadására vonatkozó utasításokért tekintse meg a Azure Portal Data Lake Storage Gen1 Első lépések. |
A Data Lake Storage Gen1 adatainak védelmére vonatkozó utasításokért lásd: Adatok védelme az Azure Data Lake Storage Gen1-ben.
Alkalmazáskompatibilitás
Data Lake Storage Gen1 kompatibilis a Hadoop-ökoszisztéma legtöbb nyílt forráskódú összetevőjével. Emellett jól integrálható más Azure-szolgáltatásokkal is. A Data Lake Storage Gen1 nyílt forráskódú összetevőkkel és más Azure-szolgáltatásokkal való használatáról az alábbi hivatkozásokra kattintva tudhat meg többet:
- A Azure Data Lake Storage Gen1-zel kompatibilis alkalmazások és szolgáltatások című témakörben megtalálja a Data Lake Storage Gen1-vel együttműködő nyílt forráskódú alkalmazások listáját.
- A Data Lake Storage Gen1 más Azure-szolgáltatásokkal való használatának megismeréséhez tekintse meg az Integrálás más Azure-szolgáltatásokkal című témakört a forgatókönyvek szélesebb körének engedélyezéséhez.
- A Data Lake Storage Gen1 használatát ismertető forgatókönyvekben megtudhatja, hogyan használhatja a Data Lake Storage Gen1 olyan helyzetekben, mint az adatok betöltése, feldolgozása, adatok letöltése és az adatok megjelenítése.
Data Lake Storage Gen1 fájlrendszer
Data Lake Storage Gen1 az AzureDataLakeFilesystem (adl://) fájlrendszeren keresztül érhető el Hadoop-környezetekben (HDInsight-fürttel érhető el). A adl:// használó alkalmazások és szolgáltatások kihasználhatják a WebHDFS jelenleg nem elérhető további teljesítményoptimalizálási lehetőségeket. Ennek eredményeképpen Data Lake Storage Gen1 rugalmasan kihasználhatja a legjobb teljesítményt a adl:// ajánlott lehetőségével, vagy fenntarthatja a meglévő kódot a WebHDFS API közvetlen használatával. Az Azure HDInsight teljes mértékben az AzureDataLakeFilesystem használatával biztosítja a legjobb teljesítményt Data Lake Storage Gen1.
Az adatokat a Data Lake Storage Gen1 használatával érheti eladl://<data_lake_storage_gen1_name>.azuredatalakestore.net. A Data Lake Storage Gen1 adatainak eléréséről további információt a tárolt adatok tulajdonságainak megtekintése című témakörben talál.