Azure-technológiák a tanuláshoz

Befejeződött

Ebben a leckében megtudhatja, hogyan alkalmazhatja a mértéklépés eredményeit az innovációs életciklusban. Megismerheti az adatdemokratizálás fontosságát is.

Adatok elérhetővé tétele mindenkinek

Ahogy az előző leckékben is megtanulta, több forrásból is gyűjthet adatokat az ügyfelektől. Ezek a források közé tartoznak a mikrofelmérések, a Azure-alkalmazás Elemzések által származtatott kihasználtsági adatok, valamint a funkciójelzők, amelyeket az ügyfelek önállóan dönthetnek el az engedélyezés vagy letiltás mellett. Minél több adattal rendelkezik, annál jobbak a döntései, de meg kell oldania ezt az egyre növekvő adatáramlást.

2014-ben Satya Nadella az adatkultúra fontosságáról beszélt egy szervezetben. Azt mondta, hogy a döntéseket nem érzések vagy szubjektív vélemények alapján kell meghozni, hanem adatokkal ellenőrizni őket. Azt is mondta, hogy az adatoknak minden olyan személy számára elérhetővé kell lenniük, akinek szüksége van rá, és könnyen átalakíthatók végrehajtható megállapításokká az adatvezérelt döntések megkönnyítése érdekében.

A szervezetek csak akkor hozhatnak átható adat döntéseket, ha ezek a döntések szilárd, akadálymentes adatplatformon alapulnak. Ez a munka négy területet foglal magában:

  • Adatgyűjtés: Az adatvezérelt döntéshozatal első lépése mindig az adatok használata. Az adatgyűjtés több űrlapot is igénybe vehet: migrálás meglévő adattárakból, adatlétrehozás olyan forrásokból, mint a Azure-alkalmazás Elemzések, vagy más forrásokból történő adatbetöltés.
  • Adatok megosztása: Az összegyűjtött adatoknak mindenki számára elérhetővé kell lenniük, akiknek szükségük van rá, nem csak az adatszakértők számára. A szervezet minden személyének képesnek kell lennie arra, hogy adatokat használjon a döntéseik meghozatalához.
  • Adatok központosítása: A központosított adatplatformok segíthetnek egyszerűsíteni az adatmegosztást és a szabályozást.
  • Adatok szabályozása: Az adatmegosztás nem jelenti azt, hogy minden adatnak mindenki számára elérhetőnek kell lennie. A megosztás előtt győződjön meg arról, hogy a bizalmas adatok védettek, nyomon követhetők és szabályozhatók.

Azure adatplatform

Az Azure platform a teljes adatéletciklust lefedi, amely alapvető fontosságú az adatvezérelt döntéshozatalhoz és az adatdemokratizáláshoz. Az egyszerű, igény szerinti adatbázisoktól a nagy adatraktárakig vagy a rugalmas NoSQL-rendszerekig az Azure-adatplatform lehetővé teszi a négy adattevékenységi terület lefedésére.

Data collection

Az Azure-adatrendszer olyan szolgáltatásokat és eszközöket tartalmaz, mint az adatok migrálása, betöltése, tárolása és elemzése. Az alábbi lista csak néhány olyan mechanizmust mutat be, amelyekkel feldolgozhatja az adatokat, és elérhetővé teheti őket a későbbi megosztáshoz az adatvezérelt döntéshozatal megkönnyítése érdekében:

  • Adatelemzés: Az Azure Synapse Analytics egy nagyvállalati elemzési szolgáltatás, amely felgyorsítja az adatraktárak és a big data rendszerek közötti időtúllépést. Az Azure Synapse Analytics az alábbiak közül a legjobbat hozza össze:
    • A vállalati adattárházakban használt SQL-technológiák.
    • A big data-hoz használt Spark-technológiák.
    • Folyamatok adatintegrációhoz és ETL-hez (kinyeréshez, átalakításhoz, betöltéshez) és ELT-hez (kinyerés, betöltés, átalakítás).
    • Mély integráció más Microsoft-szolgáltatások, például a Power BI, az Azure Cosmos DB és az Azure Machine Tanulás.
  • Adatmigrálás: Előfordulhat, hogy az adatok már meglévő forrásokban tárolódnak, de egy modern platformra kell migrálni, mielőtt végrehajtható megállapításokká alakíthatná őket. Az Azure Database Migration Service olyan eszközöket tartalmaz, amelyek segítenek az olyan rendszerekből történő adatmigrálásban, mint az SQL Server, a PostgreSQL, az Oracle és a MongoDB.
  • Adatfeldolgozás: Az Azure szolgáltatásokkal elemezheti és átalakíthatja az adatfolyamokat az Azure Stream Analyticsszel, és nagy léptékben futtathat ETL-folyamatokat az Azure Data Factoryvel.

Adatmegosztás

A Microsoft Power BI olyan eszközök készlete, amelyek a különálló forrásokból származó adatokat integrált, interaktív vizualizációkba egyesítik. A felhasználók egyszerűen, intuitív vezérlők használatával ismerkedhetnek meg az adatokkal. Az elemzések ereje a szervezet minden tagja számára elérhető, nem csak az adatszakértők számára.

A területtulajdonosok olyan jelentéseket és irányítópultokat hozhatnak létre, amelyek tartalmazzák az alkalmazás bizonyos aspektusaival kapcsolatos releváns információkat. A hipotézis érvényesítéséhez új funkciók bevezetése után az adatok könnyen elérhetők a hipotézis valós ügyfélhasználaton alapuló érvényesítéséhez vagy elutasításához.

A Microsoft Power BI több szempontból is segíthet az adatmegosztásban. Íme néhány példa:

  • Adatok megosztása munkatársakkal és partnerekkel: A Power BI-irányítópultok leegyszerűsítik az adatok használatát. A vizualizációk lehetővé teszik, hogy a nem adatszakértők anélkül részletezhessék az adatokat, hogy tisztában kellene lenniük a mögöttes struktúrával.
  • Gyors adatelemzések létrehozása: A Power BI automatikusan képes az adathalmazok vizualizációinak létrehozására a gyors elemzések funkciójával. Gyorsan létrehozhat irányítópultokat, és olyan adatkorrelációkat kereshet, amelyek elsőre nem feltétlenül voltak nyilvánvalóak.
  • Jelentések beágyazása egy webhelyen vagy portálon: A Power BI-ban nemcsak a natív Power BI-portálon érheti el a vizualizációkat, hanem más webalkalmazásokban is beágyazhat jelentéseket és irányítópultokat. Így a felhasználóknak nem kell elhagyniuk ismerős vállalati webhelyeiket, hogy megtalálják a döntéshozatali folyamatukhoz szükséges adatokat.

Adatközpontosítás

Az adatközpontosítás fő problémája a különböző szinteken történő skálázás. A túlsimítás kockázatával a big data 3 V-jára csökkenthetjük:

  • Kötet: Az Azure Data Lake Storage Gen2 költséghatékony és méretezhető Azure-platform az adattároláshoz. Az Azure Storage által biztosított hatalmas méretezhetőség alapján az Azure Data Lake Storage több petabájtnyi információ kiszolgálására lett tervezve, miközben több száz gigabites átviteli sebességet tart fenn.
  • Változatosság: Ez a kifejezés gyakran arra utal, hogy az adatok nem mindig strukturáltak. Lehet, hogy részben strukturált, sőt strukturálatlan adatokkal is rendelkezik. Az Azure Synapse ezen a területen ragyog, mivel a nagyvállalati adattárházakban használt SQL-technológiák legjobbjait egyesíti a Sparkkal, amelyet gyakran használnak big data-adatokhoz.
  • Sebesség: A régebbi adatarchitektúrákban gyakran előforduló probléma a tárolási kapacitás, az elemzési sebesség és a betöltési sebesség közötti összefüggés. Az Azure-adatmegoldásokban a szervezetek egymástól függetlenül skálázhatják a platform különböző dimenzióit. Az adatok betölthetők, feldolgozhatók és megoszthatók olyan adatfolyamokon keresztül, amelyek a szükséges Azure-adatszolgáltatásokat használják, ahogyan azt a vállalati üzletiintelligencia-architektúra is mutatja.

Adatszabályozás

A mai világban az adatok kritikus értéket és jelentős felelősséget is jelentenek. A tárolt adatok gyakran tartalmaznak bizalmas információkat, amelyek pénzügyi vagy személyes károkat okozhatnak, ha az adatok kiszivárognak vagy nem megfelelően osztják meg őket. Az adatok implicit tárolása és feldolgozása azt jelenti, hogy a szervezet elfogadja ezt a felelősséget. A jogi szabályozás szankciókat vonhat maga után a személyes vagy bizalmas adatokat helytelenül kezelő szervezetek számára.

Ennek következtében az adatszabályozás kritikus fontosságú minden olyan szervezet számára, amelynek célja az adatdemokratizálás. Az adatszabályozás első lépése az adatok besorolása, amelyeket meghatározott módon kell kezelni. A Microsoft például ezeket az adatkategóriákat belsőleg használja az adatbesoroláshoz:

  • Nem üzleti: Személyes életéből származó olyan adatok, amelyek nem tartoznak a Microsofthoz.
  • Nyilvános: Szabadon elérhető és nyilvános használatra jóváhagyott üzleti adatok.
  • Általános: Nem nyilvános közönségnek szánt üzleti adatok.
  • Bizalmas: Olyan üzleti adatok, amelyek árthatnak a Microsoftnak, ha túlterjeszkednek.
  • Szigorúan bizalmas: Olyan üzleti adatok, amelyek túlzott mértékű felosztás esetén jelentős kárt okoznának a Microsoftnak.

Az adatbesorolás utáni következő lépés biztosítja, hogy az egyes adatkategóriák védettek legyenek a jogosulatlan hozzáféréssel. Azure-támogatás ezeket a technológiákat, amelyek a bizalmasságot kényszerítik ki:

  • Inaktív adatok titkosítása: Minden Azure-adat titkosítva van a Microsoft-adatközpontokban való tároláskor. Egyes Azure-szolgáltatások speciális titkosítási funkciókat kínálnak, például transzparens adattitkosítást az Azure Synapse-ben és az Azure SQL Database-ben.
  • Adatok titkosítása repülés közben: Minden Azure-beli adatszolgáltatás TLS/SSL protokollal titkosítja az adatokat, mielőtt a hálózaton keresztül küldené. Egyes szolgáltatások, például az Azure Storage, opcionálisan engedélyezhetik a titkosítatlan forgalmat. A szervezeteknek minden bizalmas adattípus esetében le kell tiltanak minden titkosítatlan kommunikációt.
  • Adathozzáférés-vezérlés: Az Azure kifinomult hitelesítési és engedélyezési mechanizmusokat kínál mind az Azure-platformhoz való hozzáféréshez, mind magához az adatokhoz való hozzáféréshez. Az Azure szerepköralapú hozzáférés-vezérlése, a feltételes hozzáférés és a Privileged Identity Management három példa az alapvető szolgáltatásokra, amelyek segítségével biztosítható, hogy csak az arra jogosult személyek férjenek hozzá a bizalmas információkhoz.
  • Adatnaplózás: Számos jogszabályi megfelelőségi szabvány megköveteli az adatvédelmi mechanizmusok bizonyítékát annak dokumentálásával, hogy ki hajtott végre bizonyos műveleteket és fért hozzá bizonyos adatokhoz. Az Azure SQL Database és az Azure Synapse Analytics naplózásában leírtak szerint az Azure-ban végzett adatnaplózás a naplózás három aspektusát vizsgálja:
    • Őrizze meg a kiválasztott események naplózási nyomvonalát, ahol megadhatja a naplózandó adatműveletek kategóriáit.
    • Jelentés az adatbázis-tevékenységről, igény szerint előre konfigurált jelentésekkel és irányítópultokkal a gyors kezdéshez.
    • Jelentések elemzése gyanús események, szokatlan tevékenységek és trendek feltárásához

Növekedési gondolkodásmód

A tanulás fázisa néha rossz hírt ad. A hipotézisek, amelyek szerint helyes volt, helytelennek bizonyulhatnak. Az alternatív ötletekre való nyitottság kulcsfontosságú ahhoz, hogy az innovációs folyamat zökkenőmentesen haladjon. Lehet, hogy az egész hipotézis hibás volt, vagy talán a probléma csak a prototípus kifejlesztésének módja volt.

Mindenesetre a következtetéseket mindig támogatni kell az adatokkal. A csapatnak tovább kell lépnie a következő hipotézis megfogalmazására, esetleg a kezdeti változat valamilyen változatára vagy iterációjára.

Előfordulhat, hogy a meglévő adatok nem teszik lehetővé, hogy egyértelműen megállapítsa, hogy a hipotézis helyes vagy helytelen volt-e. Ebben az esetben a döntési folyamatot segítő adatkészletet javítani kell. Vagy új telemetriai pontokat vezet be az alkalmazásban, vagy új módszereket talál az ügyfélélményről való információszerzésre.

A növekedési gondolkodásmód ebben a szakaszban alapvető fontosságú. Gondoljon a tévesnek vagy részben hibásnak bizonyult hipotézisekre, mint a tanulási lehetőségekre. A szervezeteknek nem szabad időt pazarolni egy olyan innovációra, amely nem hozza létre a várt üzleti eredményeket.

Hol keresse meg a következőt?

Az felhőadaptálási keretrendszer adatdemokratizálással kapcsolatos dokumentációjában ezen egység számos alapfogalmat is bemutatunk.