Elosztott számítástechnika a felhőben: GraphLab
A GraphLab a Carnegie Mellon Egyetem által az adatbányászat támogatására kifejlesztett big data-eszköz. Megismerheti a GraphLab működését és hasznát.
Tanulási célkitűzések
Ebben a modulban a következőkről lesz szó:
- A GraphLab egyedi jellemzői és az általa megcélzott alkalmazástípusok leírása
- A gráfalapú párhuzamos és elosztott programozási keretrendszerek jellemzői
- A GraphLab-motor három fő összetevője
- A GraphLab végrehajtási motorja által érintett lépések leírása
- A GraphLab architekturális modelljének ismertetése
- A GraphLab ütemezési stratégiája
- A GraphLab programozási modelljének ismertetése
- A GraphLab konzisztencia-szintjeinek felsorolása és magyarázata
- A GraphLab memóriabeli adatelhelyezési stratégiája, és annak a bizonyos gráftípusok esetében a teljesítményre gyakorolt hatása
- A GraphLab számítási modelljének bemutatása
- A GraphLab hibatűrési mechanizmusainak ismertetése
- A GraphLab-programok végrehajtása során érintett lépések azonosítása
- A MapReduce, a Spark és a GraphLab hasonlóságainak és különbségeinek kiemelése azok programozási, számítási, párhuzamossági, architekturális és ütemezési modelljeinek szempontjából
- A megfelelő elemzési motor kiválasztása egy alkalmazás jellemzői alapján
Partnereink: Dr. Majd Sakr és a Carnegie Mellon University.
Előfeltételek
- A felhőalapú számítástechnika, a felhőszolgáltatás-modellek és felhőszolgáltatók fogalmának ismerete
- A felhőalapú számítást lehetővé tevő technológiák megismerése
- Megtudhatja, hogy a felhőszolgáltatók hogyan fizetnek és számláznak a felhőhasználatért
- Megtudhatja, mik azok az adatközpontok, és hogy mire valók
- Megtudhatja, hogyan lehet az adatközpontokat beállítani, üzemeltetni és kiépíteni
- Megtudhatja, hogyan lehet a felhőerőforrásokat kiépíteni és mérni
- A virtualizálás fogalmának ismerete
- A különböző virtualizációs típusok ismerete
- A CPU-virtualizálás ismerete
- A memória virtualizálásának ismerete
- Az I/O-virtualizálás ismerete
- A különböző adattípusok és azok tárolásának ismerete
- Az elosztott fájlrendszerek és azok működésének ismerete
- A NoSQL-adatbázisok, az objektumtárolás és ezek működésének ismerete
- Annak ismerete, hogy mit jelent az elosztott programozás, illetve hogy miért hasznos a felhőben
- A MapReduce és az általa lehetővé tett big data jellegű számítások ismerete
- A Spark és a MapReduce különbségeinek ismerete