Elosztott számítástechnika a felhőben: GraphLab

Kezdő
Developer
Student
Azure

A GraphLab a Carnegie Mellon Egyetem által az adatbányászat támogatására kifejlesztett big data-eszköz. Megismerheti a GraphLab működését és hasznát.

Tanulási célkitűzések

Ebben a modulban a következőkről lesz szó:

  • A GraphLab egyedi jellemzői és az általa megcélzott alkalmazástípusok leírása
  • A gráfalapú párhuzamos és elosztott programozási keretrendszerek jellemzői
  • A GraphLab-motor három fő összetevője
  • A GraphLab végrehajtási motorja által érintett lépések leírása
  • A GraphLab architekturális modelljének ismertetése
  • A GraphLab ütemezési stratégiája
  • A GraphLab programozási modelljének ismertetése
  • A GraphLab konzisztencia-szintjeinek felsorolása és magyarázata
  • A GraphLab memóriabeli adatelhelyezési stratégiája, és annak a bizonyos gráftípusok esetében a teljesítményre gyakorolt hatása
  • A GraphLab számítási modelljének bemutatása
  • A GraphLab hibatűrési mechanizmusainak ismertetése
  • A GraphLab-programok végrehajtása során érintett lépések azonosítása
  • A MapReduce, a Spark és a GraphLab hasonlóságainak és különbségeinek kiemelése azok programozási, számítási, párhuzamossági, architekturális és ütemezési modelljeinek szempontjából
  • A megfelelő elemzési motor kiválasztása egy alkalmazás jellemzői alapján

Partnereink: Dr. Majd Sakr és a Carnegie Mellon University.

Előfeltételek

  • A felhőalapú számítástechnika, a felhőszolgáltatás-modellek és felhőszolgáltatók fogalmának ismerete
  • A felhőalapú számítást lehetővé tevő technológiák megismerése
  • Megtudhatja, hogy a felhőszolgáltatók hogyan fizetnek és számláznak a felhőhasználatért
  • Megtudhatja, mik azok az adatközpontok, és hogy mire valók
  • Megtudhatja, hogyan lehet az adatközpontokat beállítani, üzemeltetni és kiépíteni
  • Megtudhatja, hogyan lehet a felhőerőforrásokat kiépíteni és mérni
  • A virtualizálás fogalmának ismerete
  • A különböző virtualizációs típusok ismerete
  • A CPU-virtualizálás ismerete
  • A memória virtualizálásának ismerete
  • Az I/O-virtualizálás ismerete
  • A különböző adattípusok és azok tárolásának ismerete
  • Az elosztott fájlrendszerek és azok működésének ismerete
  • A NoSQL-adatbázisok, az objektumtárolás és ezek működésének ismerete
  • Annak ismerete, hogy mit jelent az elosztott programozás, illetve hogy miért hasznos a felhőben
  • A MapReduce és az általa lehetővé tett big data jellegű számítások ismerete
  • A Spark és a MapReduce különbségeinek ismerete