INTERAKTIVA HDInsight-frågor

Slutförd

Interaktiva frågor implementeras vanligtvis i ett scenario med kall sökväg, där du har data i tabellformat och snabbt vill ställa frågor och få ett interaktivt svar med SQL-syntax. Följande diagram visar lösningsarkitekturen för alla lösningar för kall HDInsight-sökväg och snabbsökväg och visar hur interaktiva frågor hanteras via Hive LLAP i serveringslagret. Data kan matas in via Hive, interaktiva frågor bearbetas via Hive LLAP och utdata kan hanteras till underordnade program som Power BI.

Interactive Query Solution Architecture

Interaktiv fråga arkitektur

Nu ska vi gå in på arkitekturen för Interaktiv fråga.

Interaktiv fråga användare kan välja mellan olika ODBC- eller JDBC-klienter för att köra frågor mot sina affärsdata, till exempel Data Analytics Studio, Zeppelin Notebooks och Visual Studio Code. När en klient har skickat en HiveQL-fråga kommer frågan till HiveServer, som ansvarar för frågeplanering, optimering och säkerhetstrimning. Hive fungerar genom att dela upp analysuppgifterna mellan distribuerade noder i klustret. Frågor delas upp i underaktiviteter och skickas till noder som bearbetar var och en av underaktiviteterna, och dessa underaktiviteter delas ytterligare, och var och en av dessa uppgifter läser data från det underliggande lagringslagret för affärsdata. Arkitekturen optimeras på grund av dess användning av LLAP-daemoner "always on", som undviker starttider, samt den delade minnesinterna cachen, som lagrar data som har hämtats från lagring och delar data över alla noder.

Hive Architecture

De SSD-enheter (Solid State Drives) som används av Interaktiv fråga kluster kombinerar både RAM-minne och SSD till en jättepool med minne som används av cacheminnet. Med den här kombinationen av resurser kan en typisk serverprofil cachelagras 4 gånger mer data, så att du kan bearbeta större datamängder och stödja fler användare. Den Interaktiv fråga cachen är medveten om de underliggande dataändringarna i fjärrlagringsplatsen (Azure Storage), så om underliggande data ändras och användaren utfärdar en fråga läses uppdaterade data in i minnet utan några ytterligare användarsteg.