Snelstart: Een query uitvoeren en visualiseren

In deze quickstart ziet u hoe u een query uitvoert op een tabel met personen om het aantal vrouwen met de naam gegroepeerd op geboortejaar te vinden en het Mary resultaat te visualiseren.

De kolommen van de tabel zijn id , , , , , , , en firstNamemiddleNamelastNamegenderbirthDatessnsalary .

In dit artikel wordt beschreven hoe u de Databricks SQL-gebruikersinterface en de BI-hulpprogramma's Power BI en Tableau Online gebruikt om dezelfde query uit te voeren.

Vereisten

Uw Databricks SQL beheerder moet de quickstart voor Databricks-SQL-beheerders voltooien voordat u de stappen in de volgende secties voltooit.

Een query uitvoeren op een tabel en een visualisatie maken met behulp van de Databricks SQL UI

De zijbalk gebruiken

U hebt toegang tot al uw Azure Databricks via de zijbalk. De inhoud van de zijbalk is afhankelijk van de geselecteerde persona: Data Science Engineering,Machine Learningof SQL.

  • De zijbalk wordt standaard samengevouwen weergegeven en alleen de pictogrammen zijn zichtbaar. Beweeg de cursor over de zijbalk om uit te vouwen naar de volledige weergave.

  • Als u de persona wilt wijzigen, klikt u op het pictogram onder het Databricks-logo Databricks-logoen selecteert u een persona.

    persona wijzigen

  • Als u een persona zo wilt vastmaken dat deze de volgende keer dat u zich aanmeldt wordt weergegeven, klikt u op Persona vastmaken naast de persona. Klik er nogmaals op om de pincode te verwijderen.

  • Gebruik Menuopties aan de onderkant van de zijbalk om de zijbalkmodus in te stellen op Automatisch (standaardgedrag), Vouwuit of Vouw samen.

Overschakelen naar een andere werkruimte

Als u toegang hebt tot meer dan één werkruimte in hetzelfde account, kunt u er snel tussen schakelen.

  1. Klik op Accountpictogram in de linkerbenedenhoek van Azure Databricks werkruimte.
  2. Selecteer onder Werkruimteneen werkruimte om naar deze werkruimte over te schakelen.

Stap 1: meld u aan bij Databricks SQL

Wanneer u zich aanmeldt bij Databricks SQL uw landingspagina er als volgende uit:

Landingspagina van gebruiker

Als de Databricks Data Science Engineering- of Databricks Machine Learning-omgeving wordt weergegeven, gebruikt u de zijbalk om over te schakelen naar & Databricks SQL. &

Stap 2: Een query uitvoeren op de tabel people

In Quickstart: Een gebruiker instellen om een query uit te voeren op een tabel, heeft een beheerder een tabel met de naam gemaakt. In deze sectie gaat u een query uitvoeren op deze tabel voor de verjaardagen en geboortejaren van alle personen met de naam Mary.

  1. Klik op Pictogram makenMaken in de zijbalk en selecteer Query uitvoeren.

    De SQL-editor wordt weergegeven.

  2. Klik in het vak onder Nieuwe queryop het pictogram pijl-omlaag en selecteer Starter-eindpunt.

    De eerste keer dat u een query maakt, wordt de lijst met beschikbare SQL in alfabetische volgorde weergegeven. De volgende keer dat u een query maakt, wordt het laatst gebruikte eindpunt geselecteerd.

  3. Klik in het vak onder het eindpunt op het pictogram Pijl-omlaag en selecteer de standaarddatabase als deze optie niet is geselecteerd.

    Standaarddatabase

  4. Plak een -instructie die het aantal vrouwen met de SELECT naam Mary opvraagt:

     SELECT year(birthDate) as birthYear, count(*) AS total
     FROM default.people10m
     WHERE firstName = 'Mary' AND gender = 'F'
     GROUP BY birthYear
     ORDER BY birthYear
    
  5. Druk op Ctrl/Cmd + Enter of klik op de knop Uitvoeren.

    Het selectievakje Limiet 1000 is standaard ingeschakeld om ervoor te zorgen dat de query maximaal 1000 rijen retourneert. Als u meer rijen wilt, kunt u het selectievakje uitschakelen en een LIMIT component in uw query opgeven. Het queryresultaat wordt weergegeven op het tabblad Tabel.

    Queryresultaat

Stap 3: Een visualisatie maken

  1. Klik op het tabblad + Visualisatie toevoegen.

    De visualisatie-editor wordt weergegeven.

    Visualisatie-editor

  2. Selecteer geboorteJaar in de vervolgkeuzekeuze vervolgkeuzekeuze selecteren X-kolom.

  3. Selecteer totaal in de vervolgkeuze selecterenvoor de kolom Y.

  4. Klik op het tabblad X-as.

  5. Voer in het veld NaamBirth Year in.

  6. Klik op het tabblad Y-as.

  7. Voer in het veld NaamNumber of Marys by Birth Year in.

  8. Klik op Opslaan.

    De opgeslagen grafiek wordt weergegeven in SQL editor.

    Marys SQLA-grafiek

Stap 4: Een dashboard maken

  1. Klik op Pictogram makenMaken in de zijbalk en selecteer Dashboard.

  2. Voer People in.

  3. Klik op Opslaan.

  4. Klik rechtsonder op de knop Widget toevoegen.

  5. Selecteer Marys.

  6. Klik op Toevoegen aan dashboard.

  7. Klik op Klaar met bewerken.

    Dashboard voltooien

Volgende stappen

  • Bekijk een aantal voorbeelddashboards die op een van de volgende punten een beginpunt bieden voor uitgebreide visualisaties en een gebruiksbare indeling:
    • Klik onder aan de pagina Dashboards op Galerie weergeven.
    • Ga naar https://<databricks-instance>/sql/dashboards/samples en vervang uw door de naam van Azure Databricks <databricks-instance>https://<databricks-instance>/sql/dashboards/samplesbijvoorbeeld adb-1234567890123456.7.azuredatabricks.net .
  • Een query uitvoeren op een tabel en een visualisatie maken met behulp van algemene BI-hulpprogramma's.

Een query uitvoeren op een tabel en een visualisatie maken met bi-hulpprogramma's die zijn verbonden met Databricks SQL

In deze sectie ziet u hoe u Databricks SQL-gegevens verzamelt, Power BI Desktop en Tableau Online verbindt met Databricks SQL, en in elk BI-hulpprogramma een query uitvoert op een tabel met personen en de gegevens visualiseert.

In deze sectie:

Databricks SQL

In deze sectie wordt beschreven hoe u verbindingsgegevens voor eindpunten verzamelt en een token genereert dat u gebruikt om uw hulpprogramma te verifiëren bij Databricks SQL.

Stap 1: verbindingsgegevens SQL eindpunt

  1. Meld u aan bij Databricks SQL.

  2. Klik op het pictogram EindpuntenSQLeindpunten in de zijbalk.

  3. Typ in de lijst Eindpunten Starter in het filtervak.

  4. Klik op de koppeling Starter-eindpunt.

  5. Klik op het tabblad Verbindingsdetails.

    Verbindingsdetails

  6. Klik op het pictogram Kopiëren om de Hostnaam en het HTTP-pad van de server te kopiëren.

Stap 2: een persoonlijk toegangsteken krijgen

Het persoonlijke toegangs token verifieert u bij Databricks SQL.

  1. Klik op Instellingen pictogramInstellingen onder aan de zijbalk en selecteer Instellingen.
  2. Klik op het tabblad Persoonlijke toegangstokens.
  3. Klik op + Nieuw token genereren.
  4. Voer eventueel een opmerking in en wijzig de levensduur van het token.
  5. Klik op Genereren.
  6. Klik op Kopieerpictogram om het token te kopiëren en klik op OK.

Power BI

Stap 1: configureer de verbinding van Power BI naar Databricks SQL

  1. Selecteer Gegevens meer... > Azure en selecteer de >

    Databricks-connector in gegevenslijst op halen

  2. Klik op Verbinden.

  3. Voer de serverhostnaam en het HTTP-pad in die u hebt gekopieerd in Stap 1: verbindingsgegevens SQL eindpunt op te halen.

    Power BI gegevensbron

  4. Klik op OK.

  5. Selecteer bij de verificatieprompt het tabblad Token voor persoonlijke toegang. Voer het persoonlijke toegangsteken in dat u hebt gekopieerd in Stap 2: een persoonlijk toegangsteken op te halen.

  6. Klik op Verbinden.

    Als het SQL eindpunt niet wordt uitgevoerd, wordt het starten, maar kan het enkele minuten duren voordat het beschikbaar is.

  7. Selecteer in Power BI Navigator de default.people10m tabel.

  8. Klik op Laden.

Stap 2: de gegevens vormgeven

Retourneert de records van vrouwen met de voornaam Mary en berekent het aantal Mary's in elk jaar.

  1. Verwijder alle kolommen behalve firstName , gender en birthDate .
  2. Filter de gegevens met firstName = Mary en gender = F .
  3. Wijzig het type van birthDate in en verwijder alle Date datumonderdelen behalve jaar.
  4. Groepeert op jaar om het aantal Mary's per jaar te tellen.

Marys Power BI tabel

Stap 3: de gegevens visualiseren

Marys Power BI grafiek

Tableau Online

Stap 1: configureer de verbinding van Tableau Online naar Databricks SQL

  1. Open in Tableau Online een werkmap of maak een nieuwe werkmap.

  2. Selecteer Nieuwe gegevensbron.

    Tableau Online-gegevensbron

  3. Selecteer in Verbinding maken dialoogvenster Gegevens de optie Connectors Databricks.

    Tableau Online Databricks

  4. Voer in het dialoogvenster Databricks-verbinding de serverhostnaam en het HTTP-pad in die u hebt gekopieerd in stap 1: verbindingsgegevens SQLeindpunt op te halen.

    Tableau-gegevensbron

  5. Verifieren token met behulp van als de gebruikersnaam en het token uit stap token als wachtwoord krijgen.

  6. Klik op Aanmelden.

    Als het SQL eindpunt niet wordt uitgevoerd, wordt het starten, maar kan het enkele minuten duren voordat het beschikbaar is.

  7. Voer in het veld Schema default in. Druk op Enter.

  8. Selecteer in de vervolgkeuzeop de optie Schema selecteren.

  9. Voer in het veld Tabel people10m in. Druk op Enter.

  10. Sleep de people10 tabel naar het canvas.

Stap 2: de gegevens vormgeven

Retourneert de records van vrouwen met de voornaam Mary en berekent het aantal Mary's in elk jaar.

  1. Verwijder alle kolommen behalve firstName , gender en birthDate .
  2. Filter de gegevens met firstName = Mary en gender = F .
  3. Wijzig het type van birthDate in en verwijder alle Date datumonderdelen behalve jaar.
  4. Groepeert op jaar om het aantal Mary's per jaar te tellen.

Tabel Marys Tableau

Stap 3: de gegevens visualiseren

Visualiseren als een staafdiagram:

Marys Tableau-grafiek