Visualiseringstyper

Artikel
03/01/2024

Den här artikeln beskriver de typer av visualiseringar som är tillgängliga att använda i Azure Databricks Notebooks och i Databricks SQL, och visar hur du skapar ett exempel på varje visualiseringstyp.

Stapeldiagram

Stapeldiagram representerar förändringen i mått över tid eller för att visa proportionalitet, liknande ett cirkeldiagram .

Kommentar

Stapeldiagram stöder serverdelsaggregeringar, vilket ger stöd för frågor som returnerar mer än 64 000 rader data utan trunkering av resultatuppsättningen.

Bar chart example

Konfigurationsvärden: För den här stapeldiagramvisualiseringen angavs följande värden:

X-kolumn:
- Datauppsättningskolumn: o_orderdate
- Datumnivå: Months
Y-kolumner:
- Datauppsättningskolumn: o_totalprice
- Sammansättningstyp: Sum
Gruppera efter (datamängdskolumn): o_orderpriority
Stapling: Stack
X-axelnamn (åsidosätt standardvärde): Order month
Y-axelnamn (åsidosätt standardvärde): Total price

Konfigurationsalternativ: Information om konfigurationsalternativ för stapeldiagram finns i konfigurationsalternativ för diagram.

SQL-fråga: För den här stapeldiagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.

select * from samples.tpch.orders

Linjediagram

Linjediagram visar ändringen i ett eller flera mått över tid.

Kommentar

Linjediagram stöder serverdelsaggregeringar, vilket ger stöd för frågor som returnerar mer än 64 000 rader data utan trunkering av resultatuppsättningen.

Line chart example

Konfigurationsvärden: För den här linjediagramvisualiseringen angavs följande värden:

X-kolumn:
- Datauppsättningskolumn: o_orderdate
- Datumnivå: Years
Y-kolumner:
- Datauppsättningskolumn: o_totalprice
- Sammansättningstyp: Average
Gruppera efter (datamängdskolumn): o_orderpriority
X-axelnamn (åsidosätt standardvärde): Order year
Y-axelnamn (åsidosätt standardvärde): Average price

Konfigurationsalternativ: Information om konfigurationsalternativ för linjediagram finns i konfigurationsalternativ för diagram.

SQL-fråga: För den här linjediagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.

select * from samples.tpch.orders

Ytdiagram

Ytdiagram kombinerar linje- och stapeldiagrammet för att visa hur en eller flera gruppers numeriska värden ändras jämfört med förloppet för en andra variabel, vanligtvis tidsvariabeln. De används ofta för att visa ändringar i försäljningstratten genom tid.

Kommentar

Ytdiagram stöder serverdelsaggregeringar, vilket ger stöd för frågor som returnerar mer än 64 000 rader data utan trunkering av resultatuppsättningen.

Area chart example

Konfigurationsvärden: För den här visualiseringen av ytdiagram har följande värden angetts:

X-kolumn:
- Datauppsättningskolumn: o_orderdate
- Datumnivå: Years
Y-kolumner:
- Datauppsättningskolumn: o_totalprice
- Sammansättningstyp: Sum
Gruppera efter (datamängdskolumn): o_orderpriority
Stapling: Stack
X-axelnamn (åsidosätt standardvärde): Order year
Y-axelnamn (åsidosätt standardvärde): Total price

Konfigurationsalternativ: Information om konfigurationsalternativ för ytdiagram finns i konfigurationsalternativ för diagram.

SQL-fråga: För den här ytdiagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.

select * from samples.tpch.orders

Cirkeldiagram

Cirkeldiagram visar proportionalitet mellan mått. De är inte avsedda att förmedla tidsseriedata.

Kommentar

Cirkeldiagram stöder serverdelsaggregeringar, vilket ger stöd för frågor som returnerar mer än 64 000 rader data utan trunkering av resultatuppsättningen.

Pie chart example

Konfigurationsvärden: För den här cirkeldiagramvisualiseringen har följande värden angetts:

X-kolumn (datamängdskolumn): o_orderpriority
Y-kolumner:
- Datauppsättningskolumn: o_totalprice
- Sammansättningstyp: Sum
Etikett (åsidosätt standardvärde): Total price

Konfigurationsalternativ: Information om konfigurationsalternativ för cirkeldiagram finns i konfigurationsalternativ för diagram.

SQL-fråga: För den här cirkeldiagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.

select * from samples.tpch.orders

Histogramdiagram

Ett histogram ritar frekvensen som ett angivet värde inträffar i en datauppsättning. Ett histogram hjälper dig att förstå om en datauppsättning har värden som är grupperade runt ett litet antal intervall eller som är mer utspridda. Ett histogram visas som ett stapeldiagram där du styr antalet distinkta staplar (kallas även lagerplatser).

Kommentar

Histogramdiagram stöder serverdelsaggregeringar, vilket ger stöd för frågor som returnerar mer än 64 000 rader data utan trunkering av resultatuppsättningen.

Histogram chart example

Konfigurationsvärden: För den här histogramdiagramvisualiseringen angavs följande värden:

X-kolumn (datamängdskolumn): o_totalprice
Antal lagerplatser: 20
X-axelnamn (åsidosätt standardvärde): Total price

Konfigurationsalternativ: Information om konfigurationsalternativ för histogramdiagram finns i konfigurationsalternativ för histogramdiagram.

SQL-fråga: För den här histogramdiagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.

select * from samples.tpch.orders

Heatmap-diagram

Med termiska diagram blandas funktioner i stapeldiagram, stapling och bubbeldiagram så att du kan visualisera numeriska data med hjälp av färger. En gemensam färgpalett för en värmekarta visar de högsta värdena med varmare färger, till exempel orange eller rött, och de lägsta värdena med hjälp av svalare färger, som blått eller lila.

Tänk till exempel på följande värmekarta som visualiserar de mest förekommande avstånden för taxiresor varje dag och grupperar resultatet efter veckodagen, avståndet och det totala priset.

Kommentar

Heatmap-diagram stöder serverdelsaggregeringar, vilket ger stöd för frågor som returnerar mer än 64 000 rader data utan trunkering av resultatuppsättningen.

Heatmap example

Konfigurationsvärden: För den här visualiseringen av heatmap-diagram har följande värden angetts:

X-kolumn (datamängdskolumn): o_orderpriority
Y-kolumner (datauppsättningskolumn): o_orderstatus
Färgkolumn:
- Datauppsättningskolumn: o_totalprice
- Sammansättningstyp: Average
X-axelnamn (åsidosätt standardvärde): Order priority
Namn på Y-axel (åsidosätt standardvärde): Order status
Färgschema (åsidosätt standardvärde): YIGnBu

Konfigurationsalternativ: Information om konfigurationsalternativ för värmekarta finns i konfiguationsalternativ för heatmap-diagram.

SQL-fråga: För den här visualiseringen av heatmap-diagrammet användes följande SQL-fråga för att generera datauppsättningen.

select * from samples.tpch.orders

Punktdiagram

Punktvisualiseringar används ofta för att visa relationen mellan två numeriska variabler. Dessutom kan en tredje dimension kodas med färg för att visa hur de numeriska variablerna skiljer sig mellan grupper.

Kommentar

Punktdiagram stöder serverdelsaggregeringar, vilket ger stöd för frågor som returnerar mer än 64 000 rader data utan trunkering av resultatuppsättningen.

Scatter example

Konfigurationsvärden: För den här punktdiagramvisualiseringen angavs följande värden:

X-kolumn (datamängdskolumn): l_quantity
Y-kolumn (datamängdskolumn): l_extendedprice
Gruppera efter (datamängdskolumn): l_returnflag
X-axelnamn (åsidosätt standardvärde): Quantity
Y-axelnamn (åsidosätt standardvärde): Extended price

Konfigurationsalternativ: Information om konfigurationsalternativ för punktdiagram finns i konfigurationsalternativ för diagram.

SQL-fråga: För den här punktdiagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.

select * from samples.tpch.lineitem

Bubbeldiagram

Bubbeldiagram är punktdiagram där storleken på varje punktmarkör återspeglar ett relevant mått.

Kommentar

Bubbeldiagram stöder serverdelsaggregeringar, vilket ger stöd för frågor som returnerar mer än 64 000 rader data utan trunkering av resultatuppsättningen.

Bubble example

Konfigurationsvärden: För den här bubbeldiagramvisualiseringen angavs följande värden:

X (datamängdskolumn): l_quantity
Y-kolumner (datauppsättningskolumn): l_extendedprice
Gruppera efter (datamängdskolumn): l-returnflag
Kolumn för bubbelstorlek (datamängdskolumn): l_tax
Koefficient för bubbelstorlek: 20
X-axelnamn (åsidosätt standardvärde): Quantity
Y-axelnamn (åsidosätt standardvärde): Extended price

Konfigurationsalternativ: Information om konfigurationsalternativ för bubbeldiagram finns i konfigurationsalternativ för diagram.

SQL-fråga: För den här bubbeldiagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.

select * from samples.tpch.lineitem

Rutdiagram

Visualiseringen i rutdiagrammet visar distributionssammanfattningen av numeriska data, eventuellt grupperade efter kategori. Med hjälp av en visualisering av rutor kan du snabbt jämföra värdeintervallen mellan kategorier och visualisera lokalitets-, spridnings- och skevhetsgrupperna för värdena via deras kvarttiler. I varje ruta visar den mörkare linjen mellankvartilområdet. Mer information om hur du tolkar visualiseringar av rutor finns i boxdiagramsartikeln på Wikipedia.

Kommentar

Låddiagram stöder endast aggregering för upp till 64 000 rader. Om en datauppsättning är större än 64 000 rader trunkeras data.

Box chart example

Konfigurationsvärden: För den här visualiseringen av rutdiagram har följande värden angetts:

X-kolumn (datamängdskolumn): l-returnflag
Y-kolumner (datauppsättningskolumn): l_extendedprice
Gruppera efter (datamängdskolumn): l_shipmode
X-axelnamn (åsidosätt standardvärde): Return flag1
Y-axelnamn (åsidosätt standardvärde): Extended price

Konfigurationsalternativ: För konfigurationsalternativ för rutdiagram, se alternativ för rutdiagramkonfiguation.

SQL-fråga: För den här visualiseringen av rutdiagrammet användes följande SQL-fråga för att generera datauppsättningen.

select * from samples.tpch.lineitem

Kombinationsdiagram

Kombinationsdiagram kombinerar linje- och stapeldiagram för att presentera ändringarna över tid med proportionalitet.

Kommentar

Kombinationsdiagram stöder serverdelsaggregeringar, vilket ger stöd för frågor som returnerar mer än 64 000 rader data utan trunkering av resultatuppsättningen.

Combo example

Konfigurationsvärden: För den här kombinationsdiagramvisualiseringen har följande värden angetts:

X-kolumn (datamängdskolumn): l_shipdate
Y-kolumner:
- Första datamängdskolumnen: l_extendedprice
- Sammansättningstyp: medelvärde
- Andra datamängdskolumnen: l_quantity
- Sammansättningstyp: medelvärde
X-axelnamn (åsidosätt standardvärde): Ship date
Vänster Y-axelnamn (åsidosätt standardvärde): Quantity
Höger Y-axelnamn (åsidosätt standardvärde): Average price
Serien:
- Order1 (datauppsättningskolumn): AVG(l_extendedprice)
- Y-axel: höger
- Typ: Rad
- Order2 (datauppsättningskolumn): AVG(l_quantity)
- Y-axel: vänster
- Typ: Stapel

Konfigurationsalternativ: Information om konfigurationsalternativ för kombinationsdiagram finns i konfigurationsalternativ för diagram.

SQL-fråga: För den här kombinationsdiagramvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.

select * from samples.tpch.lineitem

Kohortanalys

En kohortanalys undersöker resultatet av förutbestämda grupper, så kallade kohorter, när de går igenom en uppsättning steg. Kohortvisualiseringen aggregeras endast över datum (det tillåter månatliga aggregeringar). Den utför inte några andra aggregeringar av data i resultatuppsättningen. Alla andra aggregeringar görs i själva frågan.

Cohort example

Konfigurationsvärden: För den här kohortvisualiseringen angavs följande värden:

Datum (bucket) (databaskolumn): cohort_month
Fas (databaskolumn): months
Bucketpopulationsstorlek (databaskolumn): size
Stegvärde (databaskolumn): active
Tidsintervall: monthly

Konfigurationsalternativ: Information om konfigurationsalternativ för kohort finns i configuationsalternativ för kohortdiagram.

SQL-fråga: För den här kohortvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.

-- match each customer with its cohort by month
with cohort_dates as (
  SELECT o_custkey, min(date_trunc('month', o_orderdate)) as cohort_month
  FROM samples.tpch.orders
  GROUP BY 1
),
-- find the size of each cohort
cohort_size as (
  SELECT cohort_month, count(distinct o_custkey) as size
  FROM cohort_dates
  GROUP BY 1
)
-- for each cohort and month thereafter, find the number of active customers
SELECT
  cohort_dates.cohort_month,
  ceil(months_between(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month)) as months,
  count(distinct samples.tpch.orders.o_custkey) as active,
  first(size) as size
FROM samples.tpch.orders
  left join cohort_dates on samples.tpch.orders.o_custkey = cohort_dates.o_custkey
  left join cohort_size on cohort_dates.cohort_month = cohort_size.cohort_month
WHERE datediff(date_trunc('month', samples.tpch.orders.o_orderdate), cohort_dates.cohort_month) != 0
GROUP BY 1, 2
ORDER BY 1, 2

Visning av räknare

Räknare visar ett enda värde på ett framträdande sätt, med ett alternativ för att jämföra dem med ett målvärde. Om du vill använda räknare anger du vilken datarad som ska visas i räknarvisualiseringen för värdekolumnen och målkolumnen.

Kommentar

Räknaren stöder endast sammansättning för upp till 64 000 rader. Om en datauppsättning är större än 64 000 rader trunkeras data.

Counter example

Konfigurationsvärden: För den här räknarvisualiseringen angavs följande värden:

Värdekolumn
- Datauppsättningskolumn: avg(o_totalprice)
- Rad 1:
Målkolumn:
- Datauppsättningskolumn: avg(o_totalprice)
- Rad 2:
Formatera målvärde: Aktivera

SQL-fråga: För den här räknarvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.

select o_orderdate, avg(o_totalprice)
from samples.tpch.orders
GROUP BY 1
ORDER BY 1 DESC

Trattvisualisering

Trattvisualiseringen hjälper till att analysera ändringen i ett mått i olika steg. Om du vill använda tratten anger du en step kolumn och en value kolumn.

Kommentar

Tratten stöder endast sammansättning för upp till 64 000 rader. Om en datauppsättning är större än 64 000 rader trunkeras data.

Funnel example

Konfigurationsvärden: För den här trattvisualiseringen har följande värden angetts:

Stegkolumn (datauppsättningskolumn): o_orderstatus
Värdekolumn (datamängdskolumn): Revenue

SQL-fråga: För den här trattvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.

SELECT o_orderstatus, sum(o_totalprice) as Revenue
FROM samples.tpch.orders
GROUP BY 1

Visualisering av choropleth-karta

I choropleth-visualiseringar färgas geografiska platser, till exempel länder eller stater, enligt aggregerade värden för varje nyckelkolumn. Frågan måste returnera geografiska platser efter namn.

Kommentar

Choropleth-visualiseringar utför inga aggregeringar av data i resultatuppsättningen. Alla sammansättningar måste beräknas i själva frågan.

Map choropleth example

Konfigurationsvärden: För den här choropleth-visualiseringen har följande värden angetts:

Karta (datamängdskolumn): Countries
Geografisk kolumn (datauppsättningskolumn): Nation
Geografisk typ: Kort namn
Värdekolumn (datamängdskolumn): revenue
Klustringsläge: likvärdigt

Konfigurationsalternativ: Information om konfigurationsalternativ för choropleth finns i alternativ för choropleth configuation.

SQL-fråga: För den här choropleth-visualiseringen användes följande SQL-fråga för att generera datauppsättningen.

SELECT
initcap(n_name) as Country,
sum(c_acctbal)
FROM samples.tpch.customer
join samples.tpch.nation where n_nationkey = c_nationkey
GROUP BY 1

Visualisering av markörkarta

I markörvisualiseringar placeras en markör vid en uppsättning koordinater på kartan. Frågeresultatet måste returnera latitud- och longitudpar.

Kommentar

Markören utför inga aggregeringar av data i resultatuppsättningen. Alla sammansättningar måste beräknas i själva frågan.

Map marker example

Det här markörexemplet genereras från en datamängd som innehåller både latitud- och longitudvärden – som inte är tillgängliga i Databricks-exempeldatauppsättningarna. Konfigurationsalternativ för choropleth finns i alternativ för markörkonfiguration.

Visualisering av pivottabell

En pivottabellvisualisering aggregerar poster från ett frågeresultat till en ny tabellvisning. Det liknar PIVOT eller GROUP BY -instruktioner i SQL. Du konfigurerar pivottabellvisualiseringen med dra och släpp-fält.

Kommentar

Pivottabeller stöder serverdelsaggregeringar, vilket ger stöd för frågor som returnerar mer än 64 000 rader data utan trunkering av resultatuppsättningen. Pivottabellen (äldre) stöder dock endast aggregering för upp till 64 000 rader. Om en datauppsättning är större än 64 000 rader trunkeras data.

Exempel på pivottabell

Konfigurationsvärden: För den här pivottabellvisualiseringen angavs följande värden:

Välj rader (datauppsättningskolumn): l_retkurnflag
Välj kolumner (datauppsättningskolumn): l_shipmode
Cell
- Datauppsättningskolumn: l_quantity
- Sammansättningstyp: Summa

SQL-fråga: För den här pivottabellvisualiseringen användes följande SQL-fråga för att generera datauppsättningen.

select * from samples.tpch.lineitem

Sankey

Ett sankey-diagram visualiserar flödet från en uppsättning värden till en annan.

Kommentar

Sankey-visualiseringar utför inga aggregeringar av data i resultatuppsättningen. Alla sammansättningar måste beräknas i själva frågan.

Sankey example

SQL-fråga: För den här Sankey-visualiseringen användes följande SQL-fråga för att generera datauppsättningen.

SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10

Solstrålesekvens

Ett sunburst-diagram hjälper till att visualisera hierarkiska data med hjälp av koncentriska cirklar.

Kommentar

Sunburst-sekvensen utför inga aggregeringar av data i resultatuppsättningen. Alla sammansättningar måste beräknas i själva frågan.

Sunburst example

SQL-fråga: För den här sunburst-visualiseringen användes följande SQL-fråga för att generera datauppsättningen.

SELECT pickup_zip as stage1, dropoff_zip as stage2, sum(fare_amount) as value
FROM samples.nyctaxi.trips
GROUP BY 1, 2
ORDER BY 3 DESC
LIMIT 10

Register

Tabellvisualiseringen visar data i en standardtabell, men med möjlighet att manuellt ordna om, dölja och formatera data. Se Tabellalternativ.

Kommentar

Tabellvisualiseringar utför inga aggregeringar av data i resultatuppsättningen. Alla sammansättningar måste beräknas i själva frågan.

Information om alternativ för tabellkonfiguration finns i Konfigurationsalternativ för tabeller.

Word-moln

Ett ordmoln representerar visuellt hur ofta ett ord förekommer i data.

Kommentar

Word Cloud stöder endast aggregering för upp till 64 000 rader. Om en datauppsättning är större än 64 000 rader trunkeras data.

Word cloud example

Konfigurationsvärden: För det här ordet molnvisualisering har följande värden angetts: test

Ordkolumn (datauppsättningskolumn): o_comment
Ordlängdsgräns: 5
Frekvensgräns: 2

SQL-fråga: För det här ordet molnvisualisering användes följande SQL-fråga för att generera datauppsättningen.

select * from samples.tpch.orders

Visualiseringstyper

Stapeldiagram

Linjediagram

Ytdiagram

Cirkeldiagram

Histogramdiagram

Heatmap-diagram

Punktdiagram

Bubbeldiagram

Rutdiagram

Kombinationsdiagram

Kohortanalys

Visning av räknare

Trattvisualisering

Visualisering av choropleth-karta

Visualisering av markörkarta

Visualisering av pivottabell

Sankey

Solstrålesekvens

Register

Word-moln

Ytterligare resurser