Tabellreferens för fakturerbart användningssystem

Artikel
05/30/2024

Viktigt!

Den här funktionen finns som allmänt tillgänglig förhandsversion.

Den här artikeln innehåller en översikt över tabellen med fakturerbara användningssystem, inklusive schema- och exempelfrågor. Med systemtabeller centraliseras och dirigeras ditt kontos fakturerbara användningsdata till alla regioner, så att du kan visa kontots globala användning från vilken region din arbetsyta befinner sig i.

Schema för fakturerbar användningstabell

Tabellen för fakturerbara användningssystem finns på system.billing.usage och använder följande schema:

Kolumnnamn	Datatyp	beskrivning	Exempel
`record_id`	sträng	Unikt ID för den här posten	`11e22ba4-87b9-4cc2-9770-d10b894b7118`
`account_id`	sträng	ID för kontot som den här rapporten genererades för	`23e22ba4-87b9-4cc2-9770-d10b894b7118`
`workspace_id`	sträng	ID för arbetsytan som den här användningen var associerad med	`1234567890123456`
`sku_name`	sträng	SKU:ns namn	`STANDARD_ALL_PURPOSE_COMPUTE`
`cloud`	sträng	Moln som den här användningen är relevant för. Möjliga värden är `AWS`, `AZURE`och `GCP`.	`AWS`, `AZURE` eller `GCP`
`usage_start_time`	timestamp	Starttiden som är relevant för den här användningsposten	`2023-01-09 10:00:00.000`
`usage_end_time`	timestamp	Den sluttid som är relevant för den här användningsposten	`2023-01-09 11:00:00.000`
`usage_date`	datum	Datum för användningsposten, det här fältet kan användas för snabbare aggregering efter datum	`2023-01-01`
`custom_tags`	map	Taggar som används av användarna för den här användningen	`{ “env”: “production” }`
`usage_unit`	sträng	Enhet som den här användningen mäts i. Möjliga värden är DPU:er.	`DBU`
`usage_quantity`	decimal	Antal enheter som förbrukas för den här posten.	`259.2958`
`usage_metadata`	Struct	Metadata som tillhandahålls av systemet om användningen, inklusive ID:t för beräkningsresurser och jobb (om tillämpligt). Se Analysera användningsmetadata.	`{cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null}`
`identity_metadata`	Struct	Metadata som tillhandahålls av systemet om de identiteter som ingår i användningen. Se Analysera identitetsmetadata.	`{run_as: example@email.com}`
`record_type`	sträng	Om posten är en korrigering. Möjliga värden är `ORIGINAL`, `RETRACTION`och `RESTATEMENT`.	`ORIGINAL`
`ingestion_date`	datum	Datum då posten matades in i `usage` tabellen.	`2024-01-01`
`billing_origin_product`	sträng	Den produkt som har sitt ursprung i användningen. Vissa produkter kan faktureras som olika SKU:er. Möjliga värden finns i Visa information om produkten som är associerad med användningen.	`JOBS`
`product_features`	Struct	Information om de specifika produktfunktioner som används.	Möjliga värden finns i Produktfunktioner.
`usage_type`	sträng	Den typ av användning som tillskrivs produkten eller arbetsbelastningen i faktureringssyfte. Möjliga värden är `COMPUTE_TIME`, `COMPUTE_SLOT`, `STORAGE_SPACE`, `NETWORK_BYTES`, `API_CALLS`, `TOKEN`eller `GPU_TIME`.	`STORAGE_SPACE`

Analysera användningsmetadata

Värdena i usage_metadata berättar om de resurser som ingår i användningsposten.

Värde	Datatyp	beskrivning
`cluster_id`	`string`	ID för klustret som är associerat med användningsposten
`instance_pool_id`	`string`	ID för instanspoolen som är associerad med användningsposten
`node_type`	`string`	Instanstypen för beräkningsresursen
`job_id`	`string`	ID för jobbet som är associerat med användningsposten
`job_run_id`	`string`	ID för jobbkörningen som är associerad med användningsposten
`notebook_id`	`string`	ID för notebook-filen som är associerad med användningen. Returnerar endast ett värde för serverlös beräkning för notebook-användning, annars returneras `NULL`.
`dlt_pipeline_id`	`string`	ID för Delta Live Tables-pipelinen som är associerad med användningsposten

Kommentar

I sällsynta fall job_run_id fylls inte i för långvariga jobb vars beräkning började köras innan Azure Databricks började samla job_run_id in metadata. Starta om jobbets beräkning för att börja spela in job_run_id.

Hitta ett jobb eller en anteckningsbok i användargränssnittet med hjälp av job_id eller notebook_id

De här anvisningarna förklarar hur du hämtar ett visst jobb eller en anteckningsbok i användargränssnittet baserat på dess ID.

Så här hittar du ett jobb i användargränssnittet baserat på dess job_id:

job_id Kopiera från användningsposten. Anta i det här exemplet att ID:t är 700809544510906.
Gå till arbetsflödesgränssnittet på samma Azure Databricks-arbetsyta som jobbet.
Kontrollera att filtret Endast jobb som ägs av mig är avmarkerat.
Klistra in ID :t (700809544510906) i sökfältet Filterjobb.

Om du vill hitta en notebook-fil i användargränssnittet baserat på dess notebook_idanvänder du följande instruktioner:

notebook_id Kopiera från användningsposten. Anta i det här exemplet att ID:t är 700809544510906.
Gå till arbetsytegränssnittet på samma Azure Databricks-arbetsyta som notebook-filen.
klicka på en anteckningsbok som du ser.
När du har öppnat anteckningsboken granskar du URL:en i webbläsarens adressfält. Det bör se ut som https://<account-console-url>/?o=<workspace ID>#notebook/<notebook ID>/command/<command ID>.
I webbläsarens adressfält ersätter du notebook-ID:t med det ID som du kopierade i det första steget och tar sedan bort allt efter notebook-ID:t. Det bör se ut som https://<account-console-url>/?o=<workspace ID>#notebook/700809544510906.
När du har hämtat anteckningsboken kan du klicka på knappen Dela för att visa anteckningsbokens ägare.

Analysera identitetsmetadata

Kolumnen identity_metadata kan hjälpa dig att identifiera vem som ansvarar för en serverlös faktureringspost. Kolumnen innehåller ett run_as värde som tillskriver användningen till en identitet. Identiteten som registreras i identity_metadata.run_as beror på vilken produkt som är associerad med användningen.

Referera till följande tabell för beteendet identity_metadata.run_as :

Typ av arbetsbelastning	Identitet för `run_as`
Serverlös beräkning för arbetsflöden	Användaren eller tjänstens huvudnamn som definierats i körningen som inställning. Som standard körs jobb som identitet för jobbägaren, men administratörer kan ändra detta till en annan användare eller tjänstens huvudnamn.
Serverlös beräkning för notebook-filer	Användaren som körde notebook-kommandona (specifikt användaren som skapade notebook-sessionen). För delade notebook-filer inkluderar detta användning av andra användare som delar samma notebook-session.

Visa information om produkten som är associerad med användningen

Vissa Databricks-produkter faktureras under samma delade SKU. För att hjälpa dig att särskilja användningen ger kolumnerna billing_origin_product och product_features mer insikt i den specifika produkten och de funktioner som är associerade med användningen.

Kolumnen billing_origin_product visar den Databricks-produkt som är associerad med användningsposten. Värdena omfattar:

JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
MANAGED_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES

Kolumnen product_features är ett objekt som innehåller information om de specifika produktfunktioner som används och innehåller följande nyckel/värde-par:

jobs_tier: värden inkluderar LIGHT, CLASSIC, eller null
sql_tier: värden inkluderar CLASSIC, PRO, eller null
dlt_tier: värden inkluderar CORE, PRO, ADVANCED, eller null
is_serverless: värden inkluderar true eller false, eller null
is_photon: värden inkluderar true eller false, eller null
serving_type: värden inkluderar MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATUREeller null

Serverlös beräkningsanvändning

Strategier för att analysera serverlös användning finns i Övervaka kostnaden för serverlös beräkning.

Exempelfrågor

Du kan använda följande exempelfrågor för att besvara vanliga frågor om fakturerbar användning:

Vilken är den dagliga trenden i DBU-förbrukning?
Hur många DPU:er för varje SKU har använts under hela den här månaden?
Hur mycket av varje SKU använde en arbetsyta den 1 juni?
Vilka jobb förbrukade flest DPU:er?
Hur mycket användning kan tillskrivas resurser med en viss tagg?
Visa mig de SKU:er där användningen växer
Vad är användningstrenden för All Purpose Compute (Photon)?
Vad är DBU-förbrukningen för en materialiserad vy eller en strömmande tabell?

Vilken är den dagliga trenden i DBU-förbrukning?

SELECT usage_date as `Date`, sum(usage_quantity) as `DBUs Consumed`
  FROM system.billing.usage
WHERE sku_name = "STANDARD_ALL_PURPOSE_COMPUTE"
GROUP BY usage_date
ORDER BY usage_date ASC

Hur många DPU:er för varje SKU har använts under hela den här månaden?

SELECT sku_name, usage_date, sum(usage_quantity) as `DBUs`
    FROM system.billing.usage
WHERE
    month(usage_date) = month(NOW())
    AND year(usage_date) = year(NOW())
GROUP BY sku_name, usage_date

Hur mycket av varje SKU använde en arbetsyta den 1 juni?

Se till att ersätta workspace_id med ditt faktiska arbetsyte-ID.

SELECT sku_name, sum(usage_quantity) as `DBUs consumed`
FROM system.billing.usage
WHERE workspace_id = 1234567890123456
AND usage_date = "2023-06-01"
GROUP BY sku_name

Kommentar

Den här frågan returnerar en rad per unikt SKU-ID som används på arbetsytan på det valda datumet.

Vilka jobb förbrukade flest DPU:er?

SELECT usage_metadata.job_id as `Job ID`, sum(usage_quantity) as `DBUs`
FROM system.billing.usage
WHERE usage_metadata.job_id IS NOT NULL
GROUP BY `Job ID`
ORDER BY `DBUs` DESC

Hur mycket användning kan tillskrivas resurser med en specifik tagg?

Du kan dela upp kostnader på olika sätt. Det här exemplet visar hur du delar upp kostnader med en anpassad tagg. Se till att ersätta den anpassade taggens nyckel och värde i frågan.

SELECT sku_name, usage_unit, SUM(usage_quantity) as `DBUs consumed`
FROM system.billing.usage
WHERE custom_tags.{{key}} = "{{value}}"
GROUP BY 1, 2

Visa mig de SKU:er där användningen växer

SELECT after.sku_name, before_dbus, after_dbus, ((after_dbus - before_dbus)/before_dbus * 100) AS growth_rate
FROM
(SELECT sku_name, sum(usage_quantity) as before_dbus
    FROM system.billing.usage
WHERE usage_date BETWEEN "2023-04-01" and "2023-04-30"
GROUP BY sku_name) as before
JOIN
(SELECT sku_name, sum(usage_quantity) as after_dbus
    FROM system.billing.usage
WHERE usage_date BETWEEN "2023-05-01" and "2023-05-30"
GROUP BY sku_name) as after
where before.sku_name = after.sku_name
SORT by growth_rate DESC

Vad är användningstrenden för All Purpose Compute (Photon)?

SELECT sku_name, usage_date, sum(usage_quantity) as `DBUs consumed`
    FROM system.billing.usage
WHERE year(usage_date) = year(CURRENT_DATE)
AND sku_name = "ENTERPRISE_ALL_PURPOSE_COMPUTE_(PHOTON)"
AND usage_date > "2023-04-15"
GROUP BY sku_name, usage_date

Vad är DBU-förbrukningen för en materialiserad vy eller en strömmande tabell?

För att fastställa DBU-användning och SKU för en specifik materialiserad vy eller strömningstabell behöver du det associerade pipeline-ID:t (dlt_pipeline_id). Leta upp pipeline-ID:t på fliken Information när du visar relevant materialiserad vy eller strömningstabell i Katalogutforskaren.

SELECT
  sku_name,
  usage_date,
  SUM(usage_quantity) AS `DBUs`
FROM
  system.billing.usage
WHERE
  usage_metadata.dlt_pipeline_id = "113739b7-3f45-4a88-b6d9-e97051e773b9"
  AND usage_start_time > "2023-05-30"
GROUP BY
  ALL

Dela via