Dela via


Tabellreferens för fakturerbart användningssystem

Viktigt!

Den här funktionen finns som allmänt tillgänglig förhandsversion.

Den här artikeln innehåller en översikt över tabellen med fakturerbara användningssystem, inklusive schema- och exempelfrågor. Med systemtabeller centraliseras och dirigeras ditt kontos fakturerbara användningsdata till alla regioner, så att du kan visa kontots globala användning från vilken region din arbetsyta befinner sig i.

Schema för fakturerbar användningstabell

Tabellen för fakturerbara användningssystem finns på system.billing.usage och använder följande schema:

Kolumnnamn Datatyp beskrivning Exempel
record_id sträng Unikt ID för den här posten 11e22ba4-87b9-4cc2-9770-d10b894b7118
account_id sträng ID för kontot som den här rapporten genererades för 23e22ba4-87b9-4cc2-9770-d10b894b7118
workspace_id sträng ID för arbetsytan som den här användningen var associerad med 1234567890123456
sku_name sträng SKU:ns namn STANDARD_ALL_PURPOSE_COMPUTE
cloud sträng Moln som den här användningen är relevant för. Möjliga värden är AWS, AZUREoch GCP. AWS, AZURE eller GCP
usage_start_time timestamp Starttiden som är relevant för den här användningsposten 2023-01-09 10:00:00.000
usage_end_time timestamp Den sluttid som är relevant för den här användningsposten 2023-01-09 11:00:00.000
usage_date datum Datum för användningsposten, det här fältet kan användas för snabbare aggregering efter datum 2023-01-01
custom_tags map Taggar som används av användarna för den här användningen { “env”: “production” }
usage_unit sträng Enhet som den här användningen mäts i. Möjliga värden är DPU:er. DBU
usage_quantity decimal Antal enheter som förbrukas för den här posten. 259.2958
usage_metadata Struct Metadata som tillhandahålls av systemet om användningen, inklusive ID:t för beräkningsresurser och jobb (om tillämpligt). Se Analysera användningsmetadata. {cluster_id: null; instance_pool_id: null; notebook_id: null; job_id: null; node_type: null}
identity_metadata Struct Metadata som tillhandahålls av systemet om de identiteter som ingår i användningen. Se Analysera identitetsmetadata. {run_as: example@email.com}
record_type sträng Om posten är en korrigering. Möjliga värden är ORIGINAL, RETRACTIONoch RESTATEMENT. ORIGINAL
ingestion_date datum Datum då posten matades in i usage tabellen. 2024-01-01
billing_origin_product sträng Den produkt som har sitt ursprung i användningen. Vissa produkter kan faktureras som olika SKU:er. Möjliga värden finns i Visa information om produkten som är associerad med användningen. JOBS
product_features Struct Information om de specifika produktfunktioner som används. Möjliga värden finns i Produktfunktioner.
usage_type sträng Den typ av användning som tillskrivs produkten eller arbetsbelastningen i faktureringssyfte. Möjliga värden är COMPUTE_TIME, COMPUTE_SLOT, STORAGE_SPACE, NETWORK_BYTES, API_CALLS, TOKENeller GPU_TIME. STORAGE_SPACE

Analysera användningsmetadata

Värdena i usage_metadata berättar om de resurser som ingår i användningsposten.

Värde Datatyp beskrivning
cluster_id string ID för klustret som är associerat med användningsposten
instance_pool_id string ID för instanspoolen som är associerad med användningsposten
node_type string Instanstypen för beräkningsresursen
job_id string ID för jobbet som är associerat med användningsposten
job_run_id string ID för jobbkörningen som är associerad med användningsposten
notebook_id string ID för notebook-filen som är associerad med användningen. Returnerar endast ett värde för serverlös beräkning för notebook-användning, annars returneras NULL.
dlt_pipeline_id string ID för Delta Live Tables-pipelinen som är associerad med användningsposten

Kommentar

I sällsynta fall job_run_id fylls inte i för långvariga jobb vars beräkning började köras innan Azure Databricks började samla job_run_id in metadata. Starta om jobbets beräkning för att börja spela in job_run_id.

Hitta ett jobb eller en anteckningsbok i användargränssnittet med hjälp av job_id eller notebook_id

De här anvisningarna förklarar hur du hämtar ett visst jobb eller en anteckningsbok i användargränssnittet baserat på dess ID.

Så här hittar du ett jobb i användargränssnittet baserat på dess job_id:

  1. job_id Kopiera från användningsposten. Anta i det här exemplet att ID:t är 700809544510906.
  2. Gå till arbetsflödesgränssnittet på samma Azure Databricks-arbetsyta som jobbet.
  3. Kontrollera att filtret Endast jobb som ägs av mig är avmarkerat.
  4. Klistra in ID :t (700809544510906) i sökfältet Filterjobb.

Om du vill hitta en notebook-fil i användargränssnittet baserat på dess notebook_idanvänder du följande instruktioner:

  1. notebook_id Kopiera från användningsposten. Anta i det här exemplet att ID:t är 700809544510906.
  2. Gå till arbetsytegränssnittet på samma Azure Databricks-arbetsyta som notebook-filen.
  3. klicka på en anteckningsbok som du ser.
  4. När du har öppnat anteckningsboken granskar du URL:en i webbläsarens adressfält. Det bör se ut som https://<account-console-url>/?o=<workspace ID>#notebook/<notebook ID>/command/<command ID>.
  5. I webbläsarens adressfält ersätter du notebook-ID:t med det ID som du kopierade i det första steget och tar sedan bort allt efter notebook-ID:t. Det bör se ut som https://<account-console-url>/?o=<workspace ID>#notebook/700809544510906.
  6. När du har hämtat anteckningsboken kan du klicka på knappen Dela för att visa anteckningsbokens ägare.

Analysera identitetsmetadata

Kolumnen identity_metadata kan hjälpa dig att identifiera vem som ansvarar för en serverlös faktureringspost. Kolumnen innehåller ett run_as värde som tillskriver användningen till en identitet. Identiteten som registreras i identity_metadata.run_as beror på vilken produkt som är associerad med användningen.

Referera till följande tabell för beteendet identity_metadata.run_as :

Typ av arbetsbelastning Identitet för run_as
Serverlös beräkning för arbetsflöden Användaren eller tjänstens huvudnamn som definierats i körningen som inställning. Som standard körs jobb som identitet för jobbägaren, men administratörer kan ändra detta till en annan användare eller tjänstens huvudnamn.
Serverlös beräkning för notebook-filer Användaren som körde notebook-kommandona (specifikt användaren som skapade notebook-sessionen). För delade notebook-filer inkluderar detta användning av andra användare som delar samma notebook-session.

Visa information om produkten som är associerad med användningen

Vissa Databricks-produkter faktureras under samma delade SKU. För att hjälpa dig att särskilja användningen ger kolumnerna billing_origin_product och product_features mer insikt i den specifika produkten och de funktioner som är associerade med användningen.

Kolumnen billing_origin_product visar den Databricks-produkt som är associerad med användningsposten. Värdena omfattar:

  • JOBS
  • DLT
  • SQL
  • ALL_PURPOSE
  • MODEL_SERVING
  • INTERACTIVE
  • MANAGED_STORAGE
  • VECTOR_SEARCH
  • LAKEHOUSE_MONITORING
  • PREDICTIVE_OPTIMIZATION
  • ONLINE_TABLES

Kolumnen product_features är ett objekt som innehåller information om de specifika produktfunktioner som används och innehåller följande nyckel/värde-par:

  • jobs_tier: värden inkluderar LIGHT, CLASSIC, eller null
  • sql_tier: värden inkluderar CLASSIC, PRO, eller null
  • dlt_tier: värden inkluderar CORE, PRO, ADVANCED, eller null
  • is_serverless: värden inkluderar true eller false, eller null
  • is_photon: värden inkluderar true eller false, eller null
  • serving_type: värden inkluderar MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATUREeller null

Serverlös beräkningsanvändning

Strategier för att analysera serverlös användning finns i Övervaka kostnaden för serverlös beräkning.

Exempelfrågor

Du kan använda följande exempelfrågor för att besvara vanliga frågor om fakturerbar användning:

Vilken är den dagliga trenden i DBU-förbrukning?

SELECT usage_date as `Date`, sum(usage_quantity) as `DBUs Consumed`
  FROM system.billing.usage
WHERE sku_name = "STANDARD_ALL_PURPOSE_COMPUTE"
GROUP BY usage_date
ORDER BY usage_date ASC

Hur många DPU:er för varje SKU har använts under hela den här månaden?

SELECT sku_name, usage_date, sum(usage_quantity) as `DBUs`
    FROM system.billing.usage
WHERE
    month(usage_date) = month(NOW())
    AND year(usage_date) = year(NOW())
GROUP BY sku_name, usage_date

Hur mycket av varje SKU använde en arbetsyta den 1 juni?

Se till att ersätta workspace_id med ditt faktiska arbetsyte-ID.

SELECT sku_name, sum(usage_quantity) as `DBUs consumed`
FROM system.billing.usage
WHERE workspace_id = 1234567890123456
AND usage_date = "2023-06-01"
GROUP BY sku_name

Kommentar

Den här frågan returnerar en rad per unikt SKU-ID som används på arbetsytan på det valda datumet.

Vilka jobb förbrukade flest DPU:er?

SELECT usage_metadata.job_id as `Job ID`, sum(usage_quantity) as `DBUs`
FROM system.billing.usage
WHERE usage_metadata.job_id IS NOT NULL
GROUP BY `Job ID`
ORDER BY `DBUs` DESC

Hur mycket användning kan tillskrivas resurser med en specifik tagg?

Du kan dela upp kostnader på olika sätt. Det här exemplet visar hur du delar upp kostnader med en anpassad tagg. Se till att ersätta den anpassade taggens nyckel och värde i frågan.

SELECT sku_name, usage_unit, SUM(usage_quantity) as `DBUs consumed`
FROM system.billing.usage
WHERE custom_tags.{{key}} = "{{value}}"
GROUP BY 1, 2

Visa mig de SKU:er där användningen växer

SELECT after.sku_name, before_dbus, after_dbus, ((after_dbus - before_dbus)/before_dbus * 100) AS growth_rate
FROM
(SELECT sku_name, sum(usage_quantity) as before_dbus
    FROM system.billing.usage
WHERE usage_date BETWEEN "2023-04-01" and "2023-04-30"
GROUP BY sku_name) as before
JOIN
(SELECT sku_name, sum(usage_quantity) as after_dbus
    FROM system.billing.usage
WHERE usage_date BETWEEN "2023-05-01" and "2023-05-30"
GROUP BY sku_name) as after
where before.sku_name = after.sku_name
SORT by growth_rate DESC

Vad är användningstrenden för All Purpose Compute (Photon)?

SELECT sku_name, usage_date, sum(usage_quantity) as `DBUs consumed`
    FROM system.billing.usage
WHERE year(usage_date) = year(CURRENT_DATE)
AND sku_name = "ENTERPRISE_ALL_PURPOSE_COMPUTE_(PHOTON)"
AND usage_date > "2023-04-15"
GROUP BY sku_name, usage_date

Vad är DBU-förbrukningen för en materialiserad vy eller en strömmande tabell?

För att fastställa DBU-användning och SKU för en specifik materialiserad vy eller strömningstabell behöver du det associerade pipeline-ID:t (dlt_pipeline_id). Leta upp pipeline-ID:t på fliken Information när du visar relevant materialiserad vy eller strömningstabell i Katalogutforskaren.

SELECT
  sku_name,
  usage_date,
  SUM(usage_quantity) AS `DBUs`
FROM
  system.billing.usage
WHERE
  usage_metadata.dlt_pipeline_id = "113739b7-3f45-4a88-b6d9-e97051e773b9"
  AND usage_start_time > "2023-05-30"
GROUP BY
  ALL