Pular para o conteúdo principal

Referência da tabela do sistema de uso faturável

Este artigo fornece uma visão geral da tabela do sistema de uso faturável, incluindo o esquema e exemplos de consultas. Com as tabelas do sistema, os dados de uso faturável do seu account são centralizados e roteados para todas as regiões, de modo que o senhor pode view o uso global do seu account de qualquer região em que o workspace esteja.

Para obter informações sobre como usar essa tabela para monitorar custos e consultas de amostra, consulte Monitorar custos usando tabelas do sistema.

Caminho da tabela : Essa tabela do sistema está localizada em system.billing.usage.

Esquema da tabela de uso faturável

A tabela do sistema de uso faturável usa o seguinte esquema:

Nome da coluna

Tipo de dados

Descrição

Exemplo

record_id

string

ID exclusivo para esse registro de uso

11e22ba4-87b9-4cc2-9770-d10b894b7118

account_id

string

ID do site account para o qual esse relatório foi gerado

23e22ba4-87b9-4cc2-9770-d10b894b7118

workspace_id

string

ID do site workspace ao qual esse uso estava associado

1234567890123456

sku_name

string

Nome da SKU

STANDARD_ALL_PURPOSE_COMPUTE

cloud

string

Nuvem associada a esse uso. Os valores possíveis são AWS, AZURE e GCP.

AWS, AZURE ou GCP

usage_start_time

carimbo de data/hora

O tempo de início relevante para esse registro de uso. As informações de fuso horário são registradas no final do valor com +00:00 representando o fuso horário UTC.

2023-01-09 10:00:00.000+00:00

usage_end_time

carimbo de data/hora

A hora de término relevante para esse registro de uso. As informações de fuso horário são registradas no final do valor com +00:00 representando o fuso horário UTC.

2023-01-09 11:00:00.000+00:00

usage_date

Data

Data do registro de uso, esse campo pode ser usado para agregar mais rapidamente por data

2023-01-01

custom_tags

map

Tags personalizadas associadas ao registro de uso

{ “env”: “production” }

usage_unit

string

Unidade em que esse uso é medido

DBU

usage_quantity

Decimal

Número de unidades consumidas para esse registro

259.2958

usage_metadata

struct

Metadados fornecidos pelo sistema sobre o uso, incluindo IDs para compute recurso e Job (se aplicável). Consulte Metadados de uso.

Consulte Metadados de uso

identity_metadata

struct

Metadados fornecidos pelo sistema sobre as identidades envolvidas no uso. Consulte Metadados de identidade.

Consulte Metadados de identidade

record_type

string

Se o registro é original, uma retratação ou uma reformulação. O valor é ORIGINAL, a menos que o registro esteja relacionado a uma correção. Consulte Tipo de registro.

ORIGINAL

ingestion_date

Data

Data em que o registro foi inserido na tabela usage

2024-01-01

billing_origin_product

string

O produto que originou o uso. Alguns produtos podem ser faturados como SKUs diferentes. Para obter os valores possíveis, consulte produto.

JOBS

product_features

struct

Detalhes sobre o produto recurso específico usado. Ver produto recurso.

Ver produto recurso

usage_type

string

O tipo de uso atribuído ao produto ou à carga de trabalho para fins de faturamento. Os valores possíveis são COMPUTE_TIME, STORAGE_SPACE, NETWORK_BYTE, NETWORK_HOUR, API_OPERATION, TOKEN ou GPU_TIME.

STORAGE_SPACE

Referência de metadados de uso

Os valores em usage_metadata são todos strings que informam sobre os objetos workspace e os recursos envolvidos no registro de uso.

Apenas um subconjunto desses valores é preenchido em um determinado registro de uso, dependendo do tipo de compute e do recurso usado. A terceira coluna da tabela mostra quais tipos de uso fazem com que cada valor seja preenchido.

Valor

Descrição

Preenchido para (caso contrário, null)

cluster_id

ID do clustering associado ao registro de uso

Nãoserverless compute uso, incluindo Notebook, Job, LakeFlow Declarative pipeline e legacy servindo modelo

job_id

ID do trabalho associado ao registro de uso

Trabalho sem servidor e execução de trabalho no site compute (não é preenchido para execução de trabalho no site compute)

warehouse_id

ID do site SQL warehouse associado ao registro de uso

Execução de cargas de trabalho em um SQL warehouse

instance_pool_id

ID do pool de instâncias associado ao registro de uso

Nãoserverless compute uso do pool, incluindo Notebook, Job, LakeFlow Declarative pipeline e modelo de serviço legado

node_type

O tipo de instância do recurso compute

Nãoserverless compute uso, incluindo Notebook, Job, LakeFlow Declarative pipeline e todos os SQL warehouse

job_run_id

ID da execução do trabalho associado ao registro de uso

Trabalho sem servidor e execução de trabalho no site compute (não é preenchido para execução de trabalho no site compute)

notebook_id

ID do Notebook associado ao uso

Notebook sem servidor

dlt_pipeline_id

ID do pipeline declarativo associado ao registro de uso

LakeFlow Pipeline declarativo e recurso que usam LakeFlow Pipeline declarativo, como visualização materializada, tabelas on-line, indexação de pesquisa vetorial e LakeFlow Connect

endpoint_name

O nome do modelo de serviço endpoint ou pesquisa vetorial endpoint associado ao registro de uso

servindo modelo e Vector Search

endpoint_id

ID do modelo de serviço endpoint ou pesquisa vetorial endpoint associado ao registro de uso

servindo modelo e Vector Search

dlt_update_id

ID da atualização do pipeline associada ao registro de uso

LakeFlow Pipeline declarativo e recurso que usam LakeFlow Pipeline declarativo, como visualização materializada, tabelas on-line, indexação de pesquisa vetorial e LakeFlow Connect

dlt_maintenance_id

ID da tarefa de manutenção do site pipeline associada ao registro de uso

LakeFlow Pipeline declarativo e recurso que usam LakeFlow Pipeline declarativo, como visualização materializada, tabelas on-line, indexação de pesquisa vetorial e LakeFlow Connect

metastore_id

ID do metastore associado ao armazenamento default

armazenamento padrão

run_name

Nome exclusivo para o usuário da execução do ajuste fino do modelo básico associado ao registro de utilização

Ajuste fino do modelo básico

job_name

Nome dado pelo usuário do trabalho associado ao registro de uso

Job sem servidor e execução de Job no Job compute (preenchido para Job compute desde setembro de 2025). Não preenchido para compute geral.

notebook_path

caminho de armazenamento do espaço de trabalho do Notebook associado ao uso

Execução do notebook em serverless compute

central_clean_room_id

ID da sala limpa central associada ao registro de uso

Clean Rooms

source_region

Região de origem do tráfego faturado. Retorna um valor apenas para uso relacionado à rede d serverless.

rede sem servidor

destination_region

Região onde o tráfego faturado foi recebido. Retorna um valor apenas para uso relacionado à rede d serverless.

rede sem servidor

app_id

ID do aplicativo associado ao registro de uso

Databricks Apps

app_name

Nome dado pelo usuário do aplicativo associado ao registro de uso

Databricks Apps

private_endpoint_name

Esse valor não é preenchido no Databricks on AWS

Sempre null no Databricks on AWS

budget_policy_id

ID da política orçamentária serverless anexada à carga de trabalho

uso do serverless compute, incluindo Notebook, Job, LakeFlow Declarative pipeline e endpoint servindo modelo

storage_api_type

O tipo de operações realizadas no armazenamento default . Os valores possíveis são TIER_1 (PUT, COPY, POST, LIST) e TIER_2 (outras operações).

armazenamento padrão

ai_runtime_workload_id

ID da carga de trabalho de GPU serverless associada ao registro de uso

cargas de trabalho de GPU sem servidor

uc_table_catalog

O nome do catálogo Unity Catalog associado ao registro de uso.

Visualizações materializadas

uc_table_schema

O nome do esquema Unity Catalog associado ao registro de uso.

Visualizações materializadas

uc_table_name

O nome da tabela Unity Catalog associada ao registro de uso.

Visualizações materializadas

database_instance_id

ID da instância do banco de dados associada ao registro de uso.

Instâncias de banco de dados Lakebase

sharing_materialization_id

ID da materialização de compartilhamento associada ao registro de uso

visualizar tabelas de compartilhamento, visualização materializada e transmissão usando Delta Sharing

usage_policy_id

ID da política de uso associada ao registro de uso

Políticas de utilização

agent_bricks_id

ID da carga de trabalho do agente associada ao registro de uso

Cargas de trabalho do Agent Bricks

base_environment_id

ID do ambiente base associado ao uso

Uso da criação ou atualização do ambiente base serverless de um workspace. Preenchido quando billing_origin_product é BASE_ENVIRONMENTS.

Referência de metadados de identidade

A coluna identity_metadata fornece mais informações sobre as identidades envolvidas no uso.

  • O campo run_as logs que executa a carga de trabalho. Esses valores são preenchidos apenas para determinados tipos de carga de trabalho listados na tabela abaixo.

  • O campo owned_by aplica-se apenas ao uso SQL warehouse e logs ao usuário ou entidade de serviço que possui o SQL warehouse responsável pelo uso.

  • O campo created_by se aplica aos aplicativos Databricks e logs ao email do usuário que criou o aplicativo.

identidades de execução

A identidade registrada em identity_metadata.run_as depende do produto associado ao uso. Consulte a tabela a seguir para ver o comportamento identity_metadata.run_as:

Tipo de carga de trabalho

Identidade de run_as

Empregos compute

O usuário ou entidade de serviço definido na configuração run_as. Em default, a execução do trabalho é a identidade do proprietário do trabalho, mas os administradores podem alterá-la para outro usuário ou entidade de serviço.

sem servidor compute para o trabalho

O usuário ou entidade de serviço definido na configuração run_as. Em default, a execução do trabalho é a identidade do proprietário do trabalho, mas os administradores podem alterá-la para outro usuário ou entidade de serviço.

Compute serverless para notebooks

O usuário que executou o comando do Notebook (especificamente, o usuário que criou a sessão do Notebook). Para o Notebook compartilhado, isso inclui o uso por outros usuários que compartilham a mesma sessão do Notebook.

Pipelines Declarativos do LakeFlow

O usuário ou entidade de serviço cujas permissões são usadas para executar o pipeline. Isso pode ser alterado com a transferência da propriedade do pipeline.

Ajuste fino do modelo básico

O usuário ou a entidade de serviço que iniciou a execução do treinamento de ajuste fino.

Otimização preditiva

A Databricks- entidade de serviço de propriedade do senhor que executa operações de otimização preditiva.

Qualidade de dados

O usuário que criou o perfil.

nota

No espaço de trabalho habilitado para o padrão FedRamp compliance, todos os valores não nulos na coluna identity_metadata serão substituídos por __REDACTED__.

Referência do tipo de registro

A tabela billing.usage suporta correções. As correções ocorrem quando qualquer campo do registro de uso está incorreto e deve ser corrigido.

Quando ocorre uma correção, o Databricks adiciona dois novos registros à tabela. Um registro de retratação nega o registro incorreto original e, em seguida, um registro de reafirmação inclui as informações corrigidas. Os registros de correção são identificados usando o campo record_type:

  • RETRACTION: usado para negar o uso incorreto original. Todos os campos são idênticos ao registro ORIGINAL, exceto usage_quantity, que é um valor negativo que cancela a quantidade de uso original. Por exemplo, se a quantidade de uso do registro original fosse 259.4356, o registro de retração teria uma quantidade de uso de -259.4356.
  • RESTATEMENT: o registro que inclui os campos e a quantidade de uso corretos.

Por exemplo, a consulta a seguir retorna a quantidade correta de uso por hora relacionada a um job_id, mesmo que tenham sido feitas correções. Ao agregar a quantidade de uso, o registro de retração nega o registro original e somente os valores da atualização são retornados.

SQL
SELECT
usage_metadata.job_id, usage_start_time, usage_end_time,
SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0
nota

Para correções em que o registro de uso original não deveria ter sido escrito, uma correção só pode adicionar um registro de retração e nenhum registro de atualização.

Referência do produto de origem do faturamento

Alguns produtos Databricks são faturados sob o mesmo SKU compartilhado. Por exemplo, monitoramento da qualidade dos dados, otimização preditiva e fluxo de trabalho serverless são todos cobrados sob o mesmo SKU de trabalho serverless .

Para ajudar o senhor a diferenciar o uso, as colunas billing_origin_product e product_features fornecem mais entendimento sobre o produto e o recurso específicos associados ao uso.

A coluna billing_origin_product mostra o produto Databricks associado ao registro de uso. Os valores incluem:

Valor

Descrição

JOBS

Custos associados às cargas de trabalho LakeFlow Jobs

DLT

Custos associados às cargas de trabalho do pipeline declarativoLakeFlow

SQL

Custos associados ao Databricks SQL, incluindo a execução de cargas de trabalho no SQL Warehouse e na visualização materializada.

ALL_PURPOSE

Custos associados à computeclássica de uso geral

MODEL_SERVING

Custos associados à Mosaic AI Model Serving

INTERACTIVE

Custos associados a cargas de trabalho interativasserverless

DEFAULT_STORAGE

Custos associados ao armazenamentodefault

VECTOR_SEARCH

Custos associados à Busca Vetorial

LAKEHOUSE_MONITORING

Custos associados ao monitoramento da qualidade dos dados

PREDICTIVE_OPTIMIZATION

Custos associados à otimização preditiva

ONLINE_TABLES

Custos associados a tabelas online (Legado)

FOUNDATION_MODEL_TRAINING

Custos associados ao ajuste fino do modelo Foundation

AGENT_EVALUATION

Custos associados à avaliação de agentes

FINE_GRAINED_ACCESS_CONTROL

Utilização sem servidor a partir de controle de acesso granular em computededicada.

BASE_ENVIRONMENTS

Uso associado à criação ou atualização do ambiente baseserverlessde um workspace

DATA_CLASSIFICATION

Custos associados às operações de classificação de dados

AI_GATEWAY

Custos associados à utilização do AI Gateway

AI_RUNTIME

Custos associados a cargas de trabalho de GPU serverless

NETWORKING

Custos associados à conexão compute serverless ao seu recurso

APPS

Custos associados à criação e operação de aplicativos Databricks

DATABASE

Custos associados às instâncias do banco de dados Lakebase

produto recurso referência

A coluna product_features é um objeto que contém informações sobre o produto recurso específico usado e inclui o seguinte par key-value:

campo

Descrição

jobs_tier

Os valores incluem LIGHT, CLASSIC ou null

sql_tier

Os valores incluem CLASSIC, PRO ou null

dlt_tier

Os valores incluem CORE, PRO, ADVANCED ou null

is_serverless

Os valores incluem true ou false ou null (o valor é true ou false quando você pode escolher entre computação serverless e compute clássica, caso contrário é null)

is_photon

Os valores incluem true ou false, ou null

serving_type

Os valores incluem MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATURE ou null

offering_type

Os valores incluem BATCH_INFERENCE ou null

performance_target

Indica o modo de desempenho do Job ou pipeline serverless . Os valores incluem PERFORMANCE_OPTIMIZED, STANDARD ou null. As cargas de trabalho não serverless têm um valor null .

ai_runtime.compute_type

Indica o tipo compute para cargas de trabalho de GPU serverless ou null

model_serving.offering_type

Indica o tipo de oferta para servir modelo ou null

ai_gateway.feature_type

Indica o tipo de recurso para cargas de trabalho do AI Gateway ou null

serverless_gpu.workload_type

Indica o tipo de carga de trabalho para compute de GPU serverless ou null

ai_functions.ai_function

Indica o tipo de função AI ou null

networking.connectivity_type

Os valores incluem PUBLIC_IP e PRIVATE_IP

agent_bricks.problem_type

Indica o tipo de problema para cargas de trabalho do Agent Bricks ou null

agent_bricks.workload_type

Indica o tipo de carga de trabalho para Agent Bricks ou null