Referência da tabela do sistema de uso faturável

Este artigo fornece uma visão geral da tabela do sistema de uso faturável, incluindo o esquema e exemplos de consultas. Com as tabelas do sistema, os dados de uso faturável do seu account são centralizados e roteados para todas as regiões, de modo que o senhor pode view o uso global do seu account de qualquer região em que o workspace esteja.

Para obter informações sobre como usar essa tabela para monitorar custos e consultas de amostra, consulte Monitorar custos usando tabelas do sistema.

Caminho da tabela : Essa tabela do sistema está localizada em system.billing.usage.

Esquema da tabela de uso faturável

A tabela do sistema de uso faturável usa o seguinte esquema:

Nome da coluna	Tipo de dados	Descrição	Exemplo
`record_id`	string	ID exclusivo para esse registro de uso	`11e22ba4-87b9-4cc2-9770-d10b894b7118`
`account_id`	string	ID do site account para o qual esse relatório foi gerado	`23e22ba4-87b9-4cc2-9770-d10b894b7118`
`workspace_id`	string	ID do site workspace ao qual esse uso estava associado	`1234567890123456`
`sku_name`	string	Nome da SKU	`STANDARD_ALL_PURPOSE_COMPUTE`
`cloud`	string	Nuvem associada a esse uso. Os valores possíveis são `AWS`, `AZURE` e `GCP`.	`AWS`, `AZURE` ou `GCP`
`usage_start_time`	carimbo de data/hora	O tempo de início relevante para esse registro de uso. As informações de fuso horário são registradas no final do valor com `+00:00` representando o fuso horário UTC.	`2023-01-09 10:00:00.000+00:00`
`usage_end_time`	carimbo de data/hora	A hora de término relevante para esse registro de uso. As informações de fuso horário são registradas no final do valor com `+00:00` representando o fuso horário UTC.	`2023-01-09 11:00:00.000+00:00`
`usage_date`	Data	Data do registro de uso, esse campo pode ser usado para agregar mais rapidamente por data	`2023-01-01`
`custom_tags`	map	Tags personalizadas associadas ao registro de uso	`{ “env”: “production” }`
`usage_unit`	string	Unidade em que esse uso é medido	`DBU`
`usage_quantity`	Decimal	Número de unidades consumidas para esse registro	`259.2958`
`usage_metadata`	struct	Metadados fornecidos pelo sistema sobre o uso, incluindo IDs para compute recurso e Job (se aplicável). Consulte Metadados de uso.	Consulte Metadados de uso
`identity_metadata`	struct	Metadados fornecidos pelo sistema sobre as identidades envolvidas no uso. Consulte Metadados de identidade.	Consulte Metadados de identidade
`record_type`	string	Se o registro é original, uma retratação ou uma reformulação. O valor é `ORIGINAL`, a menos que o registro esteja relacionado a uma correção. Consulte Tipo de registro.	`ORIGINAL`
`ingestion_date`	Data	Data em que o registro foi inserido na tabela `usage`	`2024-01-01`
`billing_origin_product`	string	O produto que originou o uso. Alguns produtos podem ser faturados como SKUs diferentes. Para obter os valores possíveis, consulte produto.	`JOBS`
`product_features`	struct	Detalhes sobre o produto recurso específico usado. Ver produto recurso.	Ver produto recurso
`usage_type`	string	O tipo de utilização atribuído ao produto ou à carga de trabalho para fins de faturamento. Os valores possíveis são `COMPUTE_TIME`, `STORAGE_SPACE`, `NETWORK_BYTE`, `NETWORK_HOUR`, `API_OPERATION`, `TOKEN`, `GPU_TIME` ou `ANSWER`.	`STORAGE_SPACE`

Referência de metadados de uso

Os valores em usage_metadata são todos strings que informam sobre os objetos workspace e os recursos envolvidos no registro de uso.

Apenas um subconjunto desses valores é preenchido em um determinado registro de uso, dependendo do tipo de compute e do recurso usado. A terceira coluna da tabela mostra quais tipos de uso fazem com que cada valor seja preenchido.

Valor	Descrição	Preenchido para (caso contrário, `null`)
`cluster_id`	ID do clustering associado ao registro de uso	Uso compute nãoserverless , incluindo Notebook, Job, pipeline declarativo LakeFlow Spark e modelos de servidor legados.
`job_id`	ID do trabalho associado ao registro de uso	Trabalho sem servidor e execução de trabalho no site compute (não é preenchido para execução de trabalho no site compute)
`warehouse_id`	ID do site SQL warehouse associado ao registro de uso	Execução de cargas de trabalho em um SQL warehouse
`instance_pool_id`	ID do pool de instâncias associado ao registro de uso	Uso compute nãoserverless do pool, incluindo Notebook, Job, pipeline declarativo LakeFlow Spark e modelo de servidor legado.
`node_type`	O tipo de instância do recurso compute	Uso compute nãoserverless , incluindo Notebook, Job, pipeline declarativo LakeFlow Spark e todo o repositório SQL
`job_run_id`	ID da execução do trabalho associado ao registro de uso	Trabalho sem servidor e execução de trabalho no site compute (não é preenchido para execução de trabalho no site compute)
`notebook_id`	ID do Notebook associado ao uso	Notebook sem servidor
`dlt_pipeline_id`	ID do pipeline declarativo associado ao registro de uso	O pipeline declarativo Spark LakeFlow Spark e os recursos que o utilizam, como visualizações materializadas, tabelas online, indexação de pesquisa vetorial e LakeFlow LakeFlow Connect
`endpoint_name`	O nome do modelo de serviço endpoint ou pesquisa vetorial endpoint associado ao registro de uso	servindo modelo e Vector Search
`endpoint_id`	ID do modelo de serviço endpoint ou pesquisa vetorial endpoint associado ao registro de uso	servindo modelo e Vector Search
`dlt_update_id`	ID da atualização do pipeline associada ao registro de uso	O pipeline declarativo Spark LakeFlow Spark e os recursos que o utilizam, como visualizações materializadas, tabelas online, indexação de pesquisa vetorial e LakeFlow LakeFlow Connect
`dlt_maintenance_id`	ID da tarefa de manutenção do site pipeline associada ao registro de uso	O pipeline declarativo Spark LakeFlow Spark e os recursos que o utilizam, como visualizações materializadas, tabelas online, indexação de pesquisa vetorial e LakeFlow LakeFlow Connect
`metastore_id`	ID do metastore associado ao armazenamento default	armazenamento padrão
`run_name`	Nome exclusivo para o usuário da execução do ajuste fino do modelo básico associado ao registro de utilização	Ajuste fino do modelo básico
`job_name`	Nome dado pelo usuário do trabalho associado ao registro de uso	Job sem servidor e execução de Job no Job compute (preenchido para Job compute desde setembro de 2025). Não preenchido para compute geral.
`notebook_path`	caminho de armazenamento do espaço de trabalho do Notebook associado ao uso	Execução do notebook em serverless compute
`central_clean_room_id`	ID da sala limpa central associada ao registro de uso	Clean Rooms
`source_region`	Região de origem do tráfego faturado. Retorna um valor apenas para uso relacionado à rede d serverless.	rede sem servidor
`destination_region`	Região onde o tráfego faturado foi recebido. Retorna um valor apenas para uso relacionado à rede d serverless.	rede sem servidor
`app_id`	ID do aplicativo associado ao registro de uso	Databricks Apps
`app_name`	Nome dado pelo usuário do aplicativo associado ao registro de uso	Databricks Apps
`private_endpoint_name`	Esse valor não é preenchido no Databricks on AWS	Sempre `null` no Databricks on AWS
`budget_policy_id`	ID da política orçamentária serverless anexada à carga de trabalho	Utilização compute sem servidor, incluindo Notebook, Job, pipeline declarativo LakeFlow Spark e endpoint do modelo de serviço.
`storage_api_type`	O tipo de operações realizadas no armazenamento default . Os valores possíveis são `TIER_1` (PUT, COPY, POST, LIST) e `TIER_2` (outras operações).	armazenamento padrão
`ai_runtime_workload_id`	ID da carga de trabalho de GPU serverless associada ao registro de uso	cargas de trabalho de GPU sem servidor
`uc_table_catalog`	O nome do catálogo Unity Catalog associado ao registro de uso.	Visualizações materializadas
`uc_table_schema`	O nome do esquema Unity Catalog associado ao registro de uso.	Visualizações materializadas
`uc_table_name`	O nome da tabela Unity Catalog associada ao registro de uso.	Visualizações materializadas
`database_instance_id`	ID da instância do banco de dados associada ao registro de uso.	Instâncias de banco de dados Lakebase
`sharing_materialization_id`	ID da materialização de compartilhamento associada ao registro de uso	visualizar tabelas de compartilhamento, visualização materializada e transmissão usando Delta Sharing
`usage_policy_id`	ID da política de uso associada ao registro de uso	Políticas de utilização
`agent_bricks_id`	ID da carga de trabalho do agente associada ao registro de uso	Cargas de trabalho do Agent Bricks
`base_environment_id`	ID do ambiente base associado ao uso	Uso da criação ou atualização do ambiente base serverless de um workspace. Preenchido quando `billing_origin_product` é `BASE_ENVIRONMENTS`.

Referência de metadados de identidade

A coluna identity_metadata fornece mais informações sobre as identidades envolvidas no uso.

O campo run_as logs que executa a carga de trabalho. Esses valores são preenchidos apenas para determinados tipos de carga de trabalho listados na tabela abaixo.
O campo owned_by aplica-se apenas ao uso SQL warehouse e logs ao usuário ou entidade de serviço que possui o SQL warehouse responsável pelo uso.
O campo created_by aplica-se a aplicativos e agentes Databricks e logs o email do usuário que criou o aplicativo ou agente.

identidades de execução

A identidade registrada em identity_metadata.run_as depende do produto associado ao uso. Consulte a tabela a seguir para ver o comportamento identity_metadata.run_as:

Tipo de carga de trabalho	Identidade de `run_as`
Empregos compute	O usuário ou entidade de serviço definido na configuração `run_as`. Em default, a execução do trabalho é a identidade do proprietário do trabalho, mas os administradores podem alterá-la para outro usuário ou entidade de serviço.
sem servidor compute para o trabalho	O usuário ou entidade de serviço definido na configuração `run_as`. Em default, a execução do trabalho é a identidade do proprietário do trabalho, mas os administradores podem alterá-la para outro usuário ou entidade de serviço.
Compute serverless para notebooks	O usuário que executou o comando do Notebook (especificamente, o usuário que criou a sessão do Notebook). Para o Notebook compartilhado, isso inclui o uso por outros usuários que compartilham a mesma sessão do Notebook.
Pipeline declarativo LakeFlow Spark	O usuário ou entidade de serviço cujas permissões são usadas para executar o pipeline. Isso pode ser alterado com a transferência da propriedade do pipeline.
Ajuste fino do modelo básico	O usuário ou a entidade de serviço que iniciou a execução do treinamento de ajuste fino.
Otimização preditiva	A Databricks- entidade de serviço de propriedade do senhor que executa operações de otimização preditiva.
Qualidade de dados	O usuário que criou o perfil.

nota

No espaço de trabalho habilitado para o padrão FedRamp compliance, todos os valores não nulos na coluna identity_metadata serão substituídos por __REDACTED__.

Referência do tipo de registro

A tabela billing.usage suporta correções. As correções ocorrem quando qualquer campo do registro de uso está incorreto e deve ser corrigido.

Quando ocorre uma correção, o Databricks adiciona dois novos registros à tabela. Um registro de retratação nega o registro incorreto original e, em seguida, um registro de reafirmação inclui as informações corrigidas. Os registros de correção são identificados usando o campo record_type:

RETRACTION: usado para negar o uso incorreto original. Todos os campos são idênticos ao registro ORIGINAL, exceto usage_quantity, que é um valor negativo que cancela a quantidade de uso original. Por exemplo, se a quantidade de uso do registro original fosse 259.4356, o registro de retração teria uma quantidade de uso de -259.4356.
RESTATEMENT: o registro que inclui os campos e a quantidade de uso corretos.

Por exemplo, a consulta a seguir retorna a quantidade correta de uso por hora relacionada a um job_id, mesmo que tenham sido feitas correções. Ao agregar a quantidade de uso, o registro de retração nega o registro original e somente os valores da atualização são retornados.

SQL
SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

nota

Para correções em que o registro de uso original não deveria ter sido escrito, uma correção só pode adicionar um registro de retração e nenhum registro de atualização.

Referência do produto de origem do faturamento

Alguns produtos Databricks são faturados sob o mesmo SKU compartilhado. Por exemplo, monitoramento da qualidade dos dados, otimização preditiva e fluxo de trabalho serverless são todos cobrados sob o mesmo SKU de trabalho serverless .

Para ajudar o senhor a diferenciar o uso, as colunas billing_origin_product e product_features fornecem mais entendimento sobre o produto e o recurso específicos associados ao uso.

A coluna billing_origin_product mostra o produto Databricks associado ao registro de uso. Os valores incluem:

Valor	Descrição
`JOBS`	Custos associados às cargas de trabalho LakeFlow Jobs
`DLT`	Custos associados às cargas de trabalho do pipeline declarativoLakeFlow Spark
`SQL`	Custos associados ao Databricks SQL, incluindo a execução de cargas de trabalho no SQL Warehouse e na visualização materializada.
`ALL_PURPOSE`	Custos associados à computeclássica de uso geral
`MODEL_SERVING`	Custos associados à Mosaic AI Model Serving
`INTERACTIVE`	Custos associados a cargas de trabalho interativasserverless
`DEFAULT_STORAGE`	Custos associados ao armazenamentodefault
`VECTOR_SEARCH`	Custos associados à Busca Vetorial
`LAKEHOUSE_MONITORING`	Custos associados ao monitoramento da qualidade dos dados
`PREDICTIVE_OPTIMIZATION`	Custos associados à otimização preditiva
`ONLINE_TABLES`	Custos associados a tabelas online (Legado)
`FOUNDATION_MODEL_TRAINING`	Custos associados ao ajuste fino do modelo Foundation
`AGENT_EVALUATION`	Custos associados à avaliação de agentes
`FINE_GRAINED_ACCESS_CONTROL`	Utilização sem servidor a partir de controle de acesso granular em computededicada.
`BASE_ENVIRONMENTS`	Uso associado à criação ou atualização do ambiente baseserverlessde um workspace
`DATA_CLASSIFICATION`	Custos associados às operações de classificação de dados
`DATA_QUALITY_MONITORING`	Custos associados ao monitoramento da qualidade dos dados, incluindo detecção de anomalia e perfil de dados
`AI_GATEWAY`	Custos associados à utilização do AI Gateway
`AI_RUNTIME`	Custos associados a cargas de trabalho de GPU serverless
`NETWORKING`	Custos associados à conexão compute serverless ao seu recurso
`APPS`	Custos associados à criação e operação de aplicativos Databricks
`DATABASE`	Custos associados às instâncias do banco de dados Lakebase
`AI_FUNCTIONS`	Custos associados à utilização AI Functions . Este produto registra apenas o uso da função AI_PARSE_DOCUMENT .
`AGENT_BRICKS`	Custos associados às cargas de trabalho do Agent Bricks
`CLEAN_ROOM`	Custos associados às cargas de trabalho em salas limpas
`LAKEFLOW_CONNECT`	Custos associados aos conectores do gerenciador LakeFlow Connect

produto recurso referência

A coluna product_features é um objeto que contém informações sobre o produto recurso específico usado e inclui o seguinte par key-value:

campo	Descrição
`jobs_tier`	Os valores incluem `LIGHT`, `CLASSIC` ou `null`
`sql_tier`	Os valores incluem `CLASSIC`, `PRO` ou `null`
`dlt_tier`	Os valores incluem `CORE`, `PRO`, `ADVANCED` ou `null`
`is_serverless`	Os valores incluem `true` ou `false` ou `null` (o valor é `true` ou `false` quando você pode escolher entre computação serverless e compute clássica, caso contrário é `null`)
`is_photon`	Os valores incluem `true` ou `false`, ou `null`
`serving_type`	Os valores incluem `MODEL`, `GPU_MODEL`, `FOUNDATION_MODEL`, `FEATURE` ou `null`
`offering_type`	Os valores incluem `BATCH_INFERENCE` ou `null`
`performance_target`	Indica o modo de desempenho do Job ou pipeline serverless . Os valores incluem `PERFORMANCE_OPTIMIZED`, `STANDARD` ou `null`. As cargas de trabalho não serverless têm um valor `null` .
`ai_runtime.compute_type`	Indica o tipo compute para cargas de trabalho de GPU serverless ou `null`
`model_serving.offering_type`	Indica o tipo de oferta para servir modelo ou `null`
`ai_gateway.feature_type`	Indica o tipo de recurso para cargas de trabalho do AI Gateway ou `null`
`serverless_gpu.workload_type`	Indica o tipo de carga de trabalho para compute de GPU serverless ou `null`
`ai_functions.ai_function`	Indica o tipo de função AI ou `null`
`networking.connectivity_type`	Os valores incluem `PUBLIC_IP` e `PRIVATE_IP`
`agent_bricks.problem_type`	Indica o tipo de problema para cargas de trabalho do Agent Bricks. Os valores incluem `AGENT_BRICKS_KNOWLEDGE_ASSISTANT` ou `null`
`agent_bricks.workload_type`	Indica o tipo de carga de trabalho para os Agent Bricks. Os valores incluem `AGENT_BRICKS_REAL_TIME_INFERENCE` ou `null`

Esquema da tabela de uso faturável​

Referência de metadados de uso​

Referência de metadados de identidade​

identidades de execução​

Referência do tipo de registro​

Referência do produto de origem do faturamento​

produto recurso referência​