Use tags para atribuir e rastrear o uso

Este artigo explica como usar tags para atribuir o uso do compute a espaços de trabalho, equipes, projetos ou usuários específicos para apoiar o acompanhamento de custos e o orçamento.

Há dois tipos de tags:

tags padrão: Aplicadas automaticamente por Databricks ao recurso implantado na nuvem. Eles fornecem metadados básicos como fornecedor, ID de clustering e criador.
Tags personalizadas: Tags definidas pelo usuário que podem ser adicionadas às cargas de trabalho do compute recurso e do serverless. Isso permite o acompanhamento granular, a geração de relatórios e a elaboração de orçamentos.

atenção

Os dados da tag são armazenados como texto simples e podem ser replicados globalmente. Não use nomes de tags, valores ou descritores que possam comprometer a segurança de seu recurso. Por exemplo, não use nomes de tags, valores ou descritores que contenham informações pessoais ou confidenciais.

tags padrão

Databricks adiciona automaticamente as tags default ao compute recurso implantado em sua nuvem account. Essas tags atribuem o uso a Databricks e fornecem informações básicas sobre o recurso, como seu nome, ID e criador.

As tags padrão e a chave de tag se propagam automaticamente para o rótulo no recurso GCE, como a VM e seus discos persistentes.

chave e valores da tag padrão

Databricks adiciona as seguintes tags default a compute recurso:

Etiqueta key	Valor
`Vendor`	Valor constante: `Databricks`
`ClusterId`	Databricks ID interna do clustering
`ClusterName`	Nome do clustering
`Creator`	Nome de usuário (endereçoemail ) do usuário que criou o clustering
`RunName`	Job (só se propaga no Job compute). Se o senhor usar a Jobs API 2.0, isso será equivalente a `run_name`. Na API 2.1 do Jobs, é o `task_key`.
`JobId`	Job ID (só se propaga no Job compute)

Para a chave de tag e os valores que são propagados para o recurso GCE, as letras são convertidas em minúsculas. Os caracteres são removidos se não forem letras, números, sublinhados ou traços. O endereço email do criador com @ é substituído por _at_. Por exemplo, X+Y@databricks.com se torna xy_at_databricks.com.

O parâmetro compute usado pelo perfil de dados inclui estas tags adicionais:

Etiqueta key	Valor
`LakehouseMonitoring`	verdade
`LakehouseMonitoringTableId`	ID da tabela monitorada
`LakehouseMonitoringWorkspaceId`	ID do site workspace onde o monitor foi criado
`LakehouseMonitoringMetastoreId`	ID do metastore em que a tabela monitorada existe

Databricks adiciona as seguintes tags default ao pool e o recurso compute criado pelo pool.

Etiqueta key	Valor
`Vendor`	Valor constante: `Databricks`
`DatabricksInstancePoolCreatorId`	ID interno do Databricks do usuário que criou o pool
`DatabricksInstancePoolId`	ID interna do pool do Databricks

Etiquetas personalizadas

As tags personalizadas permitem que o senhor atribua o uso do compute a equipes, projetos ou centros de custo específicos com mais granularidade do que as tags do default. Essas tags são aplicadas por usuários ou administradores e se propagam tanto para o uso do seu account logs quanto para o recurso de nuvem aplicável. Essas tags também são usadas para criar e monitorar orçamentos em seu site Databricks account.

Recurso suportado para tags personalizadas

O senhor pode adicionar tags personalizadas para os seguintes objetos gerenciar por Databricks:

Objeto	Interface de marcação (UI)	Interface de marcação (API)
Pool	UI do pool no site Databricks workspace	API do pool de instâncias
Para todos os fins e para o trabalho compute	computar a UI no site Databricks workspace	agrupamento API
Armazém SQL	SQL warehouse UI no site Databricks workspace	API de armazéns

As tags personalizadas aparecem em letras minúsculas no GCE logs. Os caracteres são removidos se não forem letras, números, sublinhados ou traços. Por exemplo, My Key se torna mykey e My.Val se torna myval.

atenção

Não atribua uma tag personalizada com o endereço key Name a um clustering. Cada clustering tem uma tag Name cujo valor é definido por Databricks. Se o senhor alterar o valor associado a key Name, o clustering não poderá mais ser rastreado por Databricks. Como consequência, o clustering pode não ser encerrado depois de se tornar parado e continuará a incorrer em custos de uso.

Tag serverless compute cargas de trabalho

info

Visualização

Esse recurso está em Public Preview.

Para atribuir o uso do serverless compute a usuários, grupos ou projetos, o senhor pode usar as políticas de orçamento do serverless. Quando um usuário recebe uma política de orçamento do serverless, seu uso do serverless é automaticamente marcado com as tags personalizadas da política. As políticas de orçamento sem servidor podem ser aplicadas a serverless Notebook, Job, pipeline e endpoint de modelo de serviço.

nota

O compute uso do serverless é registrado na account tabela do sistema de uso faturável do seu. Os DBU relatórios de serverless uso do legado não incluem as serverless tags de política orçamentária usage ou.

Consulte Uso de atributos com as políticas de orçamento do serverless.

Propagação de tags

O senhor pode usar o clustering e as tags pool para agregar e analisar os custos. Essas tags se propagam das seguintes maneiras:

Tags nos relatórios DBU: As tags personalizadas se propagam para a tabela do sistema de uso faturável logs. As tags personalizadas e default são propagadas para os relatórios de usoDBU nos relatórios de downloads.
Rótulo do GCE para cada VM e seus discos persistentes : As tags se propagam para o rótulo no recurso GCE, como a VM e seus discos persistentes. Isso permite que você use a medição de uso do GCE para atribuir custos. A chave e os valores da tag são transformados para se adequarem aos limites de formato do rótulo GCE.

Como as tags se propagam para o clustering criado a partir do pool

As tags se propagam para as instâncias de nós de forma diferente, dependendo se um clustering foi criado ou não a partir de um pool.

Se um clustering não for criado a partir de um pool, suas tags se propagam como esperado para as instâncias de nós.
Se um clustering for criado a partir de um pool, suas instâncias herdarão as tags pool e a tag Cluster. As tags do pool são usadas diretamente para os dados de uso da VM somente para as VMs paradas.
Se houver um conflito de nome de tag, as tags Databricks default têm precedência sobre as tags personalizadas e as tags pool têm precedência sobre a Cluster Tag.

:::

Aplicação de tags

Para impor o uso de tags personalizadas específicas, o senhor pode usar as políticas do site compute. Consulte Aplicação de tags personalizadas. Para aplicar tags personalizadas nas cargas de trabalho serverless compute , use as políticas de orçamentoserverless.

Limitações

A chave e os valores da tag só podem conter letras, espaços, números ou os caracteres +, -, =, ., _, :, /, @. As tags que contêm outros caracteres são inválidas.
Se o senhor alterar os nomes ou valores das chaves de tag, essas alterações serão aplicadas somente após a reinicialização do clustering ou a expansão do site pool.
O número máximo personalizado de tags que podem se propagar para o rótulo GCE é 54.
O comprimento máximo da chave e dos valores do rótulo GCE é de 63 caracteres.
A propagação do rótulo pode ser atrasada devido aos limites de taxa da GCE API para o projeto. O senhor pode resolver isso aumentando os limites de taxa da API do GCE para o projeto Google Cloud.

Limites do rótulo GCE

Para o rótulo GCE, há limitações:

A chave e os valores devem consistir apenas em letras minúsculas, caracteres numéricos, sublinhado e traços.
O comprimento máximo da chave e dos valores do rótulo GCE é de 63 caracteres.
O número máximo de tags que podem se propagar para o rótulo GCE é 54.

Para estar em conformidade com as regras de formato do GCE, as tags são transformadas antes de se tornarem chaves e valores do rótulo do GCE. Se houver duplicatas após as transformações, o par de chave e valores que aparecem mais tarde (mais abaixo) nas definições de tag são os que persistem.

tags padrão​

chave e valores da tag padrão​

Etiquetas personalizadas​

Recurso suportado para tags personalizadas​

Tag serverless compute cargas de trabalho​

Propagação de tags​

Como as tags se propagam para o clustering criado a partir do pool​

Aplicação de tags​

Limitações​

Limites do rótulo GCE​