Pular para o conteúdo principal

Use tags para atribuir e rastrear o uso

Este artigo explica como usar tags para atribuir o uso do compute a espaços de trabalho, equipes, projetos ou usuários específicos para apoiar o acompanhamento de custos e o orçamento.

Há dois tipos de tags:

  • tags padrão: Aplicadas automaticamente por Databricks ao recurso implantado na nuvem. Eles fornecem metadados básicos como fornecedor, ID de clustering e criador.
  • Tags personalizadas: Tags definidas pelo usuário que podem ser adicionadas às cargas de trabalho do compute recurso e do serverless. Isso permite o acompanhamento granular, a geração de relatórios e a elaboração de orçamentos.
atenção

Os dados das tags podem ser replicados globalmente. Não use nomes ou valores de tags que possam comprometer a segurança de seu recurso. Por exemplo, não use nomes de tags que contenham informações pessoais ou confidenciais.

tags padrão

Databricks adiciona automaticamente as tags default ao compute recurso implantado em sua nuvem account. Essas tags atribuem o uso a Databricks e fornecem informações básicas sobre o recurso, como seu nome, ID e criador.

As tags padrão e a chave de tag se propagam automaticamente para o rótulo no recurso GCE, como a VM e seus discos persistentes.

chave e valores da tag padrão

Databricks adiciona as seguintes tags default a compute recurso:

Etiqueta key

Valor

Vendor

Valor constante: Databricks

ClusterId

Databricks ID interna do clustering

ClusterName

Nome do clustering

Creator

Nome de usuário (endereçoemail ) do usuário que criou o clustering

RunName

Job name (só se propaga no Job compute)

JobId

Job ID (só se propaga no Job compute)

Para a chave de tag e os valores que são propagados para o recurso GCE, as letras são convertidas em minúsculas. Os caracteres são removidos se não forem letras, números, sublinhados ou traços. O endereço email do criador com @ é substituído por _at_. Por exemplo, X+Y@databricks.com se torna xy_at_databricks.com.

Databricks adiciona as seguintes tags default ao pool e o recurso compute criado pelo pool.

Etiqueta key

Valor

Vendor

Valor constante: Databricks

DatabricksInstancePoolCreatorId

ID interno do Databricks do usuário que criou o pool

DatabricksInstancePoolId

ID interna do pool do Databricks

Etiquetas personalizadas

As tags personalizadas permitem que o senhor atribua o uso do compute a equipes, projetos ou centros de custo específicos com mais granularidade do que as tags do default. Essas tags são aplicadas por usuários ou administradores e se propagam tanto para o uso do seu account logs quanto para o recurso de nuvem aplicável. Essas tags também são usadas para criar e monitorar orçamentos em seu site Databricks account.

Recurso suportado para tags personalizadas

O senhor pode adicionar tags personalizadas para os seguintes objetos gerenciar por Databricks:

Objeto

Interface de marcação (UI)

Interface de marcação (API)

Pool

UI do pool no site Databricks workspace

API do pool de instâncias

Para todos os fins e para o trabalho compute

computar a UI no site Databricks workspace

agrupamento API

Armazém SQL

SQL warehouse UI no site Databricks workspace

API de armazéns

As tags personalizadas aparecem em letras minúsculas no GCE logs. Os caracteres são removidos se não forem letras, números, sublinhados ou traços. Por exemplo, My Key se torna mykey e My.Val se torna myval.

atenção

Não atribua uma tag personalizada com o endereço key Name a um clustering. Cada clustering tem uma tag Name cujo valor é definido por Databricks. Se o senhor alterar o valor associado a key Name, o clustering não poderá mais ser rastreado por Databricks. Como consequência, o clustering pode não ser encerrado depois de se tornar parado e continuará a incorrer em custos de uso.

Tag serverless compute cargas de trabalho

info

Visualização

Esse recurso está em Public Preview.

Para atribuir o uso do serverless compute a usuários, grupos ou projetos, o senhor pode usar as políticas de orçamento do serverless. Quando um usuário recebe uma política de orçamento do serverless, seu uso do serverless é automaticamente marcado com as tags personalizadas da política. As políticas de orçamento sem servidor podem ser aplicadas a serverless Notebook, Job, pipeline e endpoint de modelo de serviço.

nota

O compute uso do serverless é registrado na account tabela do sistema de uso faturável do seu. Os DBU relatórios de serverless uso do legado não incluem as serverless tags de política orçamentária usage ou.

Consulte Uso de atributos com as políticas de orçamento do serverless.

Propagação de tags

O senhor pode usar o clustering e as tags pool para agregar e analisar os custos. Essas tags se propagam das seguintes maneiras:

Como as tags se propagam para o clustering criado a partir do pool

As tags se propagam para as instâncias de nós de forma diferente, dependendo se um clustering foi criado ou não a partir de um pool.

  • Se um clustering não for criado a partir de um pool, suas tags se propagam como esperado para as instâncias de nós.
  • Se um clustering for criado a partir de um pool, suas instâncias herdarão as tags pool e a tag Cluster. As tags do pool são usadas diretamente para os dados de uso da VM somente para as VMs paradas.
  • Se houver um conflito de nome de tag, as tags Databricks default têm precedência sobre as tags personalizadas e as tags pool têm precedência sobre a Cluster Tag.

Aplicação de tags

Para impor o uso de tags personalizadas específicas, o senhor pode usar as políticas do site compute. Consulte Aplicação de tags personalizadas. Para aplicar tags personalizadas nas cargas de trabalho serverless compute , use as políticas de orçamentoserverless.

Limitações

  • A chave e os valores da tag só podem conter letras, espaços, números ou os caracteres +, -, =, ., _, :, /, @. As tags que contêm outros caracteres são inválidas.
  • Se o senhor alterar os nomes ou valores das chaves de tag, essas alterações serão aplicadas somente após a reinicialização do clustering ou a expansão do site pool.
  • O número máximo personalizado de tags que podem se propagar para o rótulo GCE é 54.
  • O comprimento máximo da chave e dos valores do rótulo GCE é de 63 caracteres.
  • A propagação do rótulo pode ser atrasada devido aos limites de taxa da GCE API para o projeto. O senhor pode resolver isso aumentando os limites de taxa da API do GCE para o projeto Google Cloud.

Limites do rótulo GCE

Para o rótulo GCE, há limitações:

  • A chave e os valores devem consistir apenas em letras minúsculas, caracteres numéricos, sublinhado e traços.
  • O comprimento máximo da chave e dos valores do rótulo GCE é de 63 caracteres.
  • O número máximo de tags que podem se propagar para o rótulo GCE é 54.

Para estar em conformidade com as regras de formato do GCE, as tags são transformadas antes de se tornarem chaves e valores do rótulo do GCE. Se houver duplicatas após as transformações, o par de chave e valores que aparecem mais tarde (mais abaixo) nas definições de tag são os que persistem.