Uso de atributos usando tags
Este artigo explica como usar tags personalizadas e default para atribuir cargas de trabalho a espaços de trabalho, equipes, projetos e usuários específicos.
Para monitorar o custo e atribuir com precisão o uso do Databricks às unidades de negócios e equipes da sua organização (para estornos, por exemplo), o senhor pode adicionar tags personalizadas ao espaço de trabalho e ao recurso compute. Databricks recomenda o uso de tabelas do sistema para view dados de uso. Consulte a referência da tabela do sistema de uso faturável. Observação : os dados das tags podem ser replicados globalmente. Dessa forma, não use nomes ou valores de tags que possam comprometer a segurança do seu recurso. Por exemplo, não use nomes de tags que contenham informações pessoais ou confidenciais.
O gráfico de Databricks uso faturável do no account console pode agregar o uso por tags individuais. Os downloads dos relatórios de uso faturável CSV da mesma página também incluem default e tags personalizadas. As tags também se propagam para o rótulo GKE e GCE.
Tags objetos e recurso
O senhor pode adicionar tags personalizadas para os seguintes objetos gerenciar por Databricks:
Objeto | Interface de marcação (UI) | Interface de marcação (API) |
---|---|---|
Pool | UI do pool no site Databricks workspace | |
Para todos os fins e para o trabalho compute | computar a UI no site Databricks workspace | |
Armazém SQL | SQL warehouse UI no site Databricks workspace |
Não atribua uma tag personalizada com o endereço key Name
a um clustering. Cada clustering tem uma tag Name
cujo valor é definido por Databricks. Se o senhor alterar o valor associado a key Name
, o clustering não poderá mais ser rastreado por Databricks. Como consequência, o clustering pode não ser encerrado depois de se tornar parado e continuará a incorrer em custos de uso.
tags padrão
Databricks adiciona as seguintes tags default a compute para todos os fins:
Etiqueta key | Valor |
---|---|
| Valor constante: |
| Databricks ID interna do clustering |
| Nome do clustering |
| Nome de usuário (endereçoemail ) do usuário que criou o clustering |
No Job clustering, o site Databricks também aplica as seguintes tags default:
Etiqueta key | Valor |
---|---|
| Nome do Job |
| ID do Job |
Databricks adiciona as seguintes tags default a todo o pool:
Etiqueta key | Valor |
---|---|
| Valor constante: |
| ID interno do Databricks do usuário que criou o pool |
| ID interna do pool do Databricks |
Tag serverless compute cargas de trabalho
Visualização
Esse recurso está em Public Preview.
Para atribuir o uso do serverless compute a usuários, grupos ou projetos, o senhor pode usar políticas de orçamento. Quando uma política de orçamento é atribuída a um usuário, seu uso do serverless é automaticamente marcado com as tags da política. Consulte Atributo serverless uso com políticas orçamentárias.
Propagação de tags
As tags clustering e pool se propagam de três maneiras diferentes que o senhor pode usar para agregar custos:
- Tags nos relatórios DBU: As tags se propagam para a tabela do sistema de uso faturável logs e para os relatórios de usoDBU nos relatórios de downloads.
- Rótulo do GKE (Kubernetes) para cada pod : As tags se propagam para o rótulo nos pods do GKE. Isso permite que o senhor use a medição de uso do GKE para atribuir custos a todos os recursos do Databricks compute .
- Rótulo do GCE para cada VM e seus discos persistentes : As tags se propagam para o rótulo no recurso GCE, como a VM e seus discos persistentes. Isso permite que o senhor use a medição de uso do GCE para atribuir custos, o que é mais preciso do que o rótulo GKE para agregação dos custos do Google Cloud para todos os Databricks compute recurso. A chave e os valores da tag são transformados para se adequarem aos limites de formato do rótulo GCE.
Como as tags se propagam para o clustering criado a partir do pool
As tags se propagam para as instâncias de nós de forma diferente, dependendo se um clustering foi criado ou não a partir de um pool.
- Se um clustering não for criado a partir de um pool, suas tags se propagam como esperado para as instâncias de nós.
- Se um clustering for criado a partir de um pool, suas instâncias herdarão as tags pool e a tag Cluster. As tags do poolsão usadas diretamente para dados de uso da VM somente para as VMs paradas.
- Se houver um conflito de nome de tag, as tags Databricks default têm precedência sobre as tags personalizadas e as tags pool têm precedência sobre a Cluster Tag.
Limitações
- A chave e os valores da tag só podem conter letras, espaços, números ou os caracteres
+
,-
,=
,.
,_
,:
,/
,@
. As tags que contêm outros caracteres são inválidas. - Se o senhor alterar os nomes ou valores das chaves de tag, essas alterações serão aplicadas somente após a reinicialização do clustering ou a expansão do site pool.
- O número máximo personalizado de tags que podem se propagar para o rótulo GCE é 54.
- O comprimento máximo da chave e dos valores do rótulo GCE é de 63 caracteres.
- A propagação do rótulo pode ser atrasada devido aos limites de taxa da GCE API para o projeto. O senhor pode resolver isso aumentando os limites de taxa da API do GCE para o projeto Google Cloud.
Práticas recomendadas de marcação
- Como as tags podem ser inseridas manualmente, sua organização deve padronizar seu par key-value. Databricks recomenda o desenvolvimento de uma política comercial para key e a nomeação de valores que o senhor possa compartilhar com todos os usuários.
- Todos os recursos devem ser marcados com uma chave geral que atribua o uso a uma unidade de negócios ou projeto. Por exemplo, um recurso do Job compute criado pela equipe financeira para seu orçamento anual pode incluir as tags
business-unit:finance
eproject:annual-budget
. - Para percepções mais granulares, atribua tags usando uma chave de alta especificidade. Por exemplo, o senhor pode criar chaves com base em funções, produto, serviço ou clientes.
- Quando aplicável, os administradores do workspace devem aplicar as tags usando as políticas do compute e as políticas de orçamento. Consulte Aplicação de tags personalizadas.
Limites do rótulo GCE
O rótulo GKE pode usar diretamente a chave e os valores da tag Databricks.
Para o rótulo GCE, há limitações:
- A chave e os valores devem consistir apenas em letras minúsculas, caracteres numéricos, sublinhado e traços.
- O comprimento máximo da chave e dos valores do rótulo GCE é de 63 caracteres.
- O número máximo de tags que podem se propagar para o rótulo GCE é 54.
Para estar em conformidade com as regras de formato do GCE, as tags são transformadas antes de se tornarem chaves e valores do rótulo do GCE. Se houver duplicatas após as transformações, o par de chave e valores que aparecem mais tarde (mais abaixo) nas definições de tag são os que persistem.
A tabela a seguir compara o GKE e o GCE default Cluster Tag.
GKE rótulo key | Valor do rótulo GKE | Rótulo GCE key | Valor do rótulo GCE |
---|---|---|---|
|
|
|
|
| ID da Databricks |
| ID da Databricks |
| Nome definido pelo cliente |
| Nome definido pelo cliente em minúsculas. Os caracteres são removidos se não forem letras, números, sublinhados ou traços. Por exemplo, |
| Endereço do usuário criador email com |
| Endereço do usuário criador email com |
A tabela a seguir compara default pool as tags das instâncias GKE e GCE:
GKE rótulo key | Valor do rótulo GKE | Rótulo GCE key | Valor do rótulo GCE |
---|---|---|---|
| ID da Databricks |
| ID da Databricks |
| ID da Databricks |
| ID da Databricks |
A tabela a seguir compara o GKE e o GCE para todas as outras tags (tags personalizadas):
GKE rótulo key | Valor do rótulo GKE | Rótulo GCE key | Valor do rótulo GCE |
---|---|---|---|
Definido pelo cliente key | Valor definido pelo cliente | Definido pelo cliente key em letras minúsculas. Os caracteres são removidos se não forem letras, números, sublinhados ou traços. Por exemplo, | Valor definido pelo cliente em minúsculas. Os caracteres são removidos se não forem letras, números, sublinhados ou traços. Por exemplo, |