Pular para o conteúdo principal

Uso de atributos usando tags

Este artigo explica como usar tags personalizadas e default para atribuir cargas de trabalho a espaços de trabalho, equipes, projetos e usuários específicos.

Para monitorar o custo e atribuir com precisão o uso do Databricks às unidades de negócios e equipes da sua organização (para estornos, por exemplo), o senhor pode adicionar tags personalizadas ao espaço de trabalho e ao recurso compute. Databricks recomenda o uso de tabelas do sistema para view dados de uso. Consulte a referência da tabela do sistema de uso faturável. Observação : os dados das tags podem ser replicados globalmente. Dessa forma, não use nomes ou valores de tags que possam comprometer a segurança do seu recurso. Por exemplo, não use nomes de tags que contenham informações pessoais ou confidenciais.

O gráfico de Databricks uso faturável do no account console pode agregar o uso por tags individuais. Os downloads dos relatórios de uso faturável CSV da mesma página também incluem default e tags personalizadas. As tags também se propagam para o rótulo GKE e GCE.

Tags objetos e recurso

O senhor pode adicionar tags personalizadas para os seguintes objetos gerenciar por Databricks:

Objeto

Interface de marcação (UI)

Interface de marcação (API)

Pool

UI do pool no site Databricks workspace

API do pool de instâncias

Para todos os fins e para o trabalho compute

computar a UI no site Databricks workspace

agrupamento API

Armazém SQL

SQL warehouse UI no site Databricks workspace

API de armazéns

atenção

Não atribua uma tag personalizada com o endereço key Name a um clustering. Cada clustering tem uma tag Name cujo valor é definido por Databricks. Se o senhor alterar o valor associado a key Name, o clustering não poderá mais ser rastreado por Databricks. Como consequência, o clustering pode não ser encerrado depois de se tornar parado e continuará a incorrer em custos de uso.

tags padrão

Databricks adiciona as seguintes tags default a compute para todos os fins:

Etiqueta key

Valor

Vendor

Valor constante: Databricks

ClusterId

Databricks ID interna do clustering

ClusterName

Nome do clustering

Creator

Nome de usuário (endereçoemail ) do usuário que criou o clustering

No Job clustering, o site Databricks também aplica as seguintes tags default:

Etiqueta key

Valor

RunName

Nome do Job

JobId

ID do Job

Databricks adiciona as seguintes tags default a todo o pool:

Etiqueta key

Valor

Vendor

Valor constante: Databricks

DatabricksInstancePoolCreatorId

ID interno do Databricks do usuário que criou o pool

DatabricksInstancePoolId

ID interna do pool do Databricks

Tag serverless compute cargas de trabalho

info

Visualização

Esse recurso está em Public Preview.

Para atribuir o uso do serverless compute a usuários, grupos ou projetos, o senhor pode usar políticas de orçamento. Quando uma política de orçamento é atribuída a um usuário, seu uso do serverless é automaticamente marcado com as tags da política. Consulte Atributo serverless uso com políticas orçamentárias.

Propagação de tags

As tags clustering e pool se propagam de três maneiras diferentes que o senhor pode usar para agregar custos:

Como as tags se propagam para o clustering criado a partir do pool

As tags se propagam para as instâncias de nós de forma diferente, dependendo se um clustering foi criado ou não a partir de um pool.

  • Se um clustering não for criado a partir de um pool, suas tags se propagam como esperado para as instâncias de nós.
  • Se um clustering for criado a partir de um pool, suas instâncias herdarão as tags pool e a tag Cluster. As tags do poolsão usadas diretamente para dados de uso da VM somente para as VMs paradas.
  • Se houver um conflito de nome de tag, as tags Databricks default têm precedência sobre as tags personalizadas e as tags pool têm precedência sobre a Cluster Tag.

agrupamento e propagação de tags pool

Limitações

  • A chave e os valores da tag só podem conter letras, espaços, números ou os caracteres +, -, =, ., _, :, /, @. As tags que contêm outros caracteres são inválidas.
  • Se o senhor alterar os nomes ou valores das chaves de tag, essas alterações serão aplicadas somente após a reinicialização do clustering ou a expansão do site pool.
  • O número máximo personalizado de tags que podem se propagar para o rótulo GCE é 54.
  • O comprimento máximo da chave e dos valores do rótulo GCE é de 63 caracteres.
  • A propagação do rótulo pode ser atrasada devido aos limites de taxa da GCE API para o projeto. O senhor pode resolver isso aumentando os limites de taxa da API do GCE para o projeto Google Cloud.

Práticas recomendadas de marcação

  • Como as tags podem ser inseridas manualmente, sua organização deve padronizar seu par key-value. Databricks recomenda o desenvolvimento de uma política comercial para key e a nomeação de valores que o senhor possa compartilhar com todos os usuários.
  • Todos os recursos devem ser marcados com uma chave geral que atribua o uso a uma unidade de negócios ou projeto. Por exemplo, um recurso do Job compute criado pela equipe financeira para seu orçamento anual pode incluir as tags business-unit:finance e project:annual-budget.
  • Para percepções mais granulares, atribua tags usando uma chave de alta especificidade. Por exemplo, o senhor pode criar chaves com base em funções, produto, serviço ou clientes.
  • Quando aplicável, os administradores do workspace devem aplicar as tags usando as políticas do compute e as políticas de orçamento. Consulte Aplicação de tags personalizadas.

Limites do rótulo GCE

O rótulo GKE pode usar diretamente a chave e os valores da tag Databricks.

Para o rótulo GCE, há limitações:

  • A chave e os valores devem consistir apenas em letras minúsculas, caracteres numéricos, sublinhado e traços.
  • O comprimento máximo da chave e dos valores do rótulo GCE é de 63 caracteres.
  • O número máximo de tags que podem se propagar para o rótulo GCE é 54.

Para estar em conformidade com as regras de formato do GCE, as tags são transformadas antes de se tornarem chaves e valores do rótulo do GCE. Se houver duplicatas após as transformações, o par de chave e valores que aparecem mais tarde (mais abaixo) nas definições de tag são os que persistem.

A tabela a seguir compara o GKE e o GCE default Cluster Tag.

GKE rótulo key

Valor do rótulo GKE

Rótulo GCE key

Valor do rótulo GCE

Vendor

Databricks

vendor

databricks

ClusterId

ID da Databricks

clusterId

ID da Databricks

ClusterName

Nome definido pelo cliente

clustername

Nome definido pelo cliente em minúsculas. Os caracteres são removidos se não forem letras, números, sublinhados ou traços. Por exemplo, My Cluster se torna mycluster.

Creator

Endereço do usuário criador email com @ substituído por _at_. Por exemplo, user123_at_databricks.com.

creator

Endereço do usuário criador email com @ substituído por _at_. As letras estão em minúsculas. Os caracteres são removidos se não forem letras, números, sublinhados ou traços. Por exemplo, X+Y@databricks.com se torna xy_at_databricks.com.

A tabela a seguir compara default pool as tags das instâncias GKE e GCE:

GKE rótulo key

Valor do rótulo GKE

Rótulo GCE key

Valor do rótulo GCE

DatabricksInstancePoolId

ID da Databricks

databricksinstancepoolid

ID da Databricks

DatabricksInstancePoolCreatorId

ID da Databricks

databricksinstancepoolcreatorid

ID da Databricks

A tabela a seguir compara o GKE e o GCE para todas as outras tags (tags personalizadas):

GKE rótulo key

Valor do rótulo GKE

Rótulo GCE key

Valor do rótulo GCE

Definido pelo cliente key

Valor definido pelo cliente

Definido pelo cliente key em letras minúsculas. Os caracteres são removidos se não forem letras, números, sublinhados ou traços. Por exemplo, My Key se torna mykey.

Valor definido pelo cliente em minúsculas. Os caracteres são removidos se não forem letras, números, sublinhados ou traços. Por exemplo, My.Val se torna myval.