Pular para o conteúdo principal

Referência de configuração de pool

Este artigo descreve as configurações disponíveis ao criar um pool usando a UI. Para saber como usar o Databricks CLI para criar um pool, consulte Databricks CLI comando. Para saber como usar o REST API para criar um pool, consulte o Instance pool API.

tamanho da piscina

Ao criar um pool, para controlar seu tamanho, o senhor pode definir as instâncias mínimas de parada e a capacidade máxima. Não há suporte para o encerramento automático de instâncias parado no pool.

Instâncias mínimas de parada

O número mínimo de instâncias que o pool mantém parado. Essas instâncias não são encerradas, independentemente das configurações de encerramento automático. Se um clustering consumir instâncias paradas do pool, Databricks provisionamento de instâncias adicionais para manter o mínimo.

Tipos de instância

Um pool consiste em instâncias paradas mantidas prontas para novos clusters e instâncias em uso por clusters em execução. Todas essas instâncias são do mesmo tipo de provedor de instância, selecionado ao criar um pool.

O tipo de instância de um pool não pode ser editado. clustering anexados a um pool usam o mesmo tipo de instância para o driver e os nós do worker. Diferentes famílias de tipos de instância se adaptam a diferentes casos de uso, como cargas de trabalho com uso intensivo de memória ou compute.

A Databricks sempre fornece um aviso de depreciação de um ano antes de deixar de oferecer suporte a um tipo de instância.

Versão pré-carregada do Databricks Runtime

O senhor pode acelerar o lançamento de clusters selecionando uma versão do Databricks Runtime para ser carregada em instâncias parado no pool. Se um usuário selecionar esse tempo de execução ao criar um clustering apoiado pelo pool, esse clustering será iniciado ainda mais rapidamente do que um clustering apoiado pelo poolque não usa uma versão pré-carregada do Databricks Runtime.

Definir essa opção como None torna os lançamentos de clustering mais lentos, pois faz com que a versão Databricks Runtime seja download sob demanda para parear instâncias no pool. Quando o clustering libera as instâncias no pool, a versão Databricks Runtime permanece em cache nessas instâncias. As próximas operações de criação de clustering que usarem a mesma versão do Databricks Runtime poderão se beneficiar desse comportamento de cache, mas isso não é garantido.

etiquetas de piscina

As tags de pool permitem que o senhor monitore o custo do recurso de nuvem usado por vários grupos em sua organização.

O gráfico de Databricks uso faturável do no account console pode agregar o uso por tags individuais. Os downloads dos relatórios de uso faturável CSV da mesma página também incluem default e tags personalizadas. As tags também se propagam para o rótulo GKE e GCE.

Por conveniência, o site Databricks aplica três tags default a cada pool: Vendor, DatabricksInstancePoolId e DatabricksInstancePoolCreatorId. O senhor também pode adicionar tags personalizadas ao criar um pool. Você pode adicionar até 43 tags personalizadas.

Etiquetas personalizadas

Para adicionar outras tags ao site pool, navegue até a guia tab na parte inferior da página Criar pool . Clique no botão + Add (Adicionar ) e insira o par key-value.

O clustering apoiado em pool herda default e as tags personalizadas da configuração pool. Para obter informações detalhadas sobre como as tags pool e a Cluster Tag funcionam juntas, consulte Usar tags para atribuir e rastrear o uso.

Configurar a zona de disponibilidade

O senhor pode configurar a zona de disponibilidade do poolao criar o pool usando o pool de instâncias API. Esse é um campo opcional. Se não for especificado, o pool usa uma zona default.

O senhor não pode atualizar a zona de disponibilidade de um pool depois que o pool for iniciado. Se quiser que seu pool use uma zona de disponibilidade diferente, o senhor deve criar um novo pool.

Para definir a zona de disponibilidade, adicione um atributo zone_id ao objeto gcp_attributes. Por exemplo:

JSON
"gcp_attributes": {
"zone_id": "us-central1-a"
}
nota

A zona de disponibilidade fornecida deve estar na mesma região que a sua Databricks workspace.

Configurações zonais conflitantes

Se o recurso compute que o senhor anexar a uma instância pool estiver configurado para usar uma zona de disponibilidade diferente da instância pool, as configurações do recurso compute serão ignoradas e ele herdará a configuração zonal da instância pool.

O driver do recurso compute herda a preferência zonal ou multizonal da instância do driver pool e qualquer executor herda a preferência zonal ou multizonal da instância executor pool.