Definir e usar a variável de ambiente com o script de inicialização

Init scripts têm acesso às variáveis de ambiente presentes em um cluster.

nota

No modo de acesso padrão no Databricks Runtime 19 e acima, apenas um conjunto predefinido de variáveis de ambiente está disponível para init scripts. Outras variáveis que você define em um cluster permanecem disponíveis para o seu código de usuário, incluindo UDFs, mas não estão disponíveis para init scripts. Consulte Limitações de variáveis de ambiente.

variável padrão de ambiente

Databricks define muitas variáveis default que podem ser úteis na lógica init script . O script de inicialização global e com escopo de cluster suporta as seguintes variáveis de ambiente:

DB_CLUSTER_ID: o ID do cluster no qual o script está sendo executado. Consulte a API de clusters.
DB_CONTAINER_IP: o endereço IP privado do contêiner no qual o Spark é executado. O init script é executado dentro desse contêiner. Consulte a API de clusters.
DB_IS_DRIVER: se o script está sendo executado em um nó do driver.
DB_DRIVER_IP: o endereço IP do nó do driver.
DB_INSTANCE_TYPE: o tipo de instância da VM do host.
DB_CLUSTER_NAME: o nome do clusters no qual o script está sendo executado.
DB_IS_JOB_CLUSTERSe o clustering foi criado para executar um Job. Consulte Configurar compute para o trabalho.

Você não pode substituir essas variáveis de ambiente predefinidas.

Definir variável de ambiente personalizada

É possível definir variáveis de ambiente personalizadas, acessíveis a partir do script de inicialização executado no recurso compute , no arquivo de configuração Spark . See variável de ambiente.

O senhor também pode definir variáveis de ambiente usando o campo spark_env_vars na API de criação de clusters ou na API de atualização de clusters.

Use variável de ambiente

O exemplo a seguir usa uma variável de ambiente default para executar parte de um script apenas em um nó de driver:

Bash
echo $DB_IS_DRIVER
if [[ $DB_IS_DRIVER = "TRUE" ]]; then
  <run this part only on driver>
else
  <run this part only on workers>
fi
<run this part on both driver and workers>

Segredos no script de inicialização

Você pode usar qualquer nome de variável válido ao fazer referência a um segredo. O acesso aos segredos referenciados na variável de ambiente é determinado pelas permissões do usuário que configurou o clustering. Os segredos armazenados na variável de ambiente podem ser acessados por todos os usuários do clustering, mas são protegidos da exibição de texto simples.

Consulte Usar um segredo em uma propriedade de configuração ou variável de ambiente do Spark.

variável padrão de ambiente​

Definir variável de ambiente personalizada​

Use variável de ambiente​

Segredos no script de inicialização​

variável padrão de ambiente

Definir variável de ambiente personalizada

Use variável de ambiente

Segredos no script de inicialização