Definir e usar a variável de ambiente com o script de inicialização
O script init tem acesso a todas as variáveis de ambiente presentes em um cluster. Databricks define muitas variáveis default que podem ser úteis na lógica init script.
variáveis de ambiente definidas na configuração Spark estão disponíveis para o script de inicialização. Ver variável de ambiente.
Que variáveis de ambiente são expostas ao init script pelo default?
Os init scripts globais e com escopo de cluster são compatíveis com as seguintes variáveis de ambiente:
DB_CLUSTER_ID
: o ID do cluster no qual o script está sendo executado. Consulte a API de clusters.DB_CONTAINER_IP
: o endereço IP privado do contêiner no qual o Spark é executado. O init script é executado dentro desse contêiner. Consulte a API de clusters.DB_IS_DRIVER
: se o script está sendo executado em um nó do driver.DB_DRIVER_IP
: o endereço IP do nó do driver.DB_INSTANCE_TYPE
: o tipo de instância da VM do host.DB_CLUSTER_NAME
: o nome do clusters no qual o script está sendo executado.DB_IS_JOB_CLUSTER
Se o clustering foi criado para executar um Job. Consulte Configurar compute para o trabalho.
Por exemplo, se você deseja executar parte de um script somente em um nó de driver, você pode escrever um script como:
echo $DB_IS_DRIVER
if [[ $DB_IS_DRIVER = "TRUE" ]]; then
<run this part only on driver>
else
<run this part only on workers>
fi
<run this part on both driver and workers>
Usar segredos no script de inicialização
Você pode usar qualquer nome de variável válido ao fazer referência a um segredo. O acesso aos segredos referenciados na variável de ambiente é determinado pelas permissões do usuário que configurou o clustering. Os segredos armazenados na variável de ambiente podem ser acessados por todos os usuários do clustering, mas são protegidos da exibição de texto simples.
Consulte Usar um segredo em uma propriedade de configuração ou variável de ambiente do Spark.