Quais arquivos posso referenciar em um init script?

O suporte para fazer referência a outros arquivos em um init script depende de onde os arquivos referenciados estão armazenados. Este artigo descreve esse comportamento e fornece recomendações.

A Databricks recomenda gerenciar todos init script como com escopo clustersde init script.

Qual identidade é usada para init script execução?

No modo de acesso de usuário único, é utilizada a identidade do titular atribuído (um usuário ou entidade de serviço).

No modo de acesso compartilhado ou no modo de acesso compartilhado sem isolamento, init script usa a identidade do proprietário clusters .

Nem todos os locais de armazenamento do script de inicialização são compatíveis com todas as versões do Databricks Runtime e modos de acesso. Consulte Onde o script de inicialização pode ser instalado?

Posso fazer referência a arquivos em volumes Unity Catalog a partir init script?

Você pode fazer referência a bibliotecas e init script armazenados em volumes Unity Catalog a partir init script armazenado em volumes Unity Catalog .

Importante

As credenciais necessárias para acessar outros arquivos armazenados nos volumes Unity Catalog são disponibilizadas apenas no init script armazenado nos volumes Unity Catalog . Você não pode fazer referência a nenhum arquivo nos volumes Unity Catalog a partir init script configurado em outros locais.

Para clusters com modo de acesso compartilhado, apenas o init script configurado precisa ser adicionado à lista de permissões. O acesso a outros arquivos referenciados no init script é controlado pelo Unity Catalog.

Posso fazer referência a arquivos do espaço de trabalho do init script?

No Databricks Runtime 11.3 LTS e acima, você pode fazer referência a outros arquivos workspace , como biblioteca, arquivos de configuração ou scripts de shell do init script armazenado com arquivos workspace .

Posso fazer referência a arquivos no armazenamento de objetos clouds a partir init script?

Você pode fazer referência a bibliotecas e init script armazenados no armazenamento de objetos clouds a partir init script.

Para clusters com modo de acesso compartilhado, apenas o init script configurado precisa ser adicionado à lista de permissões. O acesso a outros arquivos referenciados no init script é determinado pelo acesso configurado ao armazenamento de objetos clouds .

Databricks recomenda usar instance profile para gerenciar o acesso a bibliotecas e init script armazenados no S3. Use a seguinte documentação no link de referência cruzada para concluir esta configuração:

  1. Crie uma IAM role com permissões de leitura e lista nos buckets desejados. Consulte Tutorial: Configurar o acesso ao S3 com um instance profile.

  2. Inicie clusters com o instance profile. Consulte instance profile.