Configurar o ambiente serverless

Este artigo explica como usar o painel serverless lateral Environment de um notebook para configurar dependências, serverless políticas de orçamento, memória e versão do ambiente. Esse painel oferece um único local para gerenciar as configurações do Notebook serverless. As configurações definidas nesse painel só se aplicam quando o Notebook está conectado ao site serverless compute.

Para expandir o painel lateral Environment , clique no botão à direita do Notebook.

Painel de ambiente serverless

Use serverless GPU compute

info

Beta

GPU sem servidor compute está em Beta.

Siga as etapas a seguir para usar a GPU serverless compute em seu notebook Databricks:

Em um notebook, clique no menu suspenso Conectar na parte superior e selecione GPU sem servidor .
Clique no Para abrir o painel lateral Ambiente .
Selecione A10 ou H100 no campo Acelerador .
Selecione "Nenhum" para o ambiente default ou AI v4" para o ambiente AI no campo "Ambiente base" .
Se você selecionou "Nenhum" no campo "Ambiente base" , selecione a versão do ambiente .
Clique em Aplicar e, em seguida, confirme que deseja aplicar o compute de GPU serverless ao seu ambiente de notebook.

Para obter mais detalhes, consulte GPU sem servidor compute.

Use memória alta serverless compute

info

Visualização

Esse recurso está em Public Preview.

Se o senhor se deparar com erros de falta de memória no Notebook, poderá configurar o Notebook para usar um tamanho de memória maior. Essa configuração aumenta o tamanho da memória do REPL usada ao executar o código no Notebook. Isso não afeta o tamanho da memória da sessão do Spark. O uso sem servidor com memória alta tem uma taxa de emissão de DBU mais alta do que a memória padrão.

Na interface do usuário do Notebook, clique no painel lateral Environment (Ambiente) .
Em Memória , selecione Memória alta .
Clique em Aplicar .

Essa configuração também se aplica à tarefa do Notebook Job, que é executada usando as preferências de memória do Notebook. A atualização da preferência de memória no Notebook afeta a execução do próximo trabalho.

Selecione uma política orçamentária serverless

info

Visualização

Esse recurso está em Public Preview.

As políticas de orçamento sem servidor permitem que sua organização aplique tags personalizadas no uso do serverless para atribuição de faturamento granular.

Se o seu workspace usa políticas de orçamento serverless para atribuir o uso do serverless, o senhor pode selecionar a política de orçamento serverless que deseja aplicar ao Notebook. Se um usuário for atribuído a apenas uma política de orçamento serverless, essa política será selecionada por default.

O senhor pode selecionar a política de orçamento serverless depois que o Notebook estiver conectado ao serverless compute usando o painel lateral Environment :

Na interface do usuário do Notebook, clique no painel lateral Environment (Ambiente) .
Em Budget policy (Política de orçamento ), selecione a política de orçamento serverless que deseja aplicar ao Notebook.
Clique em Aplicar .

Painel do ambiente Notebook sem servidor com políticas de orçamento serverless

Quando essa configuração estiver concluída, todo o uso do Notebook herdará as tags personalizadas da política de orçamento do serverless.

nota

Se o Notebook for originário de um repositório Git ou não tiver uma política de orçamentoserverless atribuída, ele terá como padrão a última política de orçamento serverless escolhida quando for anexado a serverless compute.

Selecione uma versão do ambiente

As versões do ambiente permitem que as cargas de trabalho do serverless recebam atualizações independentes do mecanismo sem afetar a compatibilidade do aplicativo. Para ver detalhes sobre cada versão de ambiente, consulte versões de ambiente sem servidor. Databricks recomenda escolher a versão mais recente para obter o recurso mais atualizado do Notebook.

Para selecionar uma versão do ambiente:

Na interface do usuário do Notebook, clique no painel lateral Environment (Ambiente) .
Em Versão do ambiente , selecione uma versão.
Clique em Aplicar .

Adicionar dependências ao Notebook

Como o site serverless não é compatível com as políticas ou o script de inicialização do compute, o senhor deve adicionar dependências personalizadas usando o painel lateral Environment . Você pode adicionar dependências individualmente ou usar um ambiente básico compartilhável para instalar várias dependências.

Para adicionar uma dependência individualmente:

Na interface do usuário do Notebook, clique no painel lateral Environment (Ambiente) .
Na seção Dependências , clique em Adicionar dependência e insira o caminho da dependência no campo. Você pode especificar uma dependência em qualquer formato que seja válido em um arquivo requirements.txt. Python wheel ou projetos Python (por exemplo, o diretório que contém um pyproject.toml ou um setup.py) podem estar localizados em arquivos workspace ou volumes Unity Catalog.
- Se estiver usando um arquivo workspace, o caminho deve ser absoluto e começar com /Workspace/.
- Se estiver usando um arquivo em um volume do Unity Catalog, o caminho deve estar no seguinte formato: /Volumes/<catalog>/<schema>/<volume>/<path>.whl.
Clique em Aplicar . Isso instala as dependências no ambiente virtual do notebook e reinicia o processo do Python.

importante

Não instale o PySpark ou qualquer biblioteca que instale o PySpark como uma dependência do seu notebook serverless. Isso interromperá sua sessão e resultará em um erro. Se isso ocorrer, remova a biblioteca e reinicie seu ambiente.

Para view as dependências instaladas, clique em Installed tab no painel lateral Environments (Ambientes ). A instalação do pip logs para o ambiente do Notebook também está disponível clicando em pip logs na parte inferior do painel.

Adicionar dependências a um ambiente básico

Um ambiente básico é um arquivo YAML armazenado como um arquivo workspace ou em um volume Unity Catalog que especifica dependências de ambiente adicionais. O senhor pode selecionar um dos ambientes básicos do seu workspace no menu Base environment dropdown ou selecionar Custom para usar uma especificação de ambiente personalizada.

Você pode instalar dependências adicionais individualmente sobre um ambiente básico. As dependências instaladas individualmente substituem ou estendem o ambiente básico para esse Notebook.

Para obter instruções de administração do workspace, consulte gerenciar ambientes de base do serverless.

Crie uma especificação de ambiente personalizada

Você pode criar e reutilizar especificações de ambiente personalizadas.

Em um Notebook serverless, selecione uma versão do ambiente e adicione as dependências que deseja instalar.
Clique no ícone do menu kebab na parte inferior do painel do ambiente e clique em Exportar ambiente.
Salve a especificação como um arquivo de espaço de trabalho ou em um volume Unity Catalog.

Para usar sua especificação de ambiente personalizado em um Notebook, selecione Custom no menu Base environment dropdown e, em seguida, use o ícone de pasta re:[Folder icon] para selecionar o arquivo YAML.

Crie utilidades comuns para compartilhar em toda a sua workspace

O exemplo a seguir mostra como armazenar um utilitário comum em um arquivo workspace e adicioná-lo como uma dependência no Notebook serverless:

Crie uma pasta com a estrutura a seguir. Verifique se os consumidores do seu projeto têm acesso adequado ao caminho do arquivo:
Shell
```
helper_utils/
├── helpers/
│   └── __init__.py   # your common functions live here
├── pyproject.toml
```

Preencha pyproject.toml assim:

Python
[project]
name = "common_utils"
version = "0.1.0"

Adicione uma função ao arquivo init.py. Por exemplo:

Python
def greet(name: str) -> str:
    return f"Hello, {name}!"

Na interface do usuário do Notebook, clique no painel lateral Environment (Ambiente) .
Na seção Dependências , clique em Adicionar dependência e insira o caminho do seu arquivo util. Por exemplo: /Workspace/helper_utils.
Clique em Aplicar .

Agora o senhor pode usar a função em seu Notebook:

Python
from helpers import greet
print(greet('world'))

Isso resulta como:

Hello, world!

Reset as dependências do ambiente

Se o Notebook estiver conectado ao site serverless compute, o site Databricks armazena automaticamente em cache o conteúdo do ambiente virtual do Notebook. Isso significa que, em geral, o senhor não precisa reinstalar as dependências do Python especificadas no painel lateral Environment ao abrir um Notebook existente, mesmo que ele tenha sido desconectado devido à inatividade.

Python O cache de ambiente virtual também se aplica ao Job. Quando um trabalho é executado, qualquer tarefa do trabalho que compartilhe o mesmo conjunto de dependências que uma tarefa concluída nessa execução é mais rápida, pois as dependências necessárias já estão disponíveis.

nota

Se o senhor alterar a implementação de um pacote Python personalizado usado em um trabalho no site serverless, também deverá atualizar o número da versão para que o trabalho possa pegar a implementação mais recente.

Para limpar o cache do ambiente e realizar uma nova instalação das dependências especificadas no painel lateral Ambiente de um Notebook anexado a serverless compute, clique na seta ao lado de Aplicar e, em seguida, clique emReset para definir como padrão .

Se o senhor instalar um pacote que interrompa ou altere o ambiente principal do Notebook ou do site Apache Spark, remova o pacote problemático e, em seguida, redefina o ambiente. Iniciar uma nova sessão não limpa todo o cache do ambiente.

Configure os repositórios default Python pacote

Os administradores do workspace podem configurar repositórios pacote privados ou autenticados dentro do workspace como a configuração default pip para serverless Notebook e serverless Job. Isso permite que os usuários instalem o pacote a partir dos repositórios internos Python sem definir explicitamente index-url ou extra-index-url.

Para obter instruções, os administradores do site workspace podem consultar Configure default Python pacote repositories.

Configurar o ambiente para a tarefa de trabalho

Para tipos de tarefas como Notebook, script Python , Python wheel, JAR ou tarefa dbt , as dependências da biblioteca são herdadas da versão do ambiente serverless . Para view a lista de bibliotecas instaladas, consulte a seção Bibliotecas Python instaladas ou Bibliotecas Java e Scala instaladas da versão do ambiente que você está usando. Se uma tarefa exigir uma biblioteca que não esteja instalada, você poderá instalá-la a partir dos arquivosworkspace, dos volumes Unity Catalog ou dos repositórios de pacotes públicos.

Para notebooks com um ambiente existente, você pode executar a tarefa usando o ambiente do notebook ou substituí-lo selecionando um ambiente em nível de tarefa.

info

Beta

O uso de compute serverless para tarefas JAR está em versão beta.

Para adicionar uma biblioteca quando o senhor criar ou editar uma tarefa de trabalho:

No menu Environment and library (Ambiente e biblioteca) dropdown, clique em ao lado do ambiente padrão ou clique em + Add new environment (Adicionar novo ambiente ).
Selecione a versão do ambiente no menu suspenso Versão do ambiente . Consulte as versões do ambiente sem servidor. Databricks recomenda escolher a versão mais recente para obter o recurso mais atualizado.
Na caixa de diálogo Configurar ambiente , clique em + Adicionar biblioteca .
Selecione o tipo de dependência no menu dropdown em biblioteca .
Na caixa de texto File Path (Caminho do arquivo ), digite o caminho para a biblioteca.

Para um Python wheel em um arquivo workspace, o caminho deve ser absoluto e começar com /Workspace/.
Para um Python wheel em um volume Unity Catalog, o caminho deve ser /Volumes/<catalog>/<schema>/<volume>/<path>.whl.
Para um arquivo requirements.txt, selecione PyPI e insira -r /path/to/requirements.txt.

Clique em Confirm (Confirmar ) ou + Add library (Adicionar biblioteca ) para adicionar outra biblioteca.
Se estiver adicionando uma tarefa, clique em Create task (Criar tarefa ). Se estiver editando uma tarefa, clique em Save task (Salvar tarefa ).

Use serverless GPU compute​

Use memória alta serverless compute​

Selecione uma política orçamentária serverless​

Selecione uma versão do ambiente​

Adicionar dependências ao Notebook​

Adicionar dependências a um ambiente básico​

Crie uma especificação de ambiente personalizada​

Crie utilidades comuns para compartilhar em toda a sua workspace​

Reset as dependências do ambiente​

Configure os repositórios default Python pacote​

Configurar o ambiente para a tarefa de trabalho​

Use serverless GPU compute

Use memória alta serverless compute

Selecione uma política orçamentária serverless

Selecione uma versão do ambiente

Adicionar dependências ao Notebook

Adicionar dependências a um ambiente básico

Crie uma especificação de ambiente personalizada

Crie utilidades comuns para compartilhar em toda a sua workspace

Reset as dependências do ambiente

Configure os repositórios default Python pacote

Configurar o ambiente para a tarefa de trabalho