Configure seu projeto Databricks usando a extensão Databricks para o Visual Studio Code

A extensão Databricks para o Visual Studio Code oferece uma configuração view no painel da extensão que permite configurar e atualizar facilmente as definições do projeto Databricks. Esses recursos incluem um seletor de implantação de destino workspace, configuração fácil de autenticação e compute, sincronização de pastas workspace e passos simples para ativar o ambiente virtual Python necessário para a depuração.

A configuração view na extensão Databricks para o Visual Studio Code está disponível depois que o senhor criar ou migrar um projeto para um projeto Databricks. Consulte Criar um novo projeto Databricks.

Observação

As versões anteriores da extensão Databricks para Visual Studio Code definiam as configurações em um arquivo de projeto JSON e as variáveis de ambiente eram definidas no terminal. Na versão de lançamento, a configuração do projeto e do ambiente é encontrada nos arquivos databricks.yml e databricks.env.

Se o seu projeto for um Databricks ativo Bundle, a UI de extensão Databricks também fornecerá um Bundle recurso Explorer e uma visualização Bundle Variables para gerenciar o recurso e as variáveis do bundle. Consulte Databricks ativo Recurso de extensão de pacotes.

Alterar o espaço de trabalho de implantação de destino

Para selecionar ou alternar o destino da implantação do projeto Databricks (por exemplo, para alternar de um destino dev para um destino prod):

  1. Em Configuration (Configuração ) view do painel de extensão Databricks, clique no ícone de engrenagem(Select a Databricks ativo Bundle target) associado a Target.

    Selecione um Databricks ativo Bundle target
  2. Na paleta de comandos, selecione o destino de implementação desejado.

Depois que um alvo é configurado, o Host e a implementação Mode é exibido. Para obter informações sobre os modos de implementação de Databricks ativo Bundles, consulte Databricks ativo Bundle deployment modes.

O host workspace pode ser alterado modificando a configuração de destino workspace no arquivo de configuração databricks.yml associado ao projeto. Veja os alvos.

Observação

A seguinte extensão Databricks para o recurso Visual Studio Code só está disponível quando o modo de implantação de destino é desenvolvimento:

  • Use o desenvolvimento em anexo cluster para o trabalho em pacote

  • Sincronizar arquivos da pasta workspace

  • Selecione um cluster de desenvolvimento interativo

Configurar o perfil do Databricks para o projeto

Quando o senhor cria um projeto Databricks ou migra um projeto para ser um projeto Databricks, configura um perfil que inclui as configurações de autenticação usadas para se conectar ao Databricks. Se o senhor quiser alterar o perfil de autenticação usado, clique no ícone de engrenagem associado ao AuthType no site Configuration view.

Para obter mais informações sobre a autenticação da extensão Databricks para Visual Studio Code, consulte Configuração de autenticação para a extensão Databricks para Visual Studio Code.

Selecione um cluster para executar o código e o trabalho

Usando a extensão Databricks para o Visual Studio Code, o senhor pode selecionar um Databricks cluster existente ou criar um novo Databricks cluster para executar seu código e trabalho. Depois que o senhor se conectar a compute, serão exibidos o ID de cluster, a versão de Databricks Runtime, o criador, o estado e o modo de acesso. O senhor também pode começar e interromper o cluster e navegar diretamente para os detalhes da página do cluster.

Dica

Se o senhor não quiser aguardar a inicialização do Job cluster, marque Override Jobs cluster in bundle logo abaixo da seleção cluster para usar o cluster selecionado para executar o Job do pacote no modo de desenvolvimento.

Usar um cluster existente

Se o senhor tiver um cluster Databricks existente que deseja usar:

  1. Em Configuration view, ao lado de cluster, clique em Select a cluster ou no ícone de engrenagem(Configure cluster).

    Configurar o cluster
  2. Na paleta de comandos, selecione o site cluster que o senhor deseja usar.

Criar um novo cluster

Se o senhor não tiver um cluster Databricks existente ou quiser criar um novo:

  1. Em Configuration view, ao lado de cluster, clique no ícone de engrenagem(Configure cluster).

  2. Na paleta de comandos, clique em Create New cluster (Criar novo cluster).

  3. Quando solicitado a abrir o site externo (seu Databricks workspace), clique em Open (Abrir).

  4. Se solicitado, faça login em seu site Databricks workspace.

  5. Siga as instruções para criar um cluster.

    Observação

    A Databricks recomenda que o senhor crie um cluster do Personal Compute. Isso permite que o senhor comece a executar cargas de trabalho imediatamente, minimizando a sobrecarga de gerenciamento do compute.

  6. Depois que o cluster for criado e estiver em execução, volte para o Visual Studio Code.

  7. Em Configuration view, ao lado de cluster, clique no ícone de engrenagem(Configure cluster).

    Configurar o ícone do cluster 3

    Na paleta de comandos, clique no endereço cluster que o senhor deseja usar.

Sincronizar a pasta do seu espaço de trabalho com o Databricks

O senhor pode sincronizar a pasta Databricks workspace remota associada ao seu projeto Databricks clicando no ícone de sincronização(começar a sincronizar) associado à pasta do espaço de trabalho em Configuration view do painel de extensão Databricks.

Observação

A extensão Databricks para o Visual Studio Code funciona somente com os diretórios workspace que ele cria. O senhor não pode usar um diretório workspace existente em seu projeto, a menos que ele tenha sido criado pela extensão.

Para navegar até workspace view em Databricks, clique no ícone de link externo(Open link externally) associado à pasta do espaço de trabalho.

A extensão determina a pasta Databricks workspace a ser usada com base na configuração file_path no mapeamento workspace da configuração do pacote ativo Databricks associado ao projeto. Veja espaço de trabalho.

Observação

A extensão Databricks para o Visual Studio Code executa apenas a sincronização automática unidirecional das alterações de arquivos do projeto local do Visual Studio Code para a pasta workspace relacionada no site remoto Databricks workspace. Os arquivos nesse diretório remoto workspace devem ser transitórios. Não inicie alterações nesses arquivos a partir do site remoto workspace, pois essas alterações não serão sincronizadas de volta ao projeto local.

Para obter detalhes de uso do recurso de sincronização de diretório workspace para versões anteriores da extensão Databricks para Visual Studio Code, consulte Selecionar um diretório workspace para a extensão Databricks para Visual Studio Code.

Configure seu ambiente Python e o Databricks Connect

A seção Python Environment (Ambiente ) do Configuration (Configuração ) view permite a fácil configuração do ambiente de desenvolvimento virtual Python e a instalação do Databricks Connect para execução e depuração do código e das células do Notebook. Python ambientes virtuais, certifique-se de que seu projeto esteja usando versões compatíveis de Python e Python pacote (neste caso, o Databricks Connect pacote).

Para configurar o Python ambiente virtual para seu projeto, no view painel de extensão Configuration :

  1. Clique no item vermelho Activate Virtual Environment (Ativar ambiente virtual ) em Python Environment (Ambiente Python).

  2. Na paleta de comandos, selecione Venv ou Conda.

  3. Selecione as dependências que você deseja instalar, se houver.

Para mudar de ambiente, clique no ícone de engrenagem (Alterar ambiente virtual) associado ao ambiente ativo.

Para obter informações sobre a instalação do Databricks Connect, que permite a execução e depuração de código e do Notebook no Visual Studio Code, consulte Depurar código usando Databricks Connect para a extensão Databricks para Visual Studio Code.