Pular para o conteúdo principal

Use o Visual Studio Code com o Databricks Connect for Python

nota

Este artigo abrange o Databricks Connect para Databricks Runtime 13.3 LTS e acima.

Este artigo aborda como usar o site Databricks Connect para Python com o Visual Studio Code. Databricks Connect permite que o senhor conecte os populares IDEs, servidores de notebook e outros aplicativos personalizados ao clustering Databricks. Consulte O que é o Databricks Connect? Para obter a versão Scala deste artigo, consulte Use Visual Studio Code with Databricks Connect for Scala.

nota

Antes de começar a usar o Databricks Connect, o senhor deve configurar o cliente Databricks Connect.

dica

A extensão Databricks para o Visual Studio Code já tem suporte integrado para Databricks Connect para Databricks Runtime 13.3 LTS e acima. Consulte Depurar código usando o Databricks Connect para a extensão do Databricks para o Visual Studio Code.

Para usar o Databricks Connect com o Visual Studio Code e o Python, siga estas instruções.

  1. Começar Visual Studio Code.

  2. Abra a pasta que contém seu ambiente virtual Python (File > Open Folder ).

  3. No Terminal de código do Visual Studio (veja > Terminal ), ative o ambiente virtual.

  4. Define o interpretador Python atual como aquele que é referenciado no ambiente virtual:

    1. Na paleta de comandos (veja > comando Palette ), digite Python: Select Interpreter e pressione Enter .
    2. Selecione o caminho para o interpretador Python que é referenciado a partir do ambiente virtual.
  5. Adicione à pasta um arquivo de código Python (.py) que contenha o código de exemplo ou seu próprio código. Se você usar seu próprio código, deverá, no mínimo, inicializar DatabricksSession conforme mostrado no código de exemplo.

  6. Para executar o código, clique em execução > execução Sem depuração no menu principal. Todo o código Python é executado localmente, enquanto todo o código PySpark que envolve DataFrame operações é executado no clustering no Databricks workspace remoto e as respostas de execução são enviadas de volta ao chamador local.

  7. Para depurar o código:

    1. Com o arquivo de código Python aberto, defina os pontos de interrupção em que deseja que o código faça uma pausa durante a execução.
    2. Clique no ícone Execução e depuração na barra lateral ou clique em view > execução no menu principal.
    3. Em Execução e Depuração view, clique no botão Execução e Depuração .
    4. Siga as instruções na tela para começar a executar e depurar o código.

    Todo o código do Python é depurado localmente, enquanto todo o código do PySpark continua a ser executado no clustering no Databricks remoto workspace. O código principal do mecanismo do Spark não pode ser depurado diretamente do cliente.

Para obter instruções mais específicas sobre execução e depuração, consulte Configurar e executar o depurador e Python depuração no VS Code.