Práticas recomendadas para aplicativos Databricks

Esta página lista práticas recomendadas importantes para desenvolver e executar aplicativos Databricks. Estas diretrizes concentram-se nos requisitos de segurança, desempenho e plataforma.

Práticas recomendadas gerais

Use o recurso nativo Databrickspara processamento de dados . O aplicativo compute é otimizado para renderização de interface do usuário. Use Databricks SQL para consultas e conjuntos de dados, LakeFlow Jobs para processamento de lotes e o modelo de trabalho para cargas de trabalho de inferência AI . Descarregue o processamento pesado de dados para esses serviços para evitar problemas de desempenho. Teste seu aplicativo sob condições de carga esperadas para verificar se ele atende aos seus requisitos.
Implemente um tratamento de desligamento elegante . Seu aplicativo deve ser encerrado dentro de 15 segundos após receber um sinal SIGTERM, ou ele será encerrado à força com SIGKILL.
Evite operações privilegiadas . Os aplicativos são executados como usuários não privilegiados e não podem executar ações que exigem permissões elevadas, como acesso root. Você não pode instalar pacotes de nível de sistema usando gerenciadores de pacotes como apt-get, yum ou apk. Em vez disso, use o pacote Python do PyPI ou o pacote Node.js do npm para gerenciar as dependências do seu aplicativo.
Compreender a rede gerenciada por plataforma . As solicitações são encaminhadas por meio de um proxy reverso, portanto, seu aplicativo não pode depender da origem das solicitações. O Databricks lida com o encerramento do TLS e exige que os aplicativos ofereçam suporte ao HTTP/2 cleartext (H2C). Não implemente o tratamento personalizado de TLS.
Vincule ao host e à porta corretos . Seu aplicativo deve escutar em 0.0.0.0 e usar a porta especificada na variável de ambiente DATABRICKS_APP_PORT . Consulte Definir variável de ambiente em um aplicativo Databricks.
Minimize o tempo do contêiner startup . Manter a lógica de inicialização leve para reduzir a latência do cold-começar. Evite bloquear operações como instalações de grandes dependências ou chamadas externas para API durante startup. Carregue recursos pesados somente quando necessário.
Registrar em stdout e stderr . Databricks captura logs da saída padrão e da transmissão de erros. Use essas opções para todos os registros, de forma que logs fiquem visíveis na interface Databricks . Evite gravar logs em arquivos locais.
Lide com erros inesperados com elegância . Implemente o tratamento global de exceções para evitar falhas causadas por erros não detectados. Retorne respostas de erro HTTP adequadas sem expor rastreamentos de pilha ou dados confidenciais.
Use uv para gerenciamento de dependências do Python . Databricks recomenda uv para todos os aplicativos Python. Ele proporciona instalações mais rápidas, um arquivo de bloqueio (uv.lock) para builds totalmente reproduzíveis e a capacidade de usar qualquer versão do Python. Se você usar requirements.txt, pin os números de versão exatos para garantir ambientes consistentes em todas as compilações.
Valide e limpe a entrada do usuário . Sempre valide os dados recebidos e higienize-os para evitar ataques de injeção ou entradas malformadas, mesmo em aplicativos voltados para o interior.
Use o cache na memória para operações caras . Armazene em cache os dados usados com frequência, como resultados de consultas ou respostas de API, para reduzir a latência e evitar o processamento redundante. Use functools.lru_cache, cachetools, ou biblioteca semelhante, e escopo de caches com cuidado em aplicativos multiusuários.
Use padrões de solicitação assíncronos para operações de longa duração . Evite solicitações síncronas que aguardam a conclusão das operações, o que pode expirar. Em vez disso, faça uma solicitação inicial para iniciar as operações e, em seguida, consulte periodicamente o estado do recurso ou endpoint para verificar o status de conclusão.

Melhores práticas de segurança

Siga o princípio do menor privilégio. Conceda somente as permissões necessárias para cada usuário ou grupo. Use CAN USE em vez de CAN MANAGE, a menos que seja necessário controle total. Consulte Práticas recomendadas para permissões.
Escolha os métodos de autenticação com cuidado . Use entidade de serviço quando o acesso ao recurso e aos dados for o mesmo para todos os usuários do aplicativo. Implemente a autenticação do usuário somente no espaço de trabalho com autores de aplicativos confiáveis e código de aplicativo revisado por pares, quando o aplicativo precisar respeitar as permissões do usuário que efetuou a chamada.
Use entidade de serviço dedicada para cada aplicativo . Não compartilhe credenciais de entidade de serviço entre aplicativos ou usuários. Conceda apenas as permissões mínimas necessárias, como CAN USE ou CAN QUERY. Alterne as credenciais da entidade de serviço quando os criadores do aplicativo saírem da sua organização. Consulte gerenciar o acesso do app ao recurso.
Isole ambientes de aplicativos . Use diferentes espaços de trabalho para separar aplicativos de desenvolvimento, preparação e produção. Isso evita o acesso acidental aos dados de produção durante o desenvolvimento e os testes.
Acesse dados por meio de computeapropriada . Não configure seu aplicativo para acessar ou processar dados diretamente. Use SQL Warehouse para consultas, o modelo de preenchimento para inferência AI e LakeFlow Jobs para processamento de lotes.
Gerenciar segredos . Nunca exponha valores secretos brutos em variáveis de ambiente. Use valueFrom na configuração do seu aplicativo e alterne os segredos regularmente, especialmente quando as funções da equipe mudarem. Veja as melhores práticas.
Minimize escopos e log ações do usuário . Ao usar a autorização do usuário, solicite apenas os escopos que seu aplicativo precisa e log todas as ações do usuário com registros de auditoria estruturados. Consulte Melhores práticas para autorização do usuário.
Restringir o acesso de saída à rede . Permita apenas os domínios que seu aplicativo precisa, como pacotes, repositórios e APIs externas. Use o modo de execução a seco e logs de negação para validar sua configuração. Consulte Melhores práticas para configurar políticas de rede.
Siga práticas de codificação seguras . Parametrize consultas SQL para evitar ataques de injeção e aplique diretrizes gerais de desenvolvimento seguro, como validação de entrada e tratamento de erros. Consulte API de execução de instruções: executar SQL em armazéns.
Monitore atividades suspeitas . Revise regularmente logs de auditoria em busca de padrões de acesso incomuns ou ações não autorizadas. Configure alertas para eventos críticos de segurança.

Práticas recomendadas gerais​

Melhores práticas de segurança​

Práticas recomendadas gerais

Melhores práticas de segurança