Excelência operacional para o Databricks

Os princípios arquitetônicos do pilar de **excelência operacional** abrangem todos os processos operacionais que mantêm o Databricks em funcionamento. A excelência operacional aborda a capacidade de operar o Databricks de forma eficiente e discute como operar, gerenciar e monitorar o Databricks para entregar valor comercial.

Diagrama de arquitetura de excelência operacional para Databricks.

Princípios de excelência operacional

Otimize os processos de criação e lançamento

Use as melhores práticas de engenharia de software em todo o seu ambiente Databricks. Compilar e lançar usando pipeline de integração contínua (CI) e entrega contínua (CD) para DevOps e MLOps.
Automatize implantações e cargas de trabalho

Automatizar as implantações e cargas de trabalho do Databricks ajuda a padronizar esses processos, eliminar erros humanos, melhorar a produtividade e proporcionar maior repetibilidade. Isso inclui o uso de “configuração como código” para evitar desvio de configuração e “infraestrutura como código” para automatizar o provisionamento de todos os serviços de cloud e Databricks necessários.

Especificamente para ML, os processos devem conduzir à automação: nem todas as passos de um processo podem ou devem ser automatizadas. As pessoas ainda determinam as questões de negócios e alguns modelos sempre precisarão de supervisão humana antes da implantação. Portanto, o processo de desenvolvimento é primário e cada módulo do processo deve ser automatizado conforme necessário. Isso permite a criação incremental de automação e personalização.
Configure o monitoramento, os alertas e o registro

As cargas de trabalho no Databricks normalmente integram serviços da plataforma Databricks e serviços de cloud externos, por exemplo, como fontes de dados ou destinos. A execução bem-sucedida só pode ocorrer se cada serviço na cadeia de execução estiver funcionando corretamente. Quando este não é o caso, o monitoramento, alertas e registro em log são importantes para detectar e rastrear problemas e entender o comportamento do sistema.
capacidade gerencial e cotas

Para qualquer serviço lançado em uma nuvem, considere os limites em account, por exemplo, limites de taxa de acesso, número de instâncias, número de usuários e requisitos de memória. Antes de projetar uma solução, esses limites devem ser compreendidos.

Próximo: Melhores práticas para excelência operacional

Veja as melhores práticas para excelência operacional.

Princípios de excelência operacional​

Próximo: Melhores práticas para excelência operacional​

Princípios de excelência operacional

Próximo: Melhores práticas para excelência operacional