Folha de dicas do programa Production Job

Este artigo tem o objetivo de fornecer orientações claras e opinativas para a produção do Job programar. O uso de práticas recomendadas pode ajudar a reduzir custos, melhorar o desempenho e aumentar a segurança.

Melhor prática	Impacto	Documentos
Use compute serverless para o trabalho	Custo : Sem servidor. O trabalho não requer configuração cluster . Databricks gerencia provisionamento e escalonamento automaticamente.	Execução de tarefa serverless
Sempre que possível, use o site LakeFlow Jobs para solicitar	Custo : Não há necessidade de usar ferramentas externas para orquestrar se o senhor estiver orquestrando apenas cargas de trabalho no Databricks.	LakeFlow Empregos
Use a entidade de serviço em vez da conta de usuário para executar o trabalho de produção	Segurança : Se o trabalho for de propriedade de usuários individuais, quando esses usuários deixarem a organização, esse trabalho poderá parar de ser executado.	entidade de serviço
Para compute clássica: use clusters de trabalho para fluxo de trabalho automatizado	Custo : O clustering de trabalhos é cobrado a taxas mais baixas do que o clustering interativo.	Criar um clustering - Clustering para todos os fins e para trabalhos.
Para compute clássica: reinicieclusters longos em execução	Segurança : Reinicie o clustering para aproveitar os patches e as correções de bugs do site Databricks Runtime.	Reiniciar um clustering para atualizá-lo com as imagens mais recentes
Para compute clássica: use a versão LTS mais recente do Databricks Runtime	desempenho e custo : o site Databricks está sempre aprimorando o Databricks Runtime em termos de usabilidade, desempenho e segurança.	computar - Os Databricks suportam ciclos de vida
Para compute clássica: não armazene dados de produção na DBFS root	Segurança : Quando os dados são armazenados no site DBFS root, todos os usuários podem acessá-los.	O que é DBFS? - Recomendações para trabalhar com DBFS root

Melhor prática	Impacto	Documentos
Use compute serverless para o trabalho	Custo : Sem servidor. O trabalho não requer configuração cluster . Databricks gerencia provisionamento e escalonamento automaticamente.	Execução de tarefa serverless
Sempre que possível, use o site LakeFlow Jobs para solicitar	Custo : Não há necessidade de usar ferramentas externas para orquestrar se o senhor estiver orquestrando apenas cargas de trabalho no Databricks.	LakeFlow Empregos
Use a entidade de serviço em vez da conta de usuário para executar o trabalho de produção	Segurança : Se o trabalho for de propriedade de usuários individuais, quando esses usuários deixarem a organização, esse trabalho poderá parar de ser executado.	entidade de serviço
Para compute clássica: use clusters de trabalho para fluxo de trabalho automatizado	Custo : O clustering de trabalhos é cobrado a taxas mais baixas do que o clustering interativo.	Criar um clustering - Clustering para todos os fins e para trabalhos.
Para compute clássica: reinicieclusters longos em execução	Segurança : Reinicie o clustering para aproveitar os patches e as correções de bugs do site Databricks Runtime.	Reiniciar um clustering para atualizá-lo com as imagens mais recentes
Para compute clássica: use a versão LTS mais recente do Databricks Runtime	desempenho e custo : o site Databricks está sempre aprimorando o Databricks Runtime em termos de usabilidade, desempenho e segurança.	computar - Os Databricks suportam ciclos de vida
Para compute clássica: não armazene dados de produção na DBFS root	Segurança : Quando os dados são armazenados no site DBFS root, todos os usuários podem acessá-los.	O que é DBFS? - Recomendações para trabalhar com DBFS root