Gerenciar políticas de rede para o controle de saída serverless

Esta página explica como configurar e gerenciar políticas de rede para controlar conexões de rede de saída de suas cargas de trabalho serverless no Databricks.

Para controle de entrada, consulte Controle de entrada baseado em contexto.

Requisitos

Seu Databricks workspace deve estar na camada Enterprise.
As permissões para gerenciar políticas de rede são restritas aos administradores do site account.

Acessando políticas de rede

Para criar, view, e atualizar políticas de rede em seu account:

No consoleaccount, clique em Segurança .
Clique na tab Rede .
Em Políticas , clique em Controle de entrada e saída baseado em contexto .

Criar uma política de rede

Clique em Criar nova política de rede .
Insira um nome para a política .
Clique na tab Saída .

Para definir regras de entrada, consulte Definir regras de entrada.
Escolha um modo de acesso à rede:
- Permitir acesso a todos os destinos : acesso irrestrito à Internet de saída. Se você escolher Acesso total, o acesso externo à Internet permanecerá irrestrito.
- Acesso restrito a destinos específicos : o acesso de saída é limitado a destinos específicos.

Detalhes da política de rede.

Configurar políticas de rede

As etapas a seguir descrevem as configurações opcionais para o modo de acesso restrito.

Definir regras de saída

Antes de definir regras de saída, observe:

Quando o metastore e o bucket S3 do local externo da UC estiverem localizados em regiões diferentes, o senhor deverá adicionar explicitamente o bucket à lista de permissões de saída para que o acesso seja bem-sucedido.
O número máximo de destinos suportados é 2500.
O número de FQDNs que podem ser adicionados como domínios permitidos é limitado a 100 por política.
Os domínios adicionados como entradas do PrivateLink para um balanceador de carga de rede estão implicitamente permitidos nas políticas de rede. Quando um domínio é removido ou o endpoint privado é excluído, pode levar até 24 horas para que os controles de política de rede apliquem totalmente a alteração. Consulte Configurar conectividade privada para recurso em seu VPC.
Os buckets Delta Sharing são implicitamente incluídos na lista de permissões das políticas de rede.

nota

A lista de permissões implícita para conexões do Unity Catalog está obsoleta. Para as contas que contêm espaços de trabalho que estavam usando a lista de permissões implícita antes da descontinuação, esse comportamento permanecerá em vigor por um período de transição limitado.

Para conceder ao site serverless compute acesso a domínios adicionais, clique em Add destination acima da lista Allowed domains (Domínios permitidos ).

O filtro FQDN permite acesso a todos os domínios que compartilham o mesmo endereço IP. servindo modelo provisionamento em todo o endpoint impede o acesso à Internet quando o acesso à rede está definido como restrito. No entanto, o controle granular com filtragem FQDN não é suportado.
Para permitir que o site workspace acesse buckets S3 adicionais, clique no botão Add destination (Adicionar destino ) acima da lista Allowed storage destinations (Destinos de armazenamento permitidos ).

Somente locais de armazenamento externo vinculados a um workspace ou a todos os espaços de trabalho são incluídos automaticamente nas políticas de rede. Para verificar se um local está vinculado ao seu workspace, siga estes passos:

No Catalog Explorer, abra o local externo e verifique a tab do espaço de trabalho para confirmar se seu workspace foi atribuído. Consulte Atribuir um local externo a um espaço de trabalho específico.
API/CLI: Use vinculações de espaço de trabalho para recuperar vinculações para o local externo:
- API: Veja vinculações de espaço de trabalho.
- CLI: Veja o grupo de comandosworkspace-bindings.

Você deve adicionar todos os FQDNs válidos para acessar serviços adicionais.

nota

O acesso direto ao serviço de armazenamento cloud a partir de contêineres de código de usuário, como REPLs ou UDFs, não é permitido por default. Para habilitar esse acesso, adicione o FQDN do recurso de armazenamento em Domínios Permitidos na sua política. Adicionar apenas o domínio base do recurso de armazenamento pode inadvertidamente conceder acesso a todos os recursos de armazenamento na região.

Aplicação de políticas

O modo de execução a seco permite que o senhor teste a configuração da política e monitore as conexões de saída sem interromper o acesso ao recurso. Quando o modo de execução seca está ativado, as solicitações que violam a política são registradas, mas não bloqueadas. Você pode selecionar entre as seguintes opções:

Databricks SQL : Os armazéns do Databricks SQL operam em modo de execução a seco.
AI servindo modelo : o endpoint servindo modelo opera no modo de execução a seco.
All product : Todos os Databricks serviços operam no modo de execução a seco, substituindo todas as outras seleções.

Atualize a política do site default

Cada Databricks account inclui uma políticadefault . A políticadefault está associada a todos os espaços de trabalho sem atribuição explícita de política de rede, incluindo espaços de trabalho recém-criados. Você pode modificar essa política, mas ela não pode ser excluída.

As políticas padrão são aplicadas somente ao espaço de trabalho com pelo menos a camada Enterprise.

Associar uma política de rede ao espaço de trabalho

Se o senhor tiver atualizado a política default com configurações adicionais, elas serão aplicadas automaticamente ao espaço de trabalho que não tiver uma política de rede existente.

Seu site workspace deve estar no nível Enterprise.

Para associar o site workspace a uma política diferente, faça o seguinte:

Selecione um workspace.
Em Política de rede , clique em Atualizar política de rede .
Selecione a política de rede desejada na lista.
Clique em Aplicar política .

Atualize a política de rede.

Aplique alterações na política de rede

A maioria das atualizações de configuração de rede é propagada automaticamente para o site serverless compute em dez minutos. Isso inclui:

Adição de um novo local ou conexão externa do Unity Catalog.
Anexar o site workspace a um metastore diferente.
Alterar o armazenamento permitido ou os destinos da Internet.

nota

O senhor deve reiniciar o site compute se modificar a configuração do acesso à Internet ou do modo de execução a seco.

Reinicie ou reimplante as cargas de trabalho do serverless

O senhor só precisa atualizar quando mudar o modo de acesso à Internet ou quando atualizar o modo de execução a seco.

Para determinar o procedimento de reinicialização adequado, consulte a lista a seguir por produto:

Databricks ML Serving : Reimplante seu endpoint de serviço de ML. Consulte Criar endpoint de modelo de serviço personalizado
pipeline : Pare e reinicie o pipeline LakeFlow Spark Declarative em execução. Consulte execução de uma atualização pipeline.
sem servidor SQL warehouse : Pare e reinicie o SQL warehouse. Consulte gerenciar a SQL warehouse.
LakeFlow Trabalhos : As alterações na política de rede são aplicadas automaticamente quando uma nova execução de trabalho é acionada ou quando uma execução de trabalho existente é reiniciada.
Notebook :
- Se o seu Notebook não interagir com Spark, você poderá encerrar e reconectar compute serverless para refresh a política de rede.
- Se o Notebook interagir com Spark, o recurso serverless será atualizado e detectará automaticamente a alteração. A maioria das alterações será atualizada em dez minutos, mas alternar os modos de acesso à Internet, atualizar o modo de execução a seco ou alternar entre políticas anexadas que tenham diferentes tipos de aplicação pode levar até 24 horas. Para agilizar um refresh sobre esses tipos específicos de alterações, desative todos os Notebook e Job associados.

Dependências da interface do usuárioDatabricks ativo Bundles

Quando você usa o modo de acesso restrito com controle de saída serverless , o recurso de interface do usuário dos pacotes ativos Databricks exige acesso a domínios externos específicos. Se o acesso de saída for completamente restrito, os usuários poderão ver erros na interface workspace ao trabalhar com os pacotes ativos Databricks .

Para manter o recurso de interface do usuário dos pacotes ativos Databricks funcionando com políticas de rede restritas, adicione estes domínios aos domínios permitidos na sua política:

github.com
objetos.githubusercontent.com
release-ativo.githubusercontent.com
checkpoint-api.hashicorp.com
releases.hashicorp.com
registro.Terraform.io

Verificar a aplicação da política de rede

O senhor pode validar se a sua política de rede está sendo aplicada corretamente tentando acessar recursos restritos de diferentes cargas de trabalho do serverless. O processo de validação varia de acordo com o produto serverless.

Valide com o pipeline declarativo LakeFlow Spark

Crie um notebook Python . Você pode usar o Notebook de exemplo fornecido no tutorial Python sobre o pipeline declarativoLakeFlow Spark na Wikipédia.
Criar um pipeline:
1. Em seu site workspace, clique em Jobs & pipeline na barra lateral.
2. Clique em Create e, em seguida, em ETL pipeline .
3. Configure o pipeline com as seguintes definições:
  - pipeline Mode : sem servidor
  - Código-fonte : Selecione o Notebook que o senhor criou.
  - Opções de armazenamento : Unity Catalog. Selecione o catálogo e o esquema desejados.
4. Clique em Criar .
execução o pipeline.
Na página pipeline, clique em começar .
Aguarde a conclusão do pipeline.
Verifique os resultados
- Destino confiável : O pipeline foi executado com sucesso e gravou os dados no destino.
- Destino não confiável : o pipeline falha com erros, indicando que o acesso à rede está bloqueado.

Validar com Databricks SQL

Crie um SQL warehouse.
executar uma consulta de teste no editor SQL que tenta acessar um recurso controlado pela sua política de rede.
Verifique os resultados:
- Destino confiável : a consulta foi bem-sucedida.
- Destino não confiável : a consulta falha com um erro de acesso à rede.

Para se conectar a uma rede a partir de uma UDF usando uma Python biblioteca padrão, execute a seguinte definição UDF:

SQL
CREATE OR REPLACE TEMPORARY FUNCTION ping_google(value DOUBLE)
RETURNS STRING
LANGUAGE python
AS $$
import requests

url = "https://www.google.com"
response = requests.get(url, timeout=5)

if response.status_code == 200:
   return "UDF has network!"
else:
 return "UDF has no network!"
$$;

Validar com o modelo servindo

Antes de começar

Quando um modelo servindo endpoint é criado, uma imagem de contêiner é criada para servir o seu modelo. As políticas de rede são aplicadas durante esse estágio de construção. Ao usar o modelo servindo com políticas de rede, considere o seguinte:

Acesso a dependências: Todas as dependências externas de compilação, como Python pacote de PyPI e conda-forge, imagens de contêineres básicos ou arquivos de URLs externos especificados no ambiente do seu modelo ou no contexto de Docker exigido pelo ambiente do seu modelo devem ser permitidos pela sua política de rede.
- Por exemplo, se o seu modelo exigir uma versão específica do site scikit-learn que precisa ser baixada durante a compilação, a política de rede deverá permitir o acesso ao repositório que hospeda o pacote.
Falhas na compilação: Se sua política de rede bloquear o acesso às dependências necessárias, a compilação do contêiner servindo modelo falhará. Isso impede que o endpoint de serviço seja implantado com êxito e pode fazer com que ele não armazene ou funcione corretamente.

Consulte Recusa de cheque logs.
Solução de problemas de negações: As negações de acesso à rede durante a fase de construção são registros. Esses logs recorrem a um campo network_source_type com o valor ML Build. Essas informações são cruciais para identificar o recurso bloqueado específico que deve ser adicionado à sua política de rede para permitir que a compilação seja concluída com êxito.

Valide o acesso à rede em tempo de execução

As etapas a seguir demonstram como validar a política de rede para um modelo implantado em tempo de execução, especificamente para tentativas de acesso a recursos externos durante a inferência. Isso pressupõe que o contêiner servindo modelo tenha sido criado com êxito, o que significa que todas as dependências de tempo de criação foram permitidas na política de rede.

Crie um modelo de teste

Em um notebook Python, crie um modelo que tente acessar um recurso público da Internet no momento da inferência, como baixar um arquivo ou fazer uma solicitação API.

Execute este Notebook para gerar um modelo no teste workspace. Por exemplo:

Python
import mlflow
import mlflow.pyfunc
import mlflow.sklearn
import requests

class DummyModel(mlflow.pyfunc.PythonModel):
    def load_context(self, context):
        # This method is called when the model is loaded by the serving environment.
        # No network access here in this example, but could be a place for it.
        pass

    def predict(self, _, model_input):
        # This method is called at inference time.
        first_row = model_input.iloc[0]
        try:
            # Attempting network access during prediction
            response = requests.get(first_row['host'])
        except requests.exceptions.RequestException as e:
            # Return the error details as text
            return f"Error: An error occurred - {e}"
        return [response.status_code]

with mlflow.start_run(run_name='internet-access-model'):
    wrappedModel = DummyModel()

    # When this model is deployed to a serving endpoint,
    # the environment will be built. If this environment
    # itself (e.g., specified conda_env or python_env)
    # requires packages from the internet, the build-time SEG policy applies.
    mlflow.pyfunc.log_model(
        artifact_path="internet_access_ml_model",
        python_model=wrappedModel,
        registered_model_name="internet-http-access"
    )

Criar um endpoint de serviço
1. Na navegação workspace, selecione AI/ML.
2. Clique em Serving tab.
3. Clique em Criar endpoint de serviço .
4. Configure o endpoint com as seguintes definições:
  - Nome do endpoint de atendimento : Forneça um nome descritivo.
  - Detalhes da entidade : Selecione o modelo de registro do modelo .
  - Modelo : escolha o modelo que você criou na etapa anterior (internet-http-access).
5. Clique em Confirmar . Nessa etapa, começa o processo de construção do contêiner servindo modelo. As políticas de rede para ML Build serão aplicadas. Se a compilação falhar devido ao bloqueio do acesso à rede para dependências, o endpoint não ficará pronto.
6. Aguarde até que o servidor endpoint atinja o estado Ready (Pronto ). Se ele não ficar pronto, verifique se há entradas network_source_type: ML Build no site logs.
  
  Consulte Recusa de cheque logs.
Consultar o site endpoint.
1. Use a opção Query endpoint (Ponto de extremidade de consulta) na página endpoint para enviar uma solicitação de teste.
  JSON
```
{ "dataframe_records": [{ "host": "[https://www.google.com](https://www.google.com)" }] }
```
Verificar o resultado para acesso em tempo de execução:
- Acesso à Internet ativado em tempo de execução : a consulta é bem-sucedida e retorna um código de status como 200.
- Acesso à Internet restrito em tempo de execução : a consulta falha com um erro de acesso à rede, como a mensagem de erro do bloco try-except no código do modelo, indicando um tempo limite de conexão ou falha na resolução do host.

Atualizar uma política de rede

Você pode atualizar uma política de rede a qualquer momento após sua criação. Para atualizar uma política de rede:

Na página de detalhes da política de rede no console da conta, modifique a política:
- Altere o modo de acesso à rede.
- Ativar ou desativar o modo de execução a seco para um serviço específico.
- Adicione ou remova destinos de armazenamento ou FQDN.
Clique em Atualizar .
Consulte Aplicar alterações na política de rede para verificar se as atualizações são aplicadas às cargas de trabalho existentes.

Verificar a recusa logs

A negação logs é armazenada na tabela system.access.outbound_network em Unity Catalog. Esses logs rastreiam quando as solicitações de rede de saída são negadas. Para acessar a negação logs, verifique se o esquema de acesso está habilitado em seu metastore Unity Catalog. Consulte Tabelas do sistema Access.

Use uma consulta SQL como a que está abaixo para view eventos de negação. Se os logs de execução a seco estiverem ativados, a consulta retornará logs de negação e logs de execução a seco, que o senhor pode distinguir usando a coluna access_type. Denial logs tem um valor DROP , enquanto dry-execução logs mostra DRY_RUN_DENIAL .

O exemplo a seguir recupera o site logs das últimas 2 horas:

SQL
SELECT *
FROM system.access.outbound_network
WHERE event_time >= CURRENT_TIMESTAMP() - INTERVAL 2 HOUR
ORDER BY event_time DESC;

Para o modo de execução seca e modelos geradores externos AI, o seguinte é verdadeiro:

Se a política de rede bloqueou o acesso às dependências necessárias, verifique primeiro o log de negações em system.access.outbound_network. Além disso, a compilação logs para o seu contêiner servindo modelo pode fornecer informações úteis sobre quais domínios foram bloqueados.
Se a compilação do contêiner servindo modelo falhar, verifique o registro de negação em system.access.outbound_network para determinar quais domínios foram bloqueados.
A imposição de acesso a modelos externos por meio do Mosaic AI Serving continua mesmo no modo de execução a seco.

nota

Pode haver uma latência perceptível entre o momento do acesso e o momento em que a negação logs aparece.

Limitações

Tamanho upload de artefato : ao usar o sistema de arquivos Databricks interno do MLflow com o formato dbfs:/databricks/mlflow-tracking/<experiment_id>/<run_id>/artifacts/<artifactPath> , o upload de artefatos é limitado a 5 GB para APIs log_artifact, log_artifacts e log_model .
servindo modelo : O controle de saída não se aplica ao criar imagens para o servindo modelo.
Negação log entrega para cargas de trabalho de coleta de lixo (GC) de curta duração : A negação logs de cargas de trabalho de GC de curta duração, que duram menos de 120 segundos, pode não ser entregue antes que o nó seja encerrado devido a atrasos no registro. Embora o acesso ainda seja aplicado, a entrada correspondente em log pode estar ausente.
Conectividade de rede para funções definidas pelo usuário (UDFs) d Databricks SQL : Para habilitar o acesso à rede n Databricks SQL, entre em contato com a equipe de Databricks account .
Registro de eventos de pipeline : LakeFlow Spark Eventhooks de pipeline declarativos que têm como alvo outro workspace não são logs. Isso se aplica a Eventhooks configurados tanto para espaços de trabalho entre regiões quanto para espaços de trabalho na mesma região.
Alterações nas vinculações workspace Unity Catalog : As alterações nas vinculações workspace Unity Catalog podem levar até 24 horas para entrar em vigor. Para agilizar esse processo, adicione o bucket de armazenamento à política de rede. Consulte Limitar o acesso ao catálogo a um espaço de trabalho específico.
Acesso à rede para locais entre regiões Unity Catalog S3 : S3 buckets usados para Unity Catalog locais externos que estão em uma região AWS diferente do metastore não são automaticamente permitidos pelas políticas de rede serverless. Esses locais entre regiões S3 devem ser explicitamente adicionados aos destinos permitidos de sua política de rede para permitir o acesso de cargas de trabalho serverless.

O que vem a seguir

Configure o controle de entrada baseado em contexto : defina políticas de acesso de entrada com base na identidade, no tipo de solicitação e na origem da rede para proteger o acesso workspace . Veja Controle de entrada baseado em contexto.
endpoint Gerenciar regras de ponto de extremidade privado : controle o tráfego de rede de e para o seu ponto de extremidade privado, definindo regras específicas que permitem ou negam conexões para aumentar a segurança. Consulte gerenciar regras de privacidade d endpoint.
Configurar um firewall para acesso ao serverless compute : Implemente um firewall para restringir e proteger as conexões de rede de entrada e saída para seus ambientes serverless compute . Consulte Configurar um firewall para serverless compute acesso.
Compreenda os custos de transferência de dados e conectividade : Saiba mais sobre as implicações de custo ao implementar controles de segurança de rede e conectividade privada para cargas de trabalho do serverless. Consulte Entender os custos de rede do Databricks serverless.

Requisitos​

Acessando políticas de rede​

Criar uma política de rede​

Configurar políticas de rede​

Definir regras de saída​

Aplicação de políticas​

Atualize a política do site default​

Associar uma política de rede ao espaço de trabalho​

Aplique alterações na política de rede​

Reinicie ou reimplante as cargas de trabalho do serverless​

Dependências da interface do usuárioDatabricks ativo Bundles​

Verificar a aplicação da política de rede​

Valide com o pipeline declarativo LakeFlow Spark​

Validar com Databricks SQL​

Validar com o modelo servindo​

Antes de começar​

Valide o acesso à rede em tempo de execução​

Atualizar uma política de rede​

Verificar a recusa logs​

Limitações​

O que vem a seguir​

Requisitos

Acessando políticas de rede

Criar uma política de rede

Configurar políticas de rede

Definir regras de saída

Aplicação de políticas

Atualize a política do site default

Associar uma política de rede ao espaço de trabalho

Aplique alterações na política de rede

Reinicie ou reimplante as cargas de trabalho do serverless

Dependências da interface do usuárioDatabricks ativo Bundles

Verificar a aplicação da política de rede

Valide com o pipeline declarativo LakeFlow Spark

Validar com Databricks SQL

Validar com o modelo servindo

Antes de começar

Valide o acesso à rede em tempo de execução

Atualizar uma política de rede

Verificar a recusa logs

Limitações

O que vem a seguir