Databricks Geos: Residência de dados de IA

Este artigo descreve como a Databricks Geos gerencia a residência de dados ao processar o conteúdo do cliente para alguns recursos de IA, conhecidos como Serviço Designado.

Como o site Databricks gerencia a residência de dados ao processar o conteúdo do cliente?

Na arquitetura tradicional (clássica e serverless) Databricks, há um "planocompute " e um "plano de controle" que são fornecidos em uma base específica da região.

Os serviços designados, incluindo aqueles que alimentam as cargas de trabalho da IA generativa, estão disponíveis em uma base Geo. Os serviços designados são sempre gerenciados pelo site Databricks em nome do cliente.

O conteúdo do cliente é processado apenas no mesmo Geo que o seu workspace.

O que é um Databricks Geo?

Um Geo é um grupo de regiões de data center que a Databricks agrupa para oferecer aos clientes previsibilidade e transparência em relação ao local onde seus dados são processados.

Para serviços designados que usam Geos, Databricks processa apenas dados dentro do mesmo Geo que o seu workspace.

A tabela a seguir descreve os Geos Databricks disponíveis e as regiões que eles incluem:

Databricks Geo

Incluindo regiões em:

Américas

  • Estados Unidos

  • Brasil

  • Canadá

Ásia

  • Hong Kong

  • Japão

  • Coreia

  • Singapura

Austrália e Nova Zelândia

  • Austrália

  • Nova Zelândia

Europa

  • Espaço Econômico Europeu (EEE)

  • Suíça

  • Reino Unido

Índia

  • Índia

China continental

  • China continental

Oriente Médio e África

  • Qatar

  • África do Sul

  • Emirados Árabes Unidos

Serviço designado oferecido em uma base Geo

Para serviços designados, como aqueles que dependem de GPUs ou de outro processamento avançado, o conteúdo do cliente é processado no workspace Geo. Para obter mais informações, consulte Databricks Serviço designado

Meus dados serão enviados para fora da Geo?

O conteúdo do cliente é processado em Geos de forma semelhante ao modo como a arquitetura clássica do Databricks processava dados em uma região específica.

O conteúdo do cliente só é processado dentro da mesma Geo de um cliente workspace.

Meus planos de computação existentes serão movidos para uma região diferente no mesmo Geo?

Não. Em ambas as arquiteturas serverless e Databricks clássica, os planos regionais compute permanecem em sua região para todos os serviços existentes. Na arquitetura clássica Databricks, o plano compute opera em um account sob seu controle e o senhor deve especificar a região em que ele opera. serverless Os componentes oferecidos em uma base regional, como serverless SQL warehouse, não processam dados fora da região selecionada pelo senhor.

Como os geos afetam o recurso Preview?

O recurso de visualização pode envolver o processamento de dados entre Geos, a menos que a documentação indique o contrário.

Recursos adicionais