Pular para o conteúdo principal

Databricks AI recurso confiança e segurança

Databricks entende a importância dos seus dados e a confiança que o senhor deposita em nós quando usa nossa plataforma e Databricks AI recurso. Databricks está comprometida com os mais altos padrões de proteção de dados e implementou medidas rigorosas para garantir que as informações que o senhor envia para Databricks AI recurso sejam protegidas.

  • Seus dados permanecem confidenciais.

    • Databricks não treina modelos de base generativa com os dados que o usuário envia a esses recursos, e o Databricks não usa esses dados para gerar sugestões exibidas para outros clientes.
    • Nossos parceiros modelo não retêm os dados que o senhor envia por meio desses recursos, nem mesmo para monitoramento de abusos. Nossos parceiros-powered AI assistive recurso usam zero endpoint de retenção de dados de nossos parceiros modelo.
  • Proteção contra saídas nocivas. A Databricks também usa a filtragem de conteúdo do Azure OpenAI para proteger os usuários de conteúdo nocivo. Além disso, a Databricks realizou uma extensa avaliação com milhares de interações simuladas de usuários para garantir que as proteções implementadas para proteger contra conteúdo nocivo, jailbreaks, geração de código inseguro e uso de conteúdo de direitos autorais de terceiros sejam eficazes.

  • A Databricks usa apenas os dados necessários para fornecer o serviço. Os dados são enviados somente quando o senhor interage com o recurso Databricks AI-powered. O Databricks envia seu prompt, metadados e valores de tabela relevantes, erros, bem como código de entrada ou consultas para ajudar a retornar resultados mais relevantes. A Databricks não envia outros dados em nível de linha para modelos de terceiros.

  • Os dados são protegidos em trânsito. Todo o tráfego entre Databricks e os parceiros do modelo é criptografado em trânsito com a criptografia TLS padrão das indústrias.

  • A Databricks oferece controles de residência de dados. Databricks AI-Os recursos de energia são serviços designados e cumprem os limites de residência de dados. Para obter Databricks Geos mais detalhes, consulte: Data residency (Residência Databricks de dados ) e Designated service(Serviço designado).

Para saber mais sobre a privacidade do Databricks Assistant, consulte Perguntas frequentes sobre privacidade e segurança.

recurso regido pela configuração do recurso assistivo AI alimentado por parceiros

parceiros-powered AI refere-se ao recurso alimentado pelo serviço Azure OpenAI. Muitos Databricks AI recursos são alimentados pelo Azure OpenAI serviço, mas não todos. Consulte a tabela a seguir para saber mais:

Recurso

Onde o modelo está hospedado?

Controlado por parceiros - AI configuração?

Chat do Databricks Assistant

Azure Serviço OpenAI

Sim

Solução rápida

Azure Serviço OpenAI

Sim

AI-comentários gerados pela UC (espaço de trabalho do perfil de segurança de conformidade (CSP))

Azure Serviço OpenAI

Sim, para todo o espaço de trabalho do CSP

AI-comentários gerados pela UC (espaço de trabalho não-CSP)

Modelo hospedado no Databricks

Não, para espaços de trabalho não-CSP

AI/BI dashboard AI-visualizações assistidas e acompanhantes Genie spaces

Azure Serviço OpenAI

Sim

genie

Azure Serviço OpenAI

Sim

Assistente em linha da Databricks

Azure Serviço OpenAI

Sim

Autocompletar do Databricks Assistant

Modelo hospedado no Databricks

Não

Pesquisa inteligente

Azure Serviço OpenAI

Sim

Usar um modelo hospedado na Databricks

info

Visualização

Esse recurso está em Public Preview.

Saiba como usar um modelo hospedado em Databrickspara alimentar Databricks AI-powered recurso que, de outra forma, seria alimentado por Azure OpenAI. Esta seção explica como isso funciona.

Como funciona

O diagrama a seguir fornece uma visão geral de como um modelo hospedado em Databricksalimenta o recurso Databricks AI , como o Quick Fix.

Diagrama do fluxo de trabalho do Databricks Assistant alimentado por um modelo hospedado no Databricks.

  1. Um usuário executa uma célula do Notebook, o que resulta em um erro.
  2. A Databricks anexa metadados a uma solicitação e a envia para um modelo de linguagem grande (LLM) hospedado pela Databricks. Todos os dados são criptografados em repouso. Os clientes podem usar um gerenciador de clientes key (CMK).
  3. O modelo hospedado na Databricks responde com as edições de código sugeridas para corrigir o erro, que é exibido para o usuário.

Esse recurso está em pré-visualização pública e está sujeito a alterações. Entre em contato com seu representante para perguntar qual recurso Databricks AI pode ser suportado por um modelo Databricks-hosted.

Modelos hospedados no Databricks

Quando o Databricks AI recurso usa modelos hospedados no Databricks, ele usa o Meta Llama 3 ou outros modelos que também estão disponíveis para uso comercial. Consulte as informações sobre licenciamento e uso de modelos generativos AI.

Perguntas frequentes sobre modelos hospedados no Databricks para o Assistant

Posso ter minha própria instância privada da servindo modelo?

Não neste momento. Esta visualização usa endpoints do modelo servindo que são gerenciados e protegidos por Databricks. Os endpoints da Servindo Modelo são stateless, protegidos por várias camadas de isolamento e implementam os seguintes controles de segurança para proteger seus dados:

  • Cada solicitação de cliente à Servindo Modelo é logicamente isolada, autenticada e autorizada.
  • O Mosaic AI Model Serving criptografa todos os dados em repouso (AES-256) e em trânsito (TLS 1.2+).

Os metadados enviados para os modelos respeitam as permissões do usuário no Unity Catalog?

Sim, todos os dados enviados ao modelo respeitam as permissões do Unity Catalog do usuário. Por exemplo, ele não envia metadados relacionados a tabelas que o usuário não tem permissão para ver.

Onde os dados são armazenados?

O histórico do chat Databricks Assistant é armazenado no banco de dados do plano de controle, juntamente com o Notebook. O banco de dados do plano de controle é criptografado em AES-256 bits e os clientes que precisam de controle sobre a criptografia key podem utilizar nosso recurso de chave gerenciada pelo cliente.

nota
  • Assim como outros objetos do site workspace, o período de retenção do Databricks Assistant chat história tem como escopo o ciclo de vida do próprio objeto. Se um usuário excluir o Notebook, ele e qualquer histórico de bate-papo associado serão excluídos em 30 dias.
  • Se o Notebook for exportado, o histórico de bate-papo não será exportado com ele.
  • Notebook e o histórico de bate-papo da consulta não estão disponíveis para outros usuários ou administradores, mesmo que a consulta ou o Notebook seja compartilhado.

Posso trazer meu próprio API key para meu modelo ou hospedar meus próprios modelos?

Não neste momento. O Databricks Assistant é totalmente gerenciado e hospedado pela Databricks. A funcionalidade do assistente depende muito do servindo modelo recurso (por exemplo, chamada de função), do desempenho e da qualidade. A Databricks avalia continuamente novos modelos para obter o melhor desempenho e pode atualizar o modelo em versões futuras desse recurso.

Quem é o proprietário dos dados de saída? Se o Assistant gerar código, quem é o proprietário desse IP?

O cliente possui sua própria produção.

Não usar modelos hospedados na Databricks

Para optar por não usar os modelos hospedados pela Databricks:

  1. Clique em seu nome de usuário na barra superior do workspace do Databricks.
  2. No menu, selecione Previews .
  3. Desativar o Use Assistant com modelos hospedados pelo Databricks .

Para saber mais sobre como gerenciar visualizações, consulte gerenciar Databricks Previews.

Perguntas frequentes sobre privacidade e segurança do Databricks Assistant

Quais dados são enviados para os modelos?

O Databricks Assistant envia seu prompt (por exemplo, sua pergunta ou código), bem como metadados relevantes para o modelo que alimenta o recurso em cada solicitação de API. Isso ajuda a retornar resultados mais relevantes para seus dados. Os exemplos incluem:

  • Código e consultas na célula atual do Notebook ou no editor SQL tab
  • Nomes e descrições da tabela e da coluna
  • Perguntas anteriores
  • Mesas favoritas

Os metadados enviados para os modelos respeitam as permissões do usuário no Unity Catalog?

Sim, todos os dados enviados ao modelo respeitam as permissões do Unity Catalog do usuário, portanto, ele não envia metadados relacionados a tabelas que o usuário não tem permissão para ver.

Se eu executar uma consulta com resultados e depois fizer uma pergunta, os resultados da minha consulta serão enviados para o modelo?

Não, os resultados da consulta não são usados pelo Assistente.

Se eu compartilhar meu Notebook ou consulta com outro usuário interno, ele poderá ver meu histórico de bate-papo?

Não. As interações com o Assistant são visíveis somente para o usuário que as iniciou.

O Databricks Assistant executa códigos perigosos?

Não. O site Databricks Assistant não executa automaticamente o código em seu nome. AI Os modelos podem cometer erros, não entender a intenção, alucinar ou dar respostas incorretas. Revise e teste o código gerado pelo AIantes de executá-lo.

A Databricks fez alguma avaliação para avaliar a precisão e a adequação das respostas dos assistentes?

Sim, o site Databricks fez testes extensivos de todos os nossos recursos com tecnologia AIcom base nos casos de uso esperados e usando entradas de usuário simuladas para aumentar a precisão e a adequação das respostas. Dito isso, a AI generativa é uma tecnologia emergente, e o Assistente pode fornecer respostas imprecisas ou inadequadas. A Databricks também implementou mitigações para evitar que o Assistente gere respostas prejudiciais, como discursos de ódio, códigos inseguros e jailbreaks imediatos.

Posso usar o Databricks Assistant com tabelas que processam dados regulamentados (PHI, PCI, IRAP, FedRAMP)?

Sim Para isso, o senhor deve cumprir os requisitos, como ativar o perfil de segurançacompliance, e adicionar o padrão compliance relevante como parte da configuração do perfil de segurança compliance.