Criar e verificar um clustering para suporte ao site legado HIPAA
Este artigo se aplica ao legado HIPAA compliance recurso. Para obter uma visão geral do HIPAA compliance recurso na plataforma E2, consulte os artigos HIPAA compliance recurso.
Se o seu workspace usa o suporte legado do HIPAA, use as instruções a seguir para criar e verificar um clustering para o HIPAA compliance recurso para processar os dados do PHI.
-
Criar um cluster
Siga as instruções na referência de configuração da computação. Como parte da etapa de configuração, o senhor deve escolher uma versão de tempo de execução do Databricks.
Databricks Runtime for Machine Learning inclui pacotes de aprendizado de máquina distribuídos de alto desempenho que usam MPI (Message Passing Interface) e outros protocolos de comunicação de baixo nível. Como esses protocolos não suportam nativamente a criptografia através do fio, esses pacotes ML podem potencialmente enviar dados confidenciais não criptografados pela rede. Esses pacotes não alteram a criptografia de dados pelo fio se o seu fluxo de trabalho não depender deles.
As mensagens enviadas pela rede por esse pacote ML são, em geral, parâmetros do modelo ML ou estatísticas resumidas sobre os dados de treinamento. Portanto, normalmente não se espera que dados confidenciais, como informações de saúde protegidas, sejam enviados sem criptografia. No entanto, é possível que determinadas configurações ou usos desses pacotes (como modelos específicos) possam resultar no envio de mensagens pela rede que contenham essas informações.
Os seguintes pacotes são afetados:
-
Horovod, HorovodEstimator e HorovodRunner
-
TensorFlowdistribuído
-
Configurar o clustering com um volume EBS (suporte ao Legacy HIPAA )
provisionamento de um volume do EBS, pois os volumes do Databricks EBS são criptografados, enquanto o armazenamento local do default não é.
-
Verifique se a criptografia está ativada.
-
Crie um Notebook no workspace e anexe o Notebook aos clusters que foram criados na passo anterior.
-
Execute o seguinte comando no Notebook:
Scala%scala spark.conf.get("spark.ssl.enabled")
Se o valor retornado for verdadeiro, o senhor criou com êxito um clustering com a criptografia ativada. Caso contrário, entre em contato com help@databricks.com.
-
spark-submit
não é compatível com o clustering em conformidade com HIPAA.