Pular para o conteúdo principal

Usar Dados do Databricks na Microsoft Power Platform

Esta página explica como usar seus dados do Databricks nas seguintes plataformas após criar uma conexão:

  • Power Apps : Crie aplicativos que podem ler e gravar no Databricks, preservando seus controles de governança do Databricks.
  • Power Automate : Crie fluxos e adicione ações que permitam a execução de SQL personalizado ou um Job existente e obtenha os resultados.
  • Copilot Studio : Crie agentes personalizados usando seus dados do Databricks como fonte de conhecimento ou conecte Genie Spaces como ferramentas. Consulte Usar dados do Databricks no Microsoft Copilot Studio.

Pré-requisitos

Antes de se conectar ao Databricks a partir da Power Platform, é preciso criar uma conexão ao Databricks na Microsoft Power Platform.

Use seus dados do Databricks para construir aplicativos Power Canvas

Para adicionar seus dados do Databricks ao seu aplicativo, faça o seguinte:

  1. Na barra de navegação mais à esquerda no Power Apps, clique em **Criar**.
  2. Clique em Começar com uma tela em branco e escolha o tamanho de tela desejado para criar um novo aplicativo de tela.
  3. No seu aplicativo, clique em Adicionar dados > Conectores > Databricks . Clique na conexão Databricks criada.
  4. Selecionar um catálogo da barra lateral **Escolher um dataset**.
  5. Na barra lateral Escolher um dataset , selecione todas as tabelas às quais deseja conectar a sua aplicação canvas.
  6. Clique em Conectar .

Operações de Dados em Power Apps:

O conector oferece suporte a operações de criação, atualização e exclusão, mas somente para tabelas que possuam uma primary key definida. Ao realizar operações de criação, deve-se sempre especificar a primary key.

O Databricks oferece suporte a colunas de identidade geradas. Neste caso, os valores da chave primária são gerados automaticamente no servidor durante a criação da linha e não podem ser especificados manualmente.

Use seus dados do Databricks para criar fluxos do Power Automate

A API de Execução de Instruções e a API de Jobs da Databricks são expostas no Power Automate, permitindo que você escreva instruções SQL e execute Jobs existentes. Para criar um Power Automate flow usando o Databricks como uma ação, faça o seguinte:

  1. Na barra de navegação à esquerda no Power Automate, clique em Criar .

  2. Crie um fluxo e adicione qualquer tipo de acionador.

  3. A partir do seu novo fluxo, clique em + e pesquise por "Databricks" para ver as ações disponíveis.

  4. Para escrever uma query SQL, selecione uma das seguintes ações:

    • Executar uma Instrução SQL : Escrever e executar uma instrução SQL. Insira o seguinte:

      • Para Body/warehouse_id , insira o ID do warehouse no qual a instrução SQL será executada.
      • Para **Body/statement_id**, insira o ID da instrução SQL a ser executada.

      Para obter mais informações sobre parâmetros avançados, consulte a documentação da API.

    • Verificar status e obter resultados : verificar o status de uma instrução SQL e coletar os resultados. Insira o seguinte:

      • Para o ID do comando , insira o ID retornado quando o comando SQL foi executado.

      Para obter mais informações sobre o parâmetro, consulte a documentação da API.

    • Cancelar a execução de uma instrução: interrompa a execução de uma instrução SQL. Insira o seguinte:

      • Para ID do comando , insira o ID da instrução SQL a ser encerrada.

      Para obter mais informações sobre o parâmetro, consulte a documentação da API.

    • Obter resultado por índice de fragmento: Obtenha resultados por índice de fragmento, o que é adequado para grandes conjuntos de resultados. Insira o seguinte:

      • Para o ID do comando , insira o ID da instrução SQL cujos resultados se deseja recuperar.
      • Para **Índice de fragmento**, insira o índice de fragmento de destino.

      Para saber mais sobre os parâmetros, consulte a documentação da API.

  5. Para interagir com um Job existente do Databricks, selecione uma das seguintes ações:

    • Listar jobs: Recupera uma lista de jobs. Para obter mais informações, consulte a documentação da API.
    • Acionar uma nova execução de Job: Executa um Job e retorna o run_id da execução acionada. Para obter mais informações, consulte a documentação da API.
    • Obter uma única execução de Job: retorna metadados sobre uma execução, incluindo status da execução (p. ex., RUNNING, SUCCESS, FAILED), hora de início e término, durações da execução, informações do cluster e assim por diante. Para obter mais informações, consulte a documentação da API.
    • Cancelar uma execução: Cancela a execução de um Job ou de uma tarefa. Para obter mais informações, consulte a documentação da API.
    • Obter a saída para uma única execução: Recupera a saída e os metadados de um único Job ou execução de tarefa. Para obter mais informações, consulte a documentação da API.

Realizar atualizações em lote

Se precisar realizar operações de criação, atualização ou exclusão em massa em resposta a entradas do Power Apps, a Databricks recomenda a implementação de um fluxo do Power Automate. Para realizar isso, faça o seguinte:

  1. Crie um aplicativo de tela usando sua conexão Databricks no Power Apps.

  2. Crie um fluxo do Power Automate usando a conexão do Databricks e use o Power Apps como o gatilho.

  3. No gatilho do Power Automate, adicione os campos de entrada que se deseja passar do Power Apps para o Power Automate.

  4. Crie um objeto de coleção no Power Apps para coletar todas as suas alterações.

  5. Adicione o fluxo do Power Automate ao seu aplicativo de tela.

  6. Acione o fluxo do Power Automate a partir do aplicativo de tela e itere sobre a coleção usando um ForAll comando.

    SQL
    ForAll(collectionName, FlowName.Run(input field 1, input field 2, input field 3,)

Gravações concorrentes

A concorrência em nível de linha reduz os conflitos entre operações de gravação concorrentes ao detectar alterações em nível de linha e resolver automaticamente os conflitos que ocorrem quando gravações concorrentes atualizam ou excluem diferentes linhas no mesmo arquivo de dados.

A simultaneidade em nível de linha está incluída no Databricks Runtime 14.2 ou acima. A simultaneidade em nível de linha tem suporte por padrão para os seguintes tipos de tabelas:

  • Tabelas com vetores de exclusão ativados e sem particionamento
  • Tabelas com clustering líquido, a menos que os vetores de exclusão estejam desativados

Para habilitar vetores de exclusão, execute o seguinte comando SQL.

SQL
ALTER TABLE table_name SET TBLPROPERTIES ('delta.enableDeletionVectors' = true);

Para obter mais informações sobre conflitos de gravação concorrentes no Databricks, consulte Níveis de isolamento e conflitos de gravação.

Limitações

Limitações do Power Apps

As seguintes fórmulas PowerFx calculam valores usando apenas os dados recuperados localmente.

Categoria

Fórmula

Função de tabela

  • Agrupar por
  • Distinto

Agregação

  • Contar Linhas
  • Desvio Padrão Populacional
  • DesvPadA