Pular para o conteúdo principal

Ingerir dados no LakeFlow Designer

info

Visualização

Este recurso está em Pré-visualização Pública.

Esta página descreve as opções disponíveis para importar dados para uma preparação visual de dados no LakeFlow Designer. O Designer pode trabalhar com quaisquer dados acessíveis através do Databricks.

Toda aquisição de dados no Designer começa com o operador Source . Ao abrir o painel de configuração de um operador de origem, você terá as seguintes opções.

Clique em Procurar existentes para abrir o seletor ativo, onde você poderá:

  • Navegue pelas tabelas e volumes no Unity Catalog.
  • Navegue pelos arquivos no sistema de arquivos workspace .

Use esta opção quando seus dados já estiverem no Databricks.

Arraste e solte um arquivo local.

Arraste um arquivo CSV ou Excel do seu computador diretamente para a tela. O designer carrega o arquivo para o sistema de arquivos workspace e cria automaticamente um operador de origem.

nota

A funcionalidade de arrastar e soltar arquivos do Excel requer que o suporte ao formato de arquivo do Excel esteja ativado. Consulte Ler arquivos do Excel.

Criar uma tabela a partir de um arquivo

Selecione "Criar tabela a partir de arquivo" no painel de configuração da Origem para upload um arquivo CSV ou Excel local e criar uma tabela Unity Catalog a partir dele. Use esta opção quando desejar que os dados sejam persistidos como uma tabela `src` em vez de armazenados como um arquivo workspace . Além disso, para grandes volumes de dados, essa opção oferece o melhor desempenho.

Importar do Google Drive

Para importar um arquivo do Google Drive:

  1. No painel de configuração Origem, selecione Importar do Google Drive .
  2. Selecione uma conexão Unity Catalog que tenha acesso ao Google Drive.
  3. Forneça o URL do arquivo.

Isso requer uma conexão do Unity Catalog configurada para acesso ao Google Drive. Consulte a seção "Ingerir arquivos do Google Drive" para saber como configurar as conexões.

Importar do SharePoint

Para importar um arquivo do SharePoint:

  1. No painel de configuração Origem, selecione Importar do SharePoint .
  2. Selecione uma conexão Unity Catalog que tenha acesso ao seu site do SharePoint.
  3. Forneça o link direto para o arquivo .
atenção

Para obter o URL correto, clique com o botão direito do mouse no arquivo no SharePoint, selecione Visualizar e copie o URL da barra de endereços do navegador. Não utilize um link de compartilhamento.

Isso requer uma conexão Unity Catalog configurada para acesso ao SharePoint. Consulte a seção "Ingerir arquivos do SharePoint" para saber como configurar as conexões.

Use LakeFlow Connect para obter fontes adicionais.

Se uma fonte de dados não estiver disponível diretamente no Designer, verifique LakeFlow Connect para obter um conector de gerenciamento. LakeFlow Connect suporta a ingestão de dados de aplicativos SaaS (Salesforce, Workday, HubSpot e outros), bancos de dados, armazenamento cloud e fontes de transmissão. Após importar dados com LakeFlow Connect para uma tabela Unity Catalog , você pode usá-los como uma Fonte no Designer.

Próximos passos