Pular para o conteúdo principal

read.parquet arquivos usando Databricks

Este artigo mostra aos senhores como ler dados de arquivos Apache Parquet usando Databricks.

O que é Parquet?

O Apache Parquet é um formato de arquivo colunar com otimizações que aceleram as consultas. É um formato de arquivo mais eficiente do que CSV ou JSON.

Para obter mais informações, consulte Parquet Files.

Opções

Use os métodos .option() e .options() de DataFrameReader e DataFrameWriter para configurar a fonte de dados Parquet . Para obter uma lista completa das opções suportadas, consulte DataFrameReader Opções do Parquet e DataFrameWriter Opções do Parquet.

Notebook exemplo: Ler e gravar em arquivos Parquet

O Notebook a seguir mostra como ler e gravar dados em arquivos Parquet.

Leitura Parquet files Notebook

Abrir notebook em uma nova aba