read.parquet arquivos usando Databricks
Este artigo mostra aos senhores como ler dados de arquivos Apache Parquet usando Databricks.
O que é Parquet?
O Apache Parquet é um formato de arquivo colunar com otimizações que aceleram as consultas. É um formato de arquivo mais eficiente do que CSV ou JSON.
Para obter mais informações, consulte Parquet Files.
Opções
Use os métodos .option() e .options() de DataFrameReader e DataFrameWriter para configurar a fonte de dados Parquet . Para obter uma lista completa das opções suportadas, consulte DataFrameReader Opções do Parquet e DataFrameWriter Opções do Parquet.
Notebook exemplo: Ler e gravar em arquivos Parquet
O Notebook a seguir mostra como ler e gravar dados em arquivos Parquet.