read.parquet arquivos usando Databricks
Este artigo mostra aos senhores como ler dados de arquivos Apache Parquet usando Databricks.
O que é Parquet?
O Apache Parquet é um formato de arquivo colunar com otimizações que aceleram as consultas. É um formato de arquivo mais eficiente do que CSV ou JSON.
Para obter mais informações, consulte Parquet Files.
Opções
Consulte os seguintes artigos de referência do Apache Spark para obter as opções de leitura e gravação com suporte.
Notebook exemplo: Ler e gravar em arquivos Parquet
O Notebook a seguir mostra como ler e gravar dados em arquivos Parquet.