Pular para o conteúdo principal

read.parquet arquivos usando Databricks

Este artigo mostra aos senhores como ler dados de arquivos Apache Parquet usando Databricks.

O que é Parquet?

O Apache Parquet é um formato de arquivo colunar com otimizações que aceleram as consultas. É um formato de arquivo mais eficiente do que CSV ou JSON.

Para obter mais informações, consulte Parquet Files.

Opções

Consulte os seguintes artigos de referência do Apache Spark para obter as opções de leitura e gravação com suporte.

Notebook exemplo: Ler e gravar em arquivos Parquet

O Notebook a seguir mostra como ler e gravar dados em arquivos Parquet.

Leitura Parquet files Notebook

Open notebook in new tab