Começar: Consultar e visualizar dados de um Notebook
Este get começar artigos orienta o senhor a usar um Notebook Databricks para consultar dados de amostra armazenados em Unity Catalog usando SQL, Python, Scala e R e, em seguida, visualizar os resultados da consulta no Notebook.
Requisitos
Para concluir a tarefa neste artigo, o senhor deve atender aos seguintes requisitos:
- O site workspace deve ter Unity Catalog habilitado. Para obter informações sobre como começar com Unity Catalog, consulte Configurar e gerenciar Unity Catalog.
- O senhor deve ter permissão para usar um recurso existente no site compute ou criar um novo recurso no site compute. Consulte Começar com Databricks ou consulte o administrador do site Databricks.
Etapa 1: Criar um novo Notebook
Para criar um notebook no seu workspace, clique em Novo na barra lateral e clique em Notebook . Um notebook em branco será aberto no workspace.
Para saber mais sobre como criar e gerenciar o Notebook, consulte gerenciar o Notebook.
Etapa 2: consultar uma tabela
Consulte a tabela samples.nyctaxi.trips
no Unity Catalog usando o idioma de sua escolha.
- Copie e cole o código a seguir na nova célula vazia do Notebook. Este código exibe os resultados da consulta da tabela
samples.nyctaxi.trips
no Unity Catalog.
- SQL
- Python
- Scala
- R
SELECT * FROM samples.nyctaxi.trips
display(spark.read.table("samples.nyctaxi.trips"))
display(spark.read.table("samples.nyctaxi.trips"))
library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))
-
Pressione
Shift+Enter
para executar a célula e depois passar para a próxima célula.Os resultados da consulta aparecem no Notebook.
Etapa 3: exibir os dados
Exiba o valor médio da tarifa por distância da viagem, agrupado pelo CEP de coleta.
-
Perto da guia Tabela , clique em + e, em seguida, clique em Visualização .
O editor de visualização é exibido.
-
No menu suspenso Visualization Type (Tipo de visualização ), verifique se Bar está selecionado.
-
Selecione
fare_amount
para a coluna X. -
Selecione
trip_distance
para a coluna Y. -
Selecione
Average
como o tipo de agregação. -
Selecione
pickup_zip
como Agrupar por coluna. -
Clique em Salvar .
Próximas etapas
- Para saber mais sobre como adicionar dados do arquivo CSV ao Unity Catalog e visualizar dados, consulte Get começar: Importar e visualizar dados de CSV de um Notebook.
- Para saber como carregar dados em Databricks usando Apache Spark, consulte o tutorial: Carregamento e transformação de dados usando Apache Spark DataFrames .
- Para saber mais sobre a ingestão de dados no Databricks, consulte Ingestão de dados em um Databricks lakehouse.
- Para saber mais sobre a consulta de dados com o Databricks, consulte Consultar dados.
- Para saber mais sobre visualizações, consulte Visualizações em Databricks Notebook.
- Para saber mais sobre as técnicas de análise exploratória de dados (EDA), consulte o tutorial: EDA techniques using Databricks Notebook.