Get Começar: Consultar e visualizar dados de um Notebook

Este get começar artigos orienta o senhor a usar um Databricks Notebook para consultar dados de amostra armazenados em Unity Catalog usando SQL, Python, Scala e R e, em seguida, visualizar os resultados da consulta no Notebook.

Requisitos

Para concluir a tarefa neste artigo, o senhor deve atender aos seguintes requisitos:

o passo 1: Criar um novo Notebook

Para criar um Notebook em seu workspace:

  1. Clique em Novo ícone New na barra lateral e, em seguida, clique em Notebook.

  2. Na página "Criar Notebook":

    • Especifique um nome exclusivo para o seu notebook.

    • Defina o idioma default para seu Notebook e clique em Confirm, se solicitado.

    • Use o menu Connect dropdown para selecionar um recurso compute. Para criar um novo recurso de computação, consulte Usar computação.

Para saber mais sobre como criar e gerenciar notebooks, consulte Gerenciar notebooks.

o passo 2: Consultar uma tabela

Consulte a tabela samples.nyctaxi.trips no Unity Catalog usando o idioma de sua escolha.

  1. Copie e cole o código a seguir na nova célula vazia do site Notebook. Este código exibe os resultados da consulta da tabela samples.nyctaxi.trips no Unity Catalog.

SELECT * FROM samples.nyctaxi.trips
  1. Copie e cole o código a seguir na nova célula vazia do site Notebook. Este código exibe os resultados da consulta da tabela samples.nyctaxi.trips no Unity Catalog.

display(spark.read.table("samples.nyctaxi.trips"))
  1. Copie e cole o código a seguir na nova célula vazia do site Notebook. Este código exibe os resultados da consulta da tabela samples.nyctaxi.trips no Unity Catalog.

display(spark.read.table("samples.nyctaxi.trips"))
  1. Copie e cole o código a seguir na nova célula vazia do site Notebook. Este código exibe os resultados da consulta da tabela samples.nyctaxi.trips no Unity Catalog.

library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))
  1. Pressione Shift+Enter para executar a célula e depois passe para a próxima célula.

    Os resultados da consulta aparecem no site Notebook.

o passo 3: Exibir os dados

Exibir o valor médio da tarifa por distância de viagem, agrupado pelo código postal de retirada.

  1. Próximo da guia Tabela, clique em + e, em seguida, clique em Visualização.

    O editor de visualização é exibido.

  2. No menu suspenso Visualization Type (Tipo de visualização ), verifique se Bar está selecionado.

  3. Selecione fare_amount para a coluna X.

  4. Selecione trip_distance para a coluna Y.

  5. Selecione Average como o tipo de agregação.

  6. Selecione pickup_zip como a coluna Group by (Agrupar por ).

    Gráfico de barras
  7. Clique em Salvar.

Próximos passos