Get Começar: Consultar e visualizar dados de um Notebook

Este get começar artigos orienta o senhor a usar um Databricks Notebook para consultar dados de amostra armazenados em Unity Catalog usando SQL, Python, Scala e R e, em seguida, visualizar os resultados da consulta no Notebook.

Requisitos

Para concluir a tarefa neste artigo, o senhor deve atender aos seguintes requisitos:

  • O site workspace deve ter Unity Catalog habilitado. Para obter informações sobre como começar com Unity Catalog, consulte Configurar e gerenciar Unity Catalog.

  • O senhor deve ter permissão para usar um recurso compute existente ou criar um novo recurso compute. Consulte Começar com Databricks ou consulte o administrador do site Databricks.

o passo 1: Criar um novo Notebook

Para criar um Notebook em seu workspace, clique em Novo ícone New na barra lateral e, em seguida, clique em Notebook. Um Notebook em branco é aberto no site workspace.

Para saber mais sobre como criar e gerenciar notebooks, consulte Gerenciar notebooks.

o passo 2: Consultar uma tabela

Consulte a tabela samples.nyctaxi.trips no Unity Catalog usando o idioma de sua escolha.

  1. Copie e cole o código a seguir na nova célula vazia do site Notebook. Este código exibe os resultados da consulta da tabela samples.nyctaxi.trips no Unity Catalog.

    SELECT * FROM samples.nyctaxi.trips
    
    display(spark.read.table("samples.nyctaxi.trips"))
    
    display(spark.read.table("samples.nyctaxi.trips"))
    
    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. Pressione Shift+Enter para executar a célula e depois passe para a próxima célula.

    Os resultados da consulta aparecem no site Notebook.

o passo 3: Exibir os dados

Exibir o valor médio da tarifa por distância de viagem, agrupado pelo código postal de retirada.

  1. Próximo da guia Tabela, clique em + e, em seguida, clique em Visualização.

    O editor de visualização é exibido.

  2. No menu suspenso Visualization Type (Tipo de visualização ), verifique se Bar está selecionado.

  3. Selecione fare_amount para a coluna X.

  4. Selecione trip_distance para a coluna Y.

  5. Selecione Average como o tipo de agregação.

  6. Selecione pickup_zip como a coluna Group by (Agrupar por ).

    Gráfico de barras
  7. Clique em Salvar.

Próximos passos