bamboolib

Visualização

Este recurso está em visualização pública.

Observação

bamboolib é suportado em Databricks Runtime 11.3 LTS e acima.

bamboolib é um componente de interface do usuário que permite análises e transformações de dados sem código de dentro de um Databricks Notebook. bamboolib ajuda os usuários a trabalhar mais facilmente com seus dados e acelera tarefas comuns de organização, exploração e visualização de dados. À medida que os usuários concluem esses tipos de tarefas com seus dados, o bamboolib gera automaticamente o código Python em segundo plano. Os usuários podem compartilhar esse código com outras pessoas, que podem executá-lo em seu próprio Notebook para reproduzir rapidamente essas tarefas originais. Eles também podem usar o bamboolib para estender essas tarefas originais com tarefas de dados adicionais, tudo sem precisar saber como codificar. Aqueles que têm experiência com codificação podem estender esse código para criar resultados ainda mais sofisticados.

Nos bastidores, bamboolib usa ipywidgets, que é uma estrutura de widget HTML interativa para o kernel IPython. Execução de ipywidgets dentro do kernel do IPython.

Requisitos

  • Um Databricks Notebook, que está anexado a um cluster Databricks com Databricks Runtime 11.0 ouacima.

  • A biblioteca bamboolib deve estar disponível para o site Notebook.

    • Para instalar a biblioteca do PyPI somente em um cluster específico, consulte bibliotecas de clusters.

    • Para usar o comando %pip para tornar a biblioteca disponível somente para um Notebook específico, consulte Notebook-scoped Python libraries.

Começo rápido

  1. Crie um Notebook Python.

  2. Anexe o Notebook a um site cluster que atenda aos requisitos.

  3. Na primeira célula do Notebook , digite o seguinte código, e então execute a célula. Este passo pode ser ignorado se o bamboolib já estiver instalado no workspace ou clusters.

    %pip install bamboolib
    
  4. Na segunda célula do Notebook , insira o seguinte código e, em seguida, execute a célula.

    import bamboolib as bam
    
  5. Na terceira célula do Notebook , insira o seguinte código e, em seguida, execute a célula.

    bam
    

    Observação

    Como alternativa, você pode imprimir um DataFrame pandas existente para exibir bamboolib para uso com esse DataFrame específico.

  6. Continue com as tarefas-chave.

Passo a passo

Você pode usar o bamboolib sozinho ou com um Pandas DataFrame existente.

Use bamboolib sozinho

Neste passo a passo, você usa bamboolib para exibir em seu Notebook o conteúdo de um exemplo de conjunto de dados ventas. Em seguida, você experimenta alguns dos códigos Notebook relacionados que o bamboolib gera automaticamente para você. Você termina consultando e classificando uma cópia do conteúdo do conjunto de dados ventas.

  1. Crie um Notebook Python.

  2. Anexe o Notebook a um site cluster que atenda aos requisitos.

  3. Na primeira célula do Notebook , digite o seguinte código, e então execute a célula. Este passo pode ser ignorado se o bamboolib já estiver instalado no workspace ou clusters.

    %pip install bamboolib
    
  4. Na segunda célula do Notebook , insira o seguinte código e, em seguida, execute a célula.

    import bamboolib as bam
    
  5. Na terceira célula do Notebook , insira o seguinte código e, em seguida, execute a célula.

    bam
    
  6. Clique em Carregar dados fictícios.

  7. No painel Carregar dados fictícios , para Carregar um conjunto de dados fictício para testar bamboolib, selecione datasetventas.

  8. Clique em Executar.

  9. Exiba todas as linhas em que item_type é Baby Food:

    1. Na lista Ações de pesquisa , selecione Filtrar linhas.

    2. No painel Filtrar linhas , na lista Escolher (acima de onde), selecione Selecionar linhas.

    3. Na lista abaixo, selecione item_type.

    4. Na lista Choose ao lado de item_type, selecione has value(s).

    5. Na caixa Escolher valor(es) ao lado de tem valor(es), selecione Comida para bebês.

    6. Clique em Executar.

  10. Copie o código Python gerado automaticamente para esta query:

    1. Clique em Copiar código abaixo da visualização dos dados.

  11. Cole e modifique o código:

    1. Na quarta célula do Notebook , cole o código que você copiou. Deve ficar assim:

      import pandas as pd
      df = pd.read_csv(bam.sales_csv)
      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
    2. Adicione a este código para que ele exiba apenas as linhas em que order_prio é C e, em seguida, execute a célula:

      import pandas as pd
      df = pd.read_csv(bam.sales_csv)
      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
      # Add the following code.
      # Step: Keep rows where order_prio is one of: C
      df = df.loc[df['order_prio'].isin(['C'])]
      df
      

    Dica

    Em vez de escrever esse código, você também pode fazer a mesma coisa usando bamboolib na terceira célula para exibir apenas as linhas em que order_prio é C. Esta passo é um exemplo de extensão do código que bamboolib gerou automaticamente anteriormente.

  12. Classifique as linhas por região em ordem crescente:

    1. No widget da quarta célula, na lista Ações de pesquisa , selecione Classificar linhas.

    2. No painel Classificar coluna(s) , na lista Escolher coluna , selecione região.

    3. Na lista ao lado de region, selecione ascendente (AZ).

    4. Clique em Executar.

    Observação

    Isso é equivalente a escrever você mesmo o seguinte código:

    df = df.sort_values(by=['region'], ascending=[True])
    df
    

    Você também poderia ter usado bamboolib na terceira célula para classificar as linhas por região em ordem crescente. Esta passo demonstra como você pode usar bamboolib para estender o código que você escreve. À medida que você usa bamboolib, ele gera automaticamente o código adicional para você em segundo plano, para que você possa estender ainda mais seu código já estendido!

  13. Continue com as tarefas-chave.

Use bamboolib com um DataFrame existente

Neste passo a passo, você usa bamboolib para exibir em seu Notebook o conteúdo de um Pandas DataFrame. Este DataFrame contém uma cópia de um conjunto de dados ventas de exemplo. Em seguida, você experimenta alguns dos códigos Notebook relacionados que o bamboolib gera automaticamente para você. Você termina consultando e classificando alguns dos conteúdos do DataFrame.

  1. Crie um Notebook Python.

  2. Anexe o Notebook a um site cluster que atenda aos requisitos.

  3. Na primeira célula do Notebook , digite o seguinte código, e então execute a célula. Este passo pode ser ignorado se o bamboolib já estiver instalado no workspace ou clusters.

    %pip install bamboolib
    
  4. Na segunda célula do Notebook , insira o seguinte código e, em seguida, execute a célula.

    import bamboolib as bam
    
  5. Na terceira célula do Notebook , insira o seguinte código e, em seguida, execute a célula.

    import pandas as pd
    
    df = pd.read_csv(bam.sales_csv)
    df
    

    Observe que bamboolib suporta apenas Pandas DataFrames. Para converter um PySpark DataFrame em um Pandas DataFrame, chame toPandas no PySpark DataFrame. Para converter uma API Pandas no Spark DataFrame em um DataFrame pandas, chame to_pandas na API Pandas no Spark DataFrame.

  6. Clique em Mostrar interface do usuário bamboolib.

  7. Exiba todas as linhas em que item_type é Baby Food:

    1. Na lista Ações de pesquisa , selecione Filtrar linhas.

    2. No painel Filtrar linhas , na lista Escolher (acima de onde), selecione Selecionar linhas.

    3. Na lista abaixo, selecione item_type.

    4. Na lista Choose ao lado de item_type, selecione has value(s).

    5. Na caixa Escolher valor(es) ao lado de tem valor(es), selecione Comida para bebês.

    6. Clique em Executar.

  8. Copie o código Python gerado automaticamente para esta query. Para fazer isso, clique em Copiar código abaixo da visualização dos dados.

  9. Cole e modifique o código:

    1. Na quarta célula do Notebook , cole o código que você copiou. Deve ficar assim:

      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
    2. Adicione a este código para que ele exiba apenas as linhas em que order_prio é C e, em seguida, execute a célula:

      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
      # Add the following code.
      # Step: Keep rows where order_prio is one of: C
      df = df.loc[df['order_prio'].isin(['C'])]
      df
      

    Dica

    Em vez de escrever esse código, você também pode fazer a mesma coisa usando bamboolib na terceira célula para exibir apenas as linhas em que order_prio é C. Esta passo é um exemplo de extensão do código que bamboolib gerou automaticamente anteriormente.

  10. Classifique as linhas por região em ordem crescente:

    a. No widget na quarta célula, clique em Classificar linhas.

    1. No painel Classificar coluna(s) , na lista Escolher coluna , selecione região.

    2. Na lista ao lado de region, selecione ascendente (AZ).

    3. Clique em Executar.

    Observação

    Isso é equivalente a escrever você mesmo o seguinte código:

    df = df.sort_values(by=['region'], ascending=[True])
    df
    

    Você também poderia ter usado bamboolib na terceira célula para classificar as linhas por região em ordem crescente. Esta passo demonstra como você pode usar bamboolib para estender o código que você escreve. À medida que você usa bamboolib, ele gera automaticamente o código adicional para você em segundo plano, para que você possa estender ainda mais seu código já estendido!

  11. Continue com as tarefas-chave.

Tarefa chave

Adicionar o widget a uma célula

Cenário: Você deseja que o widget bamboolib seja exibido em uma célula.

  1. Certifique-se de que o Notebook atenda aos requisitos do bamboolib.

  2. Caso o bamboolib ainda não esteja instalado no workspace ou clusters de execução o seguinte código em uma célula do Notebook, preferencialmente na primeira célula:

    %pip install bamboolib
    
  3. execução do seguinte código no Notebook, preferencialmente na primeira ou segunda célula do Notebook :

    import bamboolib as bam
    
  4. Opção 1: Na célula onde deseja que o widget apareça, adicione o seguinte código e, em seguida, execute a célula:

    bam
    

    O widget aparece na célula abaixo do código.

    Ou:

    Opção 2: Em uma célula que contém uma referência a um DataFrame pandas, imprima o DataFrame. Por exemplo, dada a seguinte definição de DataFrame, execute a célula:

    import pandas as pd
    from datetime import datetime, date
    
    df = pd.DataFrame({
      'a': [ 1, 2, 3 ],
      'b': [ 2., 3., 4. ],
      'c': [ 'string1', 'string2', 'string3' ],
      'd': [ date(2000, 1, 1), date(2000, 2, 1), date(2000, 3, 1) ],
      'e': [ datetime(2000, 1, 1, 12, 0), datetime(2000, 1, 2, 12, 0), datetime(2000, 1, 3, 12, 0) ]
    })
    
    df
    

    O widget aparece na célula abaixo do código.

    Observe que bamboolib suporta apenas Pandas DataFrames. Para converter um PySpark DataFrame em um Pandas DataFrame, chame toPandas no PySpark DataFrame. Para converter uma API Pandas no Spark DataFrame em um DataFrame pandas, chame to_pandas na API Pandas no Spark DataFrame.

Limpar o widget

Cenário: você deseja limpar o conteúdo de um widget e, em seguida, ler novos dados no widget existente.

Opção 1: executar o seguinte código dentro da célula que contém o widget de destino:

bam

O widget limpa e exibe novamente os botões Databricks: Read CSV file from DBFS, Databricks: Load database table e Load dummy data .

Observação

Se aparecer o erro name 'bam' is not defined, execute o seguinte código no Notebook (de preferência na primeira célula do Notebook ), e então tente novamente:

import bamboolib as bam

Opção 2: Em uma célula que contém uma referência a um DataFrame pandas, imprima o DataFrame novamente executando a célula novamente. O widget limpa e exibe os novos dados.

tarefa de carregamento de dados

Leia o conteúdo de um conjunto de dados de exemplo no widget

Cenário: Você deseja ler alguns dados de exemplo no widget, por exemplo, alguns dados de vendas simulados, para poder testar a funcionalidade do widget.

  1. Clique em Carregar dados fictícios.

    Observação

    Se Carregar dados fictícios não estiver visível, limpe o widget com a Opção 1 e tente novamente.

  2. No painel Carregar dados fictícios , para Carregar um conjunto de dados fictício para testar bamboolib, selecione o nome do dataset que deseja carregar.

  3. Para Dataframe name, insira um nome para o identificador programático do conteúdo da tabela como DataFrame ou deixe df como o identificador programático default .

  4. Clique em Executar.

    O widget exibe o conteúdo do dataset.

Dica

Você pode alternar o widget atual para exibir o conteúdo de um dataset de exemplo diferente:

  1. No widget atual, clique na tab Carregar dados fictícios .

  2. Siga as passos anteriores para ler o conteúdo do outro datasetde exemplo no widget.

Leia o conteúdo de um arquivo CSV no widget

Cenário: você deseja ler o conteúdo de um arquivo CSV em seu workspace Databricks no widget.

  1. Clique em Databricks: Leia o arquivo CSV do DBFS.

    Observação

    Se Databricks: Read CSV file from DBFS não estiver visível, limpe o widget com a Opção 1 e tente novamente.

  2. No painel Read CSV from DBFS , navegue até o local que contém o arquivo CSV de destino.

  3. Selecione o arquivo CSV de destino.

  4. Para Dataframe name, insira um nome para o identificador programático do conteúdo do arquivo CSV como DataFrame ou deixe df como o identificador programático default .

  5. Para separador de valor CSV, insira o caractere que separa os valores no arquivo CSV ou deixe o caractere , (vírgula) como o separador de valor default .

  6. Em Separador decimal, insira o caractere que separa os decimais no arquivo CSV ou deixe o . (ponto) como o separador de valor default .

  7. Para Limite de linha: leia as primeiras N linhas - deixe em branco para sem limite, insira o número máximo de linhas a serem lidas no widget ou deixe 100.000 como o número default de linhas ou deixe esta caixa vazia para especificar nenhum limite de linha.

  8. Clique em Abrir arquivo CSV.

    O widget exibe o conteúdo do arquivo CSV, com base nas configurações que você especificou.

Dica

Você pode alternar o widget atual para exibir o conteúdo de um arquivo CSV diferente:

  1. No widget atual, clique na tab Ler CSV do DBFS .

  2. Siga as passos anteriores para ler o conteúdo do outro arquivo CSV no widget.

Leia o conteúdo de uma tabela de banco de dados no widget

Cenário: você deseja ler o conteúdo de uma tabela de banco de dados em seu workspace Databricks no widget.

  1. Clique em Databricks: Carregar tabela de banco de dados.

    Observação

    Se Databricks: Carregar tabela de banco de dados não estiver visível, limpe o widget com a Opção 1 e tente novamente.

  2. No painel Databricks: Carregar tabela de banco de dados , em Banco de dados - deixe vazio para banco de dados default , insira o nome do banco de dados no qual a tabela de destino está localizada ou deixe esta caixa vazia para especificar o banco de dados default .

  3. Para Tabela, insira o nome da tabela de destino.

  4. Para Limite de linha: leia as primeiras N linhas - deixe em branco para sem limite, insira o número máximo de linhas a serem lidas no widget ou deixe 100.000 como o número default de linhas ou deixe esta caixa vazia para especificar nenhum limite de linha.

  5. Para Dataframe name, insira um nome para o identificador programático do conteúdo da tabela como DataFrame ou deixe df como o identificador programático default .

  6. Clique em Executar.

    O widget exibe o conteúdo da tabela com base nas configurações que você especificou.

Dica

Você pode alternar o widget atual para exibir o conteúdo de uma tabela diferente:

  1. No widget atual, clique na guia Databricks: Carregar tabela de banco de dados .

  2. Siga as passos anteriores para ler o conteúdo da outra tabela no widget.

tarefa de ação de dados

bamboolib oferece mais de 50 ações de dados. A seguir estão algumas das tarefas de ação de dados mais comuns.

Selecionar colunas

Cenário: você deseja mostrar apenas colunas específicas da tabela por nome, por tipo de dados ou que correspondam a alguma expressão regular. Por exemplo, no datasetventas fictício, você deseja mostrar apenas as colunas item_type e sales_channel ou deseja mostrar apenas as colunas que contêm as strings _date em seus nomes de coluna.

  1. Na tab Dados, na lista suspensa Ações de pesquisa , siga um destes procedimentos:

    • Digite selecionar e, em seguida, selecione Selecionar ou descartar colunas.

    • Selecione Selecionar ou descartar colunas.

  2. No painel Selecionar ou soltar colunas , na lista suspensa Escolher , selecione Selecionar.

  3. Selecione os nomes da coluna de destino ou o critério de inclusão.

  4. Para Dataframe name, insira um nome para o identificador programático do conteúdo da tabela como DataFrame ou deixe df como o identificador programático default .

  5. Clique em Executar.

Soltar colunas

Cenário: você deseja ocultar colunas específicas da tabela por nome, por tipo de dados ou que correspondam a alguma expressão regular. Por exemplo, no datasetventas fictício, você deseja ocultar as colunas order_prio, order_date e ship_date ou deseja ocultar todas as colunas que contêm apenas valores de data e hora.

  1. Na tab Dados, na lista suspensa Ações de pesquisa , siga um destes procedimentos:

    • Digite drop e, em seguida, selecione Selecionar ou descartar colunas.

    • Selecione Selecionar ou descartar colunas.

  2. No painel Selecionar ou soltar colunas , na lista suspensa Escolher , selecione Soltar.

  3. Selecione os nomes da coluna de destino ou o critério de inclusão.

  4. Para Dataframe name, insira um nome para o identificador programático do conteúdo da tabela como DataFrame ou deixe df como o identificador programático default .

  5. Clique em Executar.

Filtrar linhas

Cenário: você deseja mostrar ou ocultar linhas de tabela específicas com base em critérios como valores de coluna específicos que são correspondentes ou ausentes. Por exemplo, no datasetventas fictício, você deseja mostrar apenas as linhas em que o valor da coluna item_type está definido como Baby Food.

  1. Na tab Dados, na lista suspensa Ações de pesquisa , siga um destes procedimentos:

    • Digite filtro e selecione Filtrar linhas.

    • Selecione Filtrar linhas.

  2. No painel Filtrar linhas , na lista suspensa Escolher acima de onde, selecione Selecionar linhas ou Soltar linhas.

  3. Especifique o primeiro critério de filtro.

  4. Para adicionar outro critério de filtro, clique em adicionar condição e especifique o próximo critério de filtro. Repita conforme desejado.

  5. Para Dataframe name, insira um nome para o identificador programático do conteúdo da tabela como DataFrame ou deixe df como o identificador programático default .

  6. Clique em Executar.

Classificar linhas

Cenário: você deseja classificar as linhas da tabela com base nos valores de uma ou mais colunas. Por exemplo, no datasetventas fictício, você deseja mostrar as linhas pelos valores da coluna region em ordem alfabética de A a Z.

  1. Na tab Dados, na lista suspensa Ações de pesquisa , siga um destes procedimentos:

    • Digite classificar e selecione Classificar linhas.

    • Selecione Classificar linhas.

  2. No painel Classificar coluna(s) , escolha a primeira coluna pela qual classificar e a ordem de classificação.

  3. Para adicionar outro critério de classificação, clique em adicionar coluna e especifique o próximo critério de classificação. Repita conforme desejado.

  4. Para Dataframe name, insira um nome para o identificador programático do conteúdo da tabela como DataFrame ou deixe df como o identificador programático default .

  5. Clique em Executar.

Agrupar tarefas de linhas e colunas

Agrupar linhas e colunas por uma única função de agregação

Cenário: você deseja mostrar resultados de linha e coluna por agrupamentos calculados e deseja atribuir nomes personalizados a esses agrupamentos. Por exemplo, no datasetdummy ventas, você deseja agrupar as linhas pelos valores da coluna country, mostrando o número de linhas contendo o mesmo valor country e dando à lista de contagens calculadas o nome country_count.

  1. Na tab Dados, na lista suspensa Ações de pesquisa , siga um destes procedimentos:

    • Digite group e selecione Agrupar por e agregar (com renomeação).

    • Selecione Agrupar por e agregar (com renomeação).

  2. No painel Agrupar por com renomeação de coluna , selecione as colunas pelas quais agrupar, o primeiro cálculo e, opcionalmente, especifique um nome para a coluna calculada.

  3. Para adicionar outro cálculo, clique em adicionar cálculo e especifique o próximo cálculo e o nome da coluna. Repita conforme desejado.

  4. Especifique onde armazenar o resultado.

  5. Para Dataframe name, insira um nome para o identificador programático do conteúdo da tabela como DataFrame ou deixe df como o identificador programático default .

  6. Clique em Executar.

Agrupar linhas e colunas por várias funções agregadas

Cenário: você deseja mostrar resultados de linha e coluna por agrupamentos calculados. Por exemplo, no datasetdummy ventas, você deseja agrupar as linhas pelos valores das colunas region, country e sales_channel, mostrando o número de linhas contendo o mesmo valor region e country por sales_channel, bem como o total_revenue pela combinação exclusiva de region, country e sales_channel.

  1. Na tab Dados, na lista suspensa Ações de pesquisa , siga um destes procedimentos:

    • Digite grupo e selecione Agrupar por e agregar (default).

    • Selecione Agrupar por e agregar (default).

  2. No painel Agrupar por com renomeação de coluna , selecione as colunas para agrupar e o primeiro cálculo.

  3. Para adicionar outro cálculo, clique em adicionar cálculo e especifique o próximo cálculo. Repita conforme desejado.

  4. Especifique onde armazenar o resultado.

  5. Para Dataframe name, insira um nome para o identificador programático do conteúdo da tabela como DataFrame ou deixe df como o identificador programático default .

  6. Clique em Executar.

Remover linhas com valores ausentes

Cenário: você deseja remover qualquer linha que tenha um valor ausente para as colunas especificadas. Por exemplo, no datasetventas fictício, você deseja remover quaisquer linhas que tenham um valor item_type ausente.

  1. Na tab Dados, na lista suspensa Ações de pesquisa , siga um destes procedimentos:

    • Digite descartar ou remover e selecione Eliminar valores ausentes.

    • Selecione Eliminar valores ausentes.

  2. No painel Eliminar valores ausentes , selecione as colunas para remover qualquer linha que tenha um valor ausente para essa coluna.

  3. Para Dataframe name, insira um nome para o identificador programático do conteúdo da tabela como DataFrame ou deixe df como o identificador programático default .

  4. Clique em Executar.

Remover linhas duplicadas

Cenário: você deseja remover qualquer linha que tenha um valor duplicado para as colunas especificadas. Por exemplo, no datasetdummy ventas, você deseja remover todas as linhas que são duplicatas exatas umas das outras.

  1. Na tab Dados, na lista suspensa Ações de pesquisa , siga um destes procedimentos:

    • Digite descartar ou remover e selecione Eliminar/remover duplicatas.

    • Selecione Soltar/Remover duplicatas.

  2. No painel Remover Duplicatas , selecione as colunas para remover qualquer linha que tenha um valor duplicado para essas colunas e, em seguida, selecione se deseja manter a primeira ou a última linha que tenha o valor duplicado.

  3. Para Dataframe name, insira um nome para o identificador programático do conteúdo da tabela como DataFrame ou deixe df como o identificador programático default .

  4. Clique em Executar.

Localizar e substituir valores ausentes

Cenário: você deseja substituir o valor ausente por um valor de substituição para qualquer linha com as colunas especificadas. Por exemplo, no datasetventas fictício, você deseja substituir qualquer linha com um valor ausente na coluna item_type pelo valor Unknown Item Type.

  1. Na tab Dados, na lista suspensa Ações de pesquisa , siga um destes procedimentos:

    • Digite localizar ou substituir e selecione Localizar e substituir valores ausentes.

    • Selecione Localizar e substituir valores ausentes.

  2. No painel Substituir valores ausentes , selecione as colunas para substituir os valores ausentes e especifique o valor de substituição.

  3. Clique em Executar.

Criar uma fórmula de coluna

Cenário: você deseja criar uma coluna que usa uma fórmula exclusiva. Por exemplo, no datasetventas fictício, você deseja criar uma coluna chamada profit_per_unit que exibe o resultado da divisão do valor da coluna total_profit pelo valor da coluna units_sold para cada linha.

  1. Na tab Dados, na lista suspensa Ações de pesquisa , siga um destes procedimentos:

    • Digite fórmula e selecione Nova fórmula de coluna.

    • Selecione Nova fórmula de coluna.

  2. No painel Substituir valores ausentes , selecione as colunas para substituir os valores ausentes e especifique o valor de substituição.

  3. Clique em Executar.

dados ação história tarefa

Veja a lista de ações realizadas no widget

Cenário: você deseja ver uma lista de todas as alterações feitas no widget, começando pela alteração mais recente.

Clique em história. A lista de ações aparece no painel Histórico de transformações .

Desfazer a ação mais recente realizada no widget

Cenário: você deseja reverter a alteração mais recente feita no widget.

Faça um dos seguintes:

  • Clique no ícone de seta no sentido anti-horário.

  • Clique em história e no painel História de transformações , clique em Desfazer última passo.

Refaça a ação mais recente realizada no widget

Cenário: você deseja reverter a reversão mais recente feita no widget.

Faça um dos seguintes:

  • Clique no ícone de seta no sentido horário.

  • Clique em história e no painel História de transformações , clique em Recuperar última passo.

Altere a ação mais recente realizada no widget

Cenário: você deseja alterar a alteração mais recente feita no widget.

  1. Faça um dos seguintes:

    • Clique no ícone de lápis.

    • Clique em história e no painel História de transformações , clique em Editar última passo.

  2. Faça a alteração desejada e clique em Executar.

Obtenha o código para recriar programaticamente o estado atual do widget como um DataFrame

Cenário: você deseja obter o código Python que recria programaticamente o estado do widget atual, representado como um Pandas DataFrame. Você deseja executar este código em uma célula diferente nesta pasta de trabalho ou em uma pasta de trabalho completamente diferente.

  1. Clique em Obter código.

  2. No painel Exportar código , clique em Copiar código. O código é copiado para a área de transferência do seu sistema.

  3. Cole o código em uma célula diferente nesta pasta de trabalho ou em uma pasta de trabalho diferente.

  4. Escreva código adicional para trabalhar com este DataFrame pandas programaticamente e, em seguida, execute a célula. Por exemplo, para exibir o conteúdo do DataFrame, supondo que seu DataFrame seja representado programaticamente por df:

    # Your pasted code here, followed by...
    df
    

Limitações

Consulte Limitações conhecidas Databricks Notebook para obter mais informações.