Pular para o conteúdo principal

Use o Genie Code para ciência de dados

Esta página apresenta o Genie Code para ciência de dados. Projetado especificamente para Databricks Notebook e o Editor SQL , Genie Code no modo Agente pode explorar dados, gerar e executar código e corrigir erros — tudo a partir de um único prompt.

O que é o Genie Code para ciência de dados?

O modo Agent do Genie Code pode automatizar todo o fluxo de trabalho científico de dados em várias etapas no Databricks Notebook e no SQL Editor.

Use o agente de ciência de dados em um Notebook.

Em comparação com o modo Genie Code Chat, o modo Agente possui funcionalidades expandidas: planejamento de soluções, recuperação de informações relevantes, execução de código, uso de saídas de células para melhorar os resultados, correção automática de erros e muito mais.

Genie Code pode planejar e gerar código para execução em um Notebook ou consultas para execução no editor SQL . Genie Code trabalha com você para aprovar seus planos e confirmar os próximos passos antes de prosseguir. Com sua aprovação, Genie Code poderá usar ferramentas para executar tarefas como pesquisar tabelas, editar um Notebook, executar células e ler as saídas das células.

O acesso e as ações do Genie Code são regidos pelas permissões do usuário. Ele só pode acessar dados aos quais você tem acesso e executar operações para as quais você possui permissões.

Requisitos

Para utilizar as funcionalidades de ciência de dados agentiva do Genie Code, seu workspace precisa do seguinte:

Use o Genie Code para ciência de dados

Para usar Genie Code para tarefa de ciência de dados:

  1. A partir de um Notebook Databricks ou do Editor SQL , abra o painel lateral Genie Code.

  2. Digite o código Genie solicitado. Por exemplo, "Analise @sales_transactions de samples.bakehouse para identificar o produto mais vendido."

dica

Faça referência a tabelas específicas usando @table_name. O agente usará essa tabela e todos os metadados associados para selecionar sua resposta. O agente respeita as permissões do Unity Catalog do usuário, portanto, ele só pode acessar os dados aos quais o senhor tem acesso.

  1. À medida que o Genie Code gera sua resposta, ele frequentemente faz uma pausa para obter sua entrada:

    • Para tarefas mais complexas, Genie Code pode criar um plano passo a passo e fazer perguntas para esclarecimento. Responda às suas perguntas esclarecedoras para ajudá-lo a aprimorar seu plano.

    • Quando Genie Code precisa executar um código, ele solicita sua aprovação antes de prosseguir. Permitir ou recusar a solicitação. Você também pode selecionar "Permitir nesta conversa" (referindo-se à conversa sobre o código Genie) ou "Sempre permitir" .

importante

Genie Code pode gerar e executar código no seu Notebook. Embora possua guarda-corpos para evitar ações perigosas, ainda existe risco. Você só deve usá-lo com código e dados em que confia.

  • À medida que o Genie Code continua a processar o código, você poderá ser solicitado a selecionar Continuar ou Rejeitar. Analise o trabalho já realizado pelo Genie Code e selecione Continuar para permitir que ele prossiga para os próximos passos ou Rejeitar para que ele tente algo diferente.

  • Para interromper o Genie Code enquanto ele estiver em execução, clique no botão vermelho.Ícone de parada..

Genie Code pode criar novas células (ou consultas) no Notebook, gerar texto e código, executar as células do Notebook e acessar a saída da célula para interpretar os resultados.

nota

Para que Genie Code continue funcionando e execute as próximas etapas, você precisa permanecer na tab atual em que ele está sendo executado.

dica

Você pode adicionar instruções para o Genie Code no modo Agente para usá-las na maioria das respostas. Por exemplo, se você tiver convenções de código ou uma biblioteca preferida para usar, poderá adicionar essas diretrizes às instruções do Genie Code. Você também pode criar habilidades para estender Genie Code com recursos especializados para sua tarefa específica de domínio. Para obter mais detalhes e outras dicas, consulte Dicas para melhorar as respostas do Genie Code.

Casos de uso

No modo Agente, o Genie Code possui funcionalidades expandidas, como encontrar dados, interpretar resultados e executar ações nas células.

Genie Code pode ajudar em tarefas complexas de ciência de dados, incluindo análise exploratória de dados, previsão e machine learning. Você pode até mesmo criar um novo Notebook de análise de dados do zero com Genie Code. Para obter melhores resultados, forneça ao agente contexto referenciando tabelas, pipeline, Notebook, consultas e arquivos com @<resource_name>. Você também pode clicar No ícone. Adicione contexto para selecionar manualmente o contexto a ser fornecido. Cada referência ativa persiste no contexto do chat.

Experimente os seguintes prompts para começar:

  • descobrimento de dados :

    • " Qual tabela contém dados de transações da padaria? "
    • " Quero ver os dados meteorológicos para a data 2025-01-01 na cidade de Los Angeles, CA. "
    • " Encontre uma tabela que contenha dados de táxis da cidade de Nova York e me mostre as 10 primeiras linhas. "
  • Análise exploratória de dados :

    • "Ajude-me a analisar as cadeias de caracteres JSON na coluna A."
    • " Crie uma visualização dos dados dessa tabela. "
    • " Interprete esse gráfico de barras. "
    • "Descreva o site @sales_transactions dataset. Realizar alguma EDA para me ajudar a entender as estatísticas da coluna e visualizar a distribuição dos valores. Pense como um cientista de dados."
    • "Analise o site @workload_insights para encontrar os 5 principais clientes de cargas de trabalho do Databricks SQL na semana passada, por receita. Em seguida, graficar quantos usuários esses clientes tiveram para Databricks SQL por semana nas últimas 6 semanas."
  • Previsão :

    • "Usando o site @incidents dataset, crie uma previsão do número diário de incidentes para as próximas duas semanas. Quando terminar, forneça-me uma tabela de dados e um gráfico interativo para exibir os resultados. "
    • "Usando o site @website_traffic dataset, preveja o número de visitantes diários para o próximo mês. Destaque todos os padrões sazonais. "
    • "Gere uma previsão da demanda de produtos para os próximos 6 meses a partir do site @inventory dataset, incluindo intervalos de confiança."
  • Aprendizado de máquina :

    • "Realize alguma preparação de dados e engenharia de recursos para preparar este dataset para treinamento de modelos."
    • "ensinar um modelo de classificação no dataset @customer_data para prever a rotatividade. Avalie o modelo com as métricas de precisão e AUC.
    • "Realizar ajuste de hiperparâmetros em um modelo de regressão usando o dataset @housing_prices para melhorar o erro de previsão."
    • "Construa um modelo clustering no dataset @sales_leads para identificar segmentos de clientes e fornecer um resumo das características de cada cluster."
  • Notebook organização :

    • "Crie uma nova célula que resuma os resultados desse Notebook."
    • "Dê a esse Notebook um nome relevante."

Análise exploratória de dados

Utilize Genie Code para realizar análises exploratórias de dados em um dataset. Por exemplo, tente pedir que ele ajude você a criar um novo Notebook que analise o dataset samples.bakehouse.sales_transactions .

Em uma tab de Notebook vazia, abra o painel Genie Code e insira o seguinte prompt: "Descreva o dataset, @sales_transactions. Quero fazer uma análise exploratória de dados (EDA) para entender as estatísticas das colunas e visualizar a distribuição dos valores.

ciência de dados O agente cria um Notebook para EDA.

O agente cria um plano para responder à sua solicitação e pode fazer perguntas esclarecedoras. Com a aprovação do senhor, ele gera novas células do Notebook que incluem código para explorar os dados e texto que explica o processo e as descobertas.