Pular para o conteúdo principal

Use o agente de ciência de dados

info

Beta

Esse recurso está na versão beta.

Esta página apresenta o Agente de ciência de dados, um agente de dados AI disponível ao selecionar Agente Mode em Databricks Assistant. Projetado especificamente para o Databricks Notebook e o SQL Editor, ele explora dados, gera e executa códigos e corrige erros - tudo em um único prompt.

O que é o agente de ciência de dados?

O Agent ciência de dados é um recurso avançado do Agent Mode do Databricks Assistantque transforma o Assistente em um companheiro inteligente capaz de automatizar todo o fluxo de trabalho da ciência de dados em várias etapas no Databricks Notebook e no SQL Editor.

Use o agente de ciência de dados em um Notebook.

Em comparação com o modo Assistant Chat, o modo Agent tem recursos expandidos: planejamento de soluções, recuperação de ativos relevantes, execução de código, uso de saídas de células para melhorar os resultados, correção automática de erros e muito mais.

O agente de ciência de dados pode planejar e gerar código para execução no Notebook ou consultas para execução no editor SQL. O Agente trabalha com o senhor para aprovar seus planos e confirmar os próximos passos antes de prosseguir. Com a aprovação do senhor, o Agente de ciência de dados pode usar ferramentas para realizar tarefas como pesquisar tabelas, editar um Notebook, executar células e ler saídas de células.

O acesso e as ações do agente de ciência de dados são regidos pelas permissões do usuário. Ele só pode acessar os dados aos quais o senhor tem acesso e realizar operações para as quais tem permissão.

Requisitos

Para usar o agente de ciência de dados, o site workspace precisa dos seguintes itens:

Use o agente de ciência de dados

Para usar o agente de ciência de dados:

  1. Em um Notebook Databricks ou no Editor SQL, abra o painel lateral do Assistant.

  2. No canto inferior direito, selecione Agente . Isso ativa o modo Agente do Assistente, permitindo que o senhor interaja com o Agente de ciência de dados.

    Agente de ciência de dados abertos

  3. (Opcional) Para uma tarefa mais longa e aberta, ative a opção Planner (Planejador ). Isso permite que o agente de ciência de dados orquestre cargas de trabalho de várias etapas. O agente cria um plano e faz perguntas de esclarecimento antes de prosseguir com os próximos passos. Com o Planner ativado, o Agent pode gerar um Notebook completo com análise e visualização de dados.

  4. Insira uma solicitação para o Agente. Por exemplo, "Analyze @sales_transactions from samples.bakehouse to identify the top-selling produto."

dica

Faça referência a tabelas específicas usando @table_name. O agente usará essa tabela e todos os metadados associados para selecionar sua resposta. O agente respeita as permissões do Unity Catalog do usuário, portanto, ele só pode acessar os dados aos quais o senhor tem acesso.

  1. À medida que o Agente gera sua resposta e executa seu plano, ele frequentemente faz uma pausa para receber sua opinião:

    • Quando o Planner está ativado, o agente cria um plano passo a passo e faz perguntas esclarecedoras. Responda às perguntas esclarecedoras do agente para ajudá-lo a aprimorar seu plano.

    • Quando o agente precisa executar o código, ele solicita sua aprovação antes de prosseguir. Permitir ou recusar sua solicitação. Você também pode selecionar Permitir neste tópico (referindo-se ao tópico de conversa do Assistente) ou Sempre permitir .

important

O agente de ciência de dados pode gerar e executar códigos em seu Notebook. Embora tenha grades de proteção para evitar ações perigosas, ainda há riscos. Você só deve usá-lo com código e dados em que confia

  • À medida que o agente continua trabalhando, você pode ser solicitado a selecionar Continuar ou Rejeitar . Revise o trabalho existente do Agent e, em seguida, selecione Continue (Continuar ) para permitir que o Agent continue para os próximos passos ou Reject (Rejeitar ) para dizer a ele para tentar outra coisa.

  • Para parar o Agente enquanto ele está funcionando, clique no vermelho Ícone de parada..

O agente pode criar novas células do Notebook (ou consultas), gerar texto e código, executar as células do Notebook e acessar a saída da célula para interpretar os resultados.

nota

Para que o agente de ciência de dados continue seu trabalho e dê os próximos passos, o senhor precisa permanecer no site atual tab em que o agente está trabalhando.

Casos de uso

No modo Agente, o Assistente expandiu os recursos, como localizar dados, interpretar saídas e realizar ações celulares.

Com o Planner ativado, o Agente de ciência de dados pode ajudar em tarefas mais complexas de ciência de dados, incluindo análise exploratória de dados, previsão e machine learning. O senhor pode até mesmo usar o Ciência de Dados Agent para criar um novo Notebook de análise de dados a partir do zero. Para obter melhores resultados, forneça as tabelas que você deseja usar com "@table_name".

Experimente os seguintes prompts para começar:

  • descobrimento de dados :

    • " Qual tabela contém dados de transações da padaria? "
    • " Quero ver os dados meteorológicos para a data 2025-01-01 na cidade de Los Angeles, CA. "
    • " Encontre uma tabela que contenha dados de táxis da cidade de Nova York e me mostre as 10 primeiras linhas. "
  • Análise exploratória de dados :

    • "Ajude-me a analisar as cadeias de caracteres JSON na coluna A."
    • " Crie uma visualização dos dados dessa tabela. "
    • " Interprete esse gráfico de barras. "
    • "Descreva o site @sales_transactions dataset. Realizar alguma EDA para me ajudar a entender as estatísticas da coluna e visualizar a distribuição dos valores. Pense como um cientista de dados."
    • "Analise o site @workload_insights para encontrar os 5 principais clientes de cargas de trabalho do Databricks SQL na semana passada, por receita. Em seguida, graficar quantos usuários esses clientes tiveram para Databricks SQL por semana nas últimas 6 semanas."
  • Previsão :

    • "Usando o site @incidents dataset, crie uma previsão do número diário de incidentes para as próximas duas semanas. Quando terminar, forneça-me uma tabela de dados e um gráfico interativo para exibir os resultados. "
    • "Usando o site @website_traffic dataset, preveja o número de visitantes diários para o próximo mês. Destaque todos os padrões sazonais. "
    • "Gere uma previsão da demanda de produtos para os próximos 6 meses a partir do site @inventory dataset, incluindo intervalos de confiança."
  • Aprendizado de máquina :

    • "Realize alguma preparação de dados e engenharia de recursos para preparar este dataset para treinamento de modelos."
    • "Ensinar um modelo de classificação nos dados do @customer_data dataset para prever a rotatividade. Avalie o modelo com métricas de precisão e AUC."
    • "Realize o ajuste do hiperparâmetro em um modelo de regressão usando @housing_prices dataset para melhorar o erro de previsão."
    • "Crie um modelo clustering no @sales_leads dataset para identificar segmentos de clientes e fornecer um resumo das características de cada cluster."
  • Notebook organização :

    • "Crie uma nova célula que resuma os resultados desse Notebook."
    • "Dê a esse Notebook um nome relevante."

Análise exploratória de dados

Use o Ciência de Dados Agent para realizar uma análise exploratória de dados em um site dataset. Por exemplo, tente usar o Agent para ajudá-lo a criar um novo Notebook que analise o site samples.bakehouse.sales_transactions dataset.

Em um Notebook vazio tab, abra o painel Assistente, selecione o modo Agente e o planejador e digite o seguinte prompt: "Descreva o dataset, @sales_transactions de samples.bakehouse. Quero fazer uma EDA para poder entender as estatísticas da coluna e visualizar a distribuição dos valores. Pense como um cientista de dados."

ciência de dados O agente cria um Notebook para EDA.

O agente cria um plano para responder à sua solicitação e pode fazer perguntas esclarecedoras. Com a aprovação do senhor, ele gera novas células do Notebook que incluem código para explorar os dados e texto que explica o processo e as descobertas.