Use o agente de ciência de dados
Beta
Esse recurso está na versão beta.
Esta página apresenta o Agente de ciência de dados, um agente de dados AI disponível ao selecionar Agente Mode em Databricks Assistant. Projetado especificamente para o Databricks Notebook e o SQL Editor, ele explora dados, gera e executa códigos e corrige erros - tudo em um único prompt.
O que é o agente de ciência de dados?
O Agent ciência de dados é um recurso avançado do Agent Mode do Databricks Assistantque transforma o Assistente em um companheiro inteligente capaz de automatizar todo o fluxo de trabalho da ciência de dados em várias etapas no Databricks Notebook e no SQL Editor.
Em comparação com o modo Assistant Chat, o modo Agent tem recursos expandidos: planejamento de soluções, recuperação de ativos relevantes, execução de código, uso de saídas de células para melhorar os resultados, correção automática de erros e muito mais.
O agente de ciência de dados pode planejar e gerar código para execução no Notebook ou consultas para execução no editor SQL. O Agente trabalha com o senhor para aprovar seus planos e confirmar os próximos passos antes de prosseguir. Com a aprovação do senhor, o Agente de ciência de dados pode usar ferramentas para realizar tarefas como pesquisar tabelas, editar um Notebook, executar células e ler saídas de células.
O acesso e as ações do agente de ciência de dados são regidos pelas permissões do usuário. Ele só pode acessar os dados aos quais o senhor tem acesso e realizar operações para as quais tem permissão.
Requisitos
Para usar o agente de ciência de dados, o site workspace precisa dos seguintes itens:
- parceiros-powered AI recurso habilitado tanto para o account quanto para o workspace. Consulte Ativar e experimentar o Databricks Assistant.
- ciência de dados Visualização do agente ativada. Veja gerenciar Databricks Previews.
Use o agente de ciência de dados
Para usar o agente de ciência de dados:
-
Em um Notebook Databricks ou no Editor SQL, abra o painel lateral do Assistant.
-
No canto inferior direito, selecione Agente . Isso ativa o modo Agente do Assistente, permitindo que o senhor interaja com o Agente de ciência de dados.
-
(Opcional) Para uma tarefa mais longa e aberta, ative a opção Planner (Planejador ). Isso permite que o agente de ciência de dados orquestre cargas de trabalho de várias etapas. O agente cria um plano e faz perguntas de esclarecimento antes de prosseguir com os próximos passos. Com o Planner ativado, o Agent pode gerar um Notebook completo com análise e visualização de dados.
-
Insira uma solicitação para o Agente. Por exemplo, "Analyze
@sales_transactions
from samples.bakehouse to identify the top-selling produto."
Faça referência a tabelas específicas usando @table_name
. O agente usará essa tabela e todos os metadados associados para selecionar sua resposta. O agente respeita as permissões do Unity Catalog do usuário, portanto, ele só pode acessar os dados aos quais o senhor tem acesso.
-
À medida que o Agente gera sua resposta e executa seu plano, ele frequentemente faz uma pausa para receber sua opinião:
-
Quando o Planner está ativado, o agente cria um plano passo a passo e faz perguntas esclarecedoras. Responda às perguntas esclarecedoras do agente para ajudá-lo a aprimorar seu plano.
-
Quando o agente precisa executar o código, ele solicita sua aprovação antes de prosseguir. Permitir ou recusar sua solicitação. Você também pode selecionar Permitir neste tópico (referindo-se ao tópico de conversa do Assistente) ou Sempre permitir .
-
O agente de ciência de dados pode gerar e executar códigos em seu Notebook. Embora tenha grades de proteção para evitar ações perigosas, ainda há riscos. Você só deve usá-lo com código e dados em que confia
-
À medida que o agente continua trabalhando, você pode ser solicitado a selecionar Continuar ou Rejeitar . Revise o trabalho existente do Agent e, em seguida, selecione Continue (Continuar ) para permitir que o Agent continue para os próximos passos ou Reject (Rejeitar ) para dizer a ele para tentar outra coisa.
-
Para parar o Agente enquanto ele está funcionando, clique no vermelho
.
O agente pode criar novas células do Notebook (ou consultas), gerar texto e código, executar as células do Notebook e acessar a saída da célula para interpretar os resultados.
Para que o agente de ciência de dados continue seu trabalho e dê os próximos passos, o senhor precisa permanecer no site atual tab em que o agente está trabalhando.
Casos de uso
No modo Agente, o Assistente expandiu os recursos, como localizar dados, interpretar saídas e realizar ações celulares.
Com o Planner ativado, o Agente de ciência de dados pode ajudar em tarefas mais complexas de ciência de dados, incluindo análise exploratória de dados, previsão e machine learning. O senhor pode até mesmo usar o Ciência de Dados Agent para criar um novo Notebook de análise de dados a partir do zero. Para obter melhores resultados, forneça as tabelas que você deseja usar com "@table_name
".
Experimente os seguintes prompts para começar:
-
descobrimento de dados :
- " Qual tabela contém dados de transações da padaria? "
- " Quero ver os dados meteorológicos para a data 2025-01-01 na cidade de Los Angeles, CA. "
- " Encontre uma tabela que contenha dados de táxis da cidade de Nova York e me mostre as 10 primeiras linhas. "
-
Análise exploratória de dados :
- "Ajude-me a analisar as cadeias de caracteres JSON na coluna A."
- " Crie uma visualização dos dados dessa tabela. "
- " Interprete esse gráfico de barras. "
- "Descreva o site
@sales_transactions
dataset. Realizar alguma EDA para me ajudar a entender as estatísticas da coluna e visualizar a distribuição dos valores. Pense como um cientista de dados." - "Analise o site
@workload_insights
para encontrar os 5 principais clientes de cargas de trabalho do Databricks SQL na semana passada, por receita. Em seguida, graficar quantos usuários esses clientes tiveram para Databricks SQL por semana nas últimas 6 semanas."
-
Previsão :
- "Usando o site
@incidents
dataset, crie uma previsão do número diário de incidentes para as próximas duas semanas. Quando terminar, forneça-me uma tabela de dados e um gráfico interativo para exibir os resultados. " - "Usando o site
@website_traffic
dataset, preveja o número de visitantes diários para o próximo mês. Destaque todos os padrões sazonais. " - "Gere uma previsão da demanda de produtos para os próximos 6 meses a partir do site
@inventory
dataset, incluindo intervalos de confiança."
- "Usando o site
-
Aprendizado de máquina :
- "Realize alguma preparação de dados e engenharia de recursos para preparar este dataset para treinamento de modelos."
- "Ensinar um modelo de classificação nos dados do @customer_data dataset para prever a rotatividade. Avalie o modelo com métricas de precisão e AUC."
- "Realize o ajuste do hiperparâmetro em um modelo de regressão usando @housing_prices dataset para melhorar o erro de previsão."
- "Crie um modelo clustering no @sales_leads dataset para identificar segmentos de clientes e fornecer um resumo das características de cada cluster."
-
Notebook organização :
- "Crie uma nova célula que resuma os resultados desse Notebook."
- "Dê a esse Notebook um nome relevante."
Análise exploratória de dados
Use o Ciência de Dados Agent para realizar uma análise exploratória de dados em um site dataset. Por exemplo, tente usar o Agent para ajudá-lo a criar um novo Notebook que analise o site samples.bakehouse.sales_transactions
dataset.
Em um Notebook vazio tab, abra o painel Assistente, selecione o modo Agente e o planejador e digite o seguinte prompt: "Descreva o dataset, @sales_transactions de samples.bakehouse. Quero fazer uma EDA para poder entender as estatísticas da coluna e visualizar a distribuição dos valores. Pense como um cientista de dados."
O agente cria um plano para responder à sua solicitação e pode fazer perguntas esclarecedoras. Com a aprovação do senhor, ele gera novas células do Notebook que incluem código para explorar os dados e texto que explica o processo e as descobertas.