Aplicar AI no uso de dados Databricks AI Functions

info

Visualização

Esse recurso está em Public Preview. Consulte AI e disponibilidade de recurso de aprendizado de máquina para disponibilidade de região.

Este artigo descreve o site Databricks AI Functions e as funções compatíveis.

O que é AI Functions?

AI Functions são funções integradas que o senhor pode usar para aplicar AI, como tradução de texto ou análise de sentimento, em seus dados armazenados em Databricks. Eles podem ser executados de qualquer lugar em Databricks, incluindo Databricks SQL, Notebook, LakeFlow Declarative pipeline e fluxo de trabalho.

AI Functions são simples de usar, rápidos e dimensionáveis. Os analistas podem usá-los para aplicar inteligência de dados a seus dados proprietários, enquanto os engenheiros de aprendizado de máquina e data scientists podem usá-los para criar pipeline de lotes de nível de produção.

AI Functions fornecem funções de uso geral e específicas da tarefa.

ai_query é uma função de uso geral que permite que o senhor aplique qualquer tipo de modelo AI em seus dados. Consulte Função de uso geral: ai_query.
As funções específicas da tarefa fornecem recursos de alto nível para a tarefa AI, como resumo de texto e tradução. Essas funções específicas da tarefa são alimentadas por modelos generativos de última geração AI que são hospedados e gerenciados por Databricks. Consulte as funções específicas da tarefa AI para obter informações sobre as funções e os modelos compatíveis.

Função de uso geral: `ai_query`

A função ai_query() permite que o senhor aplique qualquer modelo AI aos dados para tarefas generativas AI e clássicas ML, incluindo extração de informações, resumo de conteúdo, identificação de fraudes e previsão de receita. Para obter detalhes e parâmetros de sintaxe, consulte a funçãoai_query.

A tabela a seguir resume os tipos de modelos compatíveis, os modelos associados e os requisitos de configuração do servindo modelo endpoint para cada um.

Tipo	Modelos compatíveis	Requisitos
Databricks-modelos de fundação hospedados otimizados para AI Functions	Esses modelos são disponibilizados usando as APIs do Foundation Model. - `databricks-gpt-oss-20b` - `databricks-gpt-oss-120b` - `databricks-gemma-3-12b` - `databricks-llama-4-maverick` - `databricks-meta-llama-3-3-70b-instruct` - `databricks-meta-llama-3-1-8b-instruct` - `databricks-gte-large-en`	Databricks Runtime 15.4 LTS ou acima é necessário para usar essa funcionalidade. Não requer provisionamento ou configuração no site endpoint. O uso desses modelos pelo senhor está sujeito às licenças e aos termos aplicáveis do desenvolvedor do modelo e à disponibilidade regional do AI Functions.
Modelos de fundação ajustados	Modelos de fundação ajustados implantados em Mosaic AI Model Serving	Requer que o senhor crie um provisionamento Taxa de transferência endpoint in servindo modelo. Veja `ai_query` e modelos de fundação personalizados ou ajustados.
Modelos Foundation hospedados fora da Databricks	Modelos disponibilizados usando modelos externos. Consulte Modelos de fundação de acesso hospedados fora da Databricks.	É necessário que o senhor crie um modelo de serviço externo endpoint.
Modelos tradicionais personalizados de ML e DL	Qualquer modelo tradicional de ML ou DL, como `scikit-learn`, `xgboost`, ou PyTorch	É necessário que o senhor crie um modelo de serviço personalizado endpoint.

Usar ai_query com modelos de fundação

O exemplo a seguir demonstra como usar o site ai_query usando um modelo básico hospedado pela Databricks.

Consulte a funçãoai_query para obter detalhes e parâmetros de sintaxe.
Consulte exemplos de cenários avançados para obter orientação sobre como configurar parâmetros para casos de uso avançados.

SQL

SELECT text, ai_query(
    "databricks-meta-llama-3-3-70b-instruct",
    "Summarize the given text comprehensively, covering key points and main ideas concisely while retaining relevant details and examples. Ensure clarity and accuracy without unnecessary repetition or omissions: " || text
) AS summary
FROM uc_catalog.schema.table;

Use `ai_query` com modelos tradicionais de ML

ai_query suporta modelos tradicionais de ML, inclusive modelos totalmente personalizados. Esses modelos devem ser implantados no endpoint do modelo de serviço. Para obter detalhes e parâmetros de sintaxe, consulte Função de funçãoai_query.

SQL
SELECT text, ai_query(
  endpoint => "spam-classification",
  request => named_struct(
    "timestamp", timestamp,
    "sender", from_number,
    "text", text),
  returnType => "BOOLEAN") AS is_spam
FROM catalog.schema.inbox_messages
LIMIT 10

específico da tarefa AI funções

As funções específicas da tarefa têm o escopo de uma determinada tarefa para que o senhor possa automatizar ações de rotina, como resumos simples e traduções rápidas. Databricks recomenda essas funções para começar porque elas invocam um modelo generativo de última geração AI mantido por Databricks e não requerem nenhuma personalização.

Consulte Analisar avaliações de clientes usando AI Functions para ver um exemplo.

A tabela a seguir lista as funções suportadas e a tarefa que cada uma delas executa.

Função	Descrição
ai_analyze_sentiment	Realizar análise de sentimento no texto de entrada usando um modelo gerativo de última geração AI.
ai_classify	Classifique o texto de entrada de acordo com o rótulo fornecido pelo senhor usando um modelo gerativo de última geração AI.
ai_extract	Extrair entidades especificadas por rótulo do texto usando um modelo gerativo de última geração AI.
ai_fix_grammar	Corrija erros gramaticais em textos usando um modelo gerativo de última geração AI.
ai_gen	Responda ao prompt fornecido pelo usuário usando um modelo generativo de última geração AI.
ai_mask	Mascarar entidades especificadas no texto usando um modelo gerativo de última geração AI.
ai_parse_document (Beta)	Extrair conteúdo estruturado de documentos não estruturados usando um modelo gerativo de última geração AI.
ai_similarity	Compare dois strings e compute a pontuação de similaridade semântica usando um modelo gerativo AI de última geração.
ai_summarize	Gerar um resumo do texto usando o site SQL e o modelo gerativo de última geração AI.
ai_translate	Traduza o texto para um idioma de destino especificado usando um modelo gerativo de última geração AI.
IA	Preveja dados até um horizonte especificado. Essa função com valor de tabela foi projetada para extrapolar dados de séries temporais para o futuro.
busca vetorial	Pesquisar e consultar um Mosaic AI Vector Search usando um modelo generativo de última geração AI.

Use AI Functions em Python fluxo de trabalho existente

AI Functions pode ser facilmente integrado ao Python fluxo de trabalho existente.

O seguinte grava a saída do ai_query em uma tabela de saída:

Python
df_out = df.selectExpr(
  "ai_query('databricks-meta-llama-3-3-70b-instruct', CONCAT('Please provide a summary of the following text: ', text), modelParameters => named_struct('max_tokens', 100, 'temperature', 0.7)) as summary"
)
df_out.write.mode("overwrite").saveAsTable('output_table')

O texto a seguir grava o texto resumido em uma tabela:

Python
df_summary = df.selectExpr("ai_summarize(text) as summary")
df_summary.write.mode('overwrite').saveAsTable('summarized_table')

Use AI Functions na produção fluxo de trabalho

Para inferência de grandes lotes de escalas, o senhor pode integrar funções AI específicas da tarefa ou a função de propósito geral ai_query em seu fluxo de trabalho de produção, como LakeFlow Declarative pipeline, Databricks fluxo de trabalho e transmissão estruturada. Isso permite o processamento de grau de produção em escala. Consulte Realizar inferência de lotes LLM usando AI Functions para obter exemplos e detalhes.

Monitorar o progresso do site AI Functions

Para entender quantas inferências foram concluídas ou falharam e solucionar problemas de desempenho, o senhor pode monitorar o progresso das funções AI usando o recurso de perfil de consulta.

Em Databricks Runtime 16.1 ML e acima, na janela de consulta do editor SQL em seu workspace:

Selecione o link Running--- na parte inferior da janela de resultados brutos . A janela de desempenho é exibida à direita.
Clique em See query profile (Ver perfil de consulta ) para view detalhes de desempenho.
Clique em AI Query para ver as métricas dessa consulta específica, incluindo o número de inferências concluídas e com falha e o tempo total que a solicitação levou para ser concluída.

Monitorar o progresso da função AI

O que é AI Functions?​

Função de uso geral: ai_query​

Usar ai_query com modelos de fundação​

Use ai_query com modelos tradicionais de ML​

específico da tarefa AI funções​

Use AI Functions em Python fluxo de trabalho existente​

Use AI Functions na produção fluxo de trabalho​

Monitorar o progresso do site AI Functions​