modelo prático observabilidade com Genie Code
Visualização
Este recurso está em Pré-visualização Pública.
Este artigo descreve como Genie Code pode ajudá-lo a diagnosticar problemas, analisar o desempenho e obter orientação para o seu modelo de endpoint instalado.
Requisitos
Para usar Genie Code para servir observabilidade de modelos, seu workspace precisa do seguinte:
- Recursos AI com tecnologia de parceiros habilitados tanto para a account quanto para workspace. Veja recurso AI com tecnologia de parceiros.
- Seu workspace deve estar em uma região compatível. Genie Code é um serviço designado que utiliza Geos para gerenciar a residência de dados. Veja a disponibilidadeGeo do recurso Genie Code.
Atualmente, Genie Code suporta apenas endpoints personalizados do modelo de serviço.
Em que o Genie Code pode ajudar?
Ao usar Genie Code em uma página endpoint do Servindo Modelo, ele se torna um complemento de observabilidade para o Servindo Modelo. Ele pode analisar a integridade endpoint , diagnosticar falhas de implantação, investigar problemas de latência e fornecer orientações sobre as melhores práticas — tudo a partir do painel Genie Code .

Neste modo, o Genie Code é um consultor somente leitura. Ele pode inspecionar seu endpoint e fornecer recomendações, mas não pode modificar configurações ou implantações. Possui instruções claras, passo a passo, e links para a documentação para que você possa fazer as alterações por conta própria.
Comece agora
Para começar:
- Acesse a página endpoint do modelo de atividade.
- Clique
Para abrir o painel Genie Code .
- No canto inferior direito, selecione Agente . Isso ativa o modo Agente do Genie Code.
- Insira uma mensagem descrevendo com o que você precisa de ajuda. Por exemplo, "Verifique a integridade deste endpoint" ou "Por que minha latência está tão alta?"
Capacidades
Exames de saúde e diagnósticos
O Genie Code pode analisar o estado e a configuração do seu endpoint para identificar possíveis problemas:
- Verifique a integridade endpoint e os estados de implantação.
- Analise a configuração em relação às melhores práticas.
- Avaliar a escalabilidade e a utilização de recursos.
Solução de problemas e análise
Genie Code pode ajudar a resolver problemas com seu endpoint:
- Diagnostique falhas de implantação usando logs de compilação, eventos e estado do endpoint.
- Investigue problemas de alta latência ou tempo limite usando métricas, eventos e dados de tabelas de inferência.
- Analise padrões de erros a partir de logs de serviço e tabelas de inferência.
- Identificar configurações incorretas ou restrições de recursos.
- Compare as configurações atuais e futuras com a avaliação de riscos.
Orientações e melhores práticas
O Genie Code fornece recomendações com base na configuração do seu endpoint:
- Recomendar configurações de escalonamento ideais para cargas de trabalho de produção e desenvolvimento.
- Explique os estados endpoint e as transições.
- orientá-lo na configuração de monitoramento e observabilidade.
- Pesquise documentos do Databricks e forneça links para artigos relevantes.
Casos de uso
Experimente estas sugestões para começar:
-
Exames de saúde:
- "Verifique a integridade deste endpoint."
- "Meu endpoint está configurado corretamente?"
- "Revise a configuração de escalonamento do meu endpoint."
-
Falhas na implantação:
- "/diagnose" ou "Por que minha implantação falhou?"
- "Ajude-me a corrigir erros de implantação."
- "Meu endpoint está preso em um estado pendente."
-
Latência:
- "Por que minha latência está tão alta?"
- "Analise o pico de latência desta manhã."
- "Mostre-me as métricas de desempenho das últimas 24 horas."
-
Revisão da configuração:
- "O que mudou na minha configuração pendente?"
- "Minha configuração de concorrência é adequada para produção?"
- "Mostre-me a configuração da minha tabela de inferência."
-
Solicitar à loja:
- "Mostre-me as solicitações recentes para este endpoint."
- "Quais erros meus usuários estão encontrando?"
- "Analise os padrões de erro da última semana."