Referência das tabelas do sistema MLflow
Visualização
As tabelas do sistema MLflow estão em Public Preview.
As tabelas do sistema mlflow
capturam metadados de experimentos gerenciados no serviço de acompanhamentoMLflow. Essas tabelas permitem que os usuários privilegiados aproveitem as ferramentas do Databricks lakehouse em seus dados do MLflow em todos os espaços de trabalho da região. O senhor pode usar as tabelas para criar painéis personalizados no site AI/BI, configurar o alerta SQL ou realizar consultas analíticas de grande escala.
Por meio das tabelas do sistema mlflow
, os usuários podem responder perguntas como:
- Quais experimentos têm a menor confiabilidade?
- Qual é a utilização média da GPU em diferentes experimentos?
As tabelas do sistema mlflow
começaram a registrar dados de MLflow de todas as regiões em 2 de setembro de 2025. Os dados anteriores a essa data podem não estar disponíveis.
Tabelas disponíveis
O esquema mlflow
inclui as seguintes tabelas:
system.mlflow.experiments_latest
: registra nomes de experimentos e eventos de exclusão temporária. Esses dados são semelhantes aos da página de experimentos na interface do usuário do MLflow.system.mlflow.runs_latest
: Registra informações sobre o ciclo de vida da execução, os parâmetros e tags associados a cada execução e estatísticas agregadas dos valores mínimo, máximo e mais recente de todas as métricas. Esses dados são semelhantes à pesquisa de execução ou à página de detalhes da execução.system.mlflow.run_metrics_history
: Registra o nome, o valor, o carimbo de data/hora e o passo de todos os registros de métricas na execução, que podem ser usados para graficar séries de tempo detalhadas da execução. Esses dados são semelhantes às métricas tab na página de detalhes da execução.
A seguir, um exemplo de como graficar informações de execução usando um dashboard:
Esquemas de tabela
Abaixo estão os esquemas de tabela com descrições e dados de exemplo.
system.mlflow.experiments_latest
Nome da coluna | Tipo de dados | Descrição | Exemplo | Anulável |
---|---|---|---|---|
| string | O ID do site account que contém o experimento MLflow |
| Não |
| carimbo de data/hora | A hora do sistema em que o experimento foi atualizado pela última vez |
| Não |
| carimbo de data/hora | A hora do sistema em que o experimento do MLflow foi excluído suavemente pelo usuário |
| Sim |
| string | A ID do experimento MLflow |
| Não |
| string | O ID do site workspace que contém o experimento MLflow |
| Não |
| string | Nome do experimento fornecido pelo usuário |
| Não |
| carimbo de data/hora | A hora do sistema em que o experimento foi criado |
| Não |
system.mlflow.runs_latest
Nome da coluna | Tipo de dados | Descrição | Exemplo | Anulável |
---|---|---|---|---|
| string | O ID do site account que contém a execução do MLflow |
| Não |
| carimbo de data/hora | A hora do sistema em que a execução foi atualizada pela última vez |
| Não |
| carimbo de data/hora | A hora do sistema em que a execução do MLflow foi excluída suavemente pelo usuário |
| Sim |
| string | O ID do site workspace que contém a execução do MLflow |
| Não |
| string | A ID da execução do MLflow |
| Não |
| string | A ID do experimento do MLflow que contém a execução do MLflow |
| Não |
| string | O nome do diretor ou usuário do Databricks que criou a execução do MLflow |
| Sim |
| carimbo de data/hora | O horário especificado pelo usuário quando a MLflow execução começar |
| Não |
| carimbo de data/hora | O horário especificado pelo usuário quando a execução do MLflow terminou |
| Sim |
| string | O nome da execução do MLflow |
| Não |
| string | O status da execução do MLflow |
| Não |
| map<strings, strings> | Parâmetros de valor-chave da execução do MLflow |
| Não |
| map<strings, strings> | key-value tags set on the MLflow execução |
| Não |
| list<struct<strings, double, double, double>> | Um view agregado que resume as métricas no run_metrics_history |
| Não |
| string | O nome especificado pelo usuário das métricas |
| Não |
| double | O valor mais recente do metric_name na série temporal dessa combinação (execução, metric_name) em run_metrics_history |
| Não |
| double | O valor máximo do metric_name na série temporal dessa combinação (execução, metric_name) em run_metrics_history. Se algum valor NaN tiver sido registrado para uma métrica, o valor será NaN |
| Não |
| double | O valor mínimo do metric_name na série temporal dessa combinação (execução, metric_name) em run_metrics_history. Se algum valor NaN tiver sido registrado para uma métrica, o valor será NaN |
| Não |
system.mlflow.run_metrics_history
Nome da coluna | Tipo de dados | Descrição | Exemplo | Anulável |
---|---|---|---|---|
| string | O ID do site account contendo a execução MLflow para a qual as métricas foram registradas |
| Não |
| carimbo de data/hora | A hora do sistema em que as métricas foram inseridas |
| Não |
| string | Um identificador exclusivo das métricas para distinguir entre valores idênticos |
| Não |
| string | O ID do site workspace contendo a execução MLflow para a qual as métricas foram registradas |
| Não |
| string | O ID do experimento MLflow que contém a execução MLflow na qual as métricas foram registradas |
| Não |
| string | O ID da MLflow execução para a qual as métricas foram registradas |
| Não |
| string | O nome métricas |
| Não |
| carimbo de data/hora | O horário especificado pelo usuário quando as métricas foram computadas |
| Não |
| BigInt | O passo (por exemplo, época) do treinamento do modelo ou do desenvolvimento do agente em que as métricas foram registradas |
| Não |
| double | O valor das métricas |
| Não |
compartilhamento de acesso com os usuários
Em default, somente os administradores de account têm acesso aos esquemas do sistema. Para conceder aos usuários adicionais acesso às tabelas, o administrador do site account deve conceder a eles as permissões USE e SELECT no esquema system.mlflow.
. Consulte Privilégios e objetos protegidos do Unity Catalog.
Qualquer usuário que tenha acesso a essas tabelas pode view metadados em todos os experimentos do MLflow para todos os espaços de trabalho no account . Para configurar o acesso à tabela para um determinado grupo em vez de usuários individuais, consulte as práticas recomendadas do Unity Catalog.
Se o senhor precisar de um controle mais refinado do que conceder a todos os usuários acesso à tabela, poderá usar a exibição dinâmica com critérios personalizados para conceder determinados acessos a grupos. Por exemplo, o senhor poderia criar um view que mostrasse apenas os registros de um determinado conjunto de IDs de experimentos. Depois de configurar um view personalizado, forneça o nome do view aos seus usuários para que eles possam consultar o view dinâmico em vez da tabela do sistema diretamente.
O senhor não pode sincronizar diretamente as permissões de experimento do MLflow com as permissões do Unity Catalog.
Exemplos de casos de uso de metadados do MLflow
As seções a seguir dão exemplos de como o senhor pode usar as tabelas do sistema MLflow para responder a perguntas sobre os experimentos e a execução do MLflow.
Configurar um alerta SQL para baixa confiabilidade do experimento
Usando o Databricks SQL alerta (Beta), o senhor pode programar uma consulta recorrente regular e ser notificado se determinadas restrições não forem mais atendidas.
Esse exemplo cria um alerta que examina os experimentos executados com mais frequência no site workspace para determinar se eles estão apresentando baixa confiabilidade e se precisam de atenção especial. A consulta usa a tabela runs_latest
para calcular a execução por experimento que está marcada como concluída, dividida pelo número total de execuções.
O recurso de alerta SQL está atualmente em Beta, e o senhor também pode usar o alerta antigo.
-
Clique em
alerta na barra lateral e clique em Create alerta .
-
Copie e cole a consulta a seguir no editor de consultas.
SQLSELECT
experiment_id,
AVG(CASE WHEN status = 'FINISHED' THEN 1.0 ELSE 0.0 END) AS success_ratio,
COUNT(status) AS run_count
FROM system.mlflow.runs_latest
WHERE status IS NOT NULL
GROUP BY experiment_id
ORDER BY run_count DESC
LIMIT 20; -
No campo Condição , defina as condições como
MIN success_ratio < 0.9
. Isso acionará o alerta se qualquer um dos 20 principais experimentos (por número de execução) tiver uma taxa de sucesso inferior a 90%.
Além disso, o senhor pode testar a condição, definir um programa e configurar notificações. Para obter mais informações sobre como configurar o alerta, consulte a configuração de um alerta em SQL. abaixo é um exemplo de configuração usando a consulta.
Exemplos de consultas
O senhor pode usar as seguintes consultas de amostra para obter informações sobre a atividade do MLflow em seu account usando Databricks SQL. O senhor também pode aproveitar ferramentas como Python Notebook com Spark.
Obter informações de execução do runs_latest
SELECT
run_name,
date(start_time) AS start_date,
status,
TIMESTAMPDIFF(MINUTE, start_time, end_time) AS run_length_minutes
FROM system.mlflow.runs_latest
WHERE
experiment_id = :experiment_id
AND run_id = :run_id
LIMIT 1
Retorna informações sobre a execução fornecida:
Obtenha informações sobre experimentos e execução em experiments_latest
e runs_latest
SELECT
runs.run_name,
experiments.name,
date(runs.start_time) AS start_date,
runs.status,
TIMESTAMPDIFF(MINUTE, runs.start_time, runs.end_time) AS run_length_minutes
FROM system.mlflow.runs_latest runs
JOIN system.mlflow.experiments_latest experiments ON runs.experiment_id = experiments.experiment_id
WHERE
runs.experiment_id = :experiment_id
AND runs.run_id = :run_id
LIMIT 1
Obter estatísticas resumidas para uma determinada execução a partir de run_metrics_history
SELECT
metric_name,
count(metric_time) AS num_data_points,
ROUND(avg(metric_value), 1) AS avg,
ROUND(max(metric_value), 1) AS max,
ROUND(min(metric_value), 1) AS min,
ROUND(PERCENTILE_CONT(0.25) WITHIN GROUP (ORDER BY metric_value), 1) AS pct_25,
ROUND(PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY metric_value), 1) AS median,
ROUND(PERCENTILE_CONT(0.75) WITHIN GROUP (ORDER BY metric_value), 1) AS pct_75
FROM
system.mlflow.run_metrics_history
WHERE
run_id = :run_id
GROUP BY
metric_name, run_id
LIMIT 100
Isso retorna um resumo das métricas para o site run_id
fornecido:
Dashboards para experimentos e execução
O senhor pode criar painéis com base nos dados das tabelas do sistema MLflow para analisar seus experimentos MLflow e a execução de todo o workspace.
Para obter mais detalhes, consulte Criar dashboards com metadados do MLflow em tabelas do sistema