Acesse o servidor de acompanhamento MLflow de fora do Databricks

Você pode querer logs no servidor de acompanhamento do MLflow a partir de seus próprios aplicativos ou da CLI do MLflow.

Este artigo descreve as passos de configuração necessárias. comece instalando o MLflow e configurando suas credenciais (passo 1). Você pode configurar um aplicativo (passo 2) ou configurar a CLI do MLflow (passo 3).

Para obter informações sobre como iniciar e logs em um servidor de acompanhamento de código aberto, consulte a documentação de código aberto.

passo 1: Configurar seu ambiente

Se você não possui uma account do Databricks, pode experimentar o Databricks gratuitamente. Consulte Get começar: configuração account e workspace .

Para configurar seu ambiente para acessar seu servidor de acompanhamento MLflow hospedado no Databricks:

  1. Instale o MLflow usando pip install mlflow.

  2. Configure a autenticação de acordo com sua inscrição no Databricks.

    • Community Edition. Faça um dos seguintes:

      • (Recomendado) Use mlflow.login() para que suas credenciais sejam solicitadas.

        import mlflow
        
        mlflow.login()
        

        A seguir está um exemplo de resposta. Se a autenticação for bem-sucedida, você verá a mensagem “Assinado com sucesso no Databricks!”.

        2023/10/25 22:59:27 ERROR mlflow.utils.credentials: Failed to sign in Databricks: default auth: cannot configure default credentials
        Databricks Host (should begin with https://): https://community.cloud.databricks.com/
        Username: weirdmouse@gmail.com
        Password: ··········
        2023/10/25 22:59:38 INFO mlflow.utils.credentials: Successfully signed in Databricks!
        
      • Especifique as credenciais usando a variável de ambiente:

        # Configure MLflow to communicate with a Databricks-hosted tracking server
        export MLFLOW_TRACKING_URI=databricks
        # Specify your Databricks username & password
        export DATABRICKS_USERNAME="..."
        export DATABRICKS_PASSWORD="..."
        
    • Plataforma Databricks. Faça um de:

      • Gere tokensde API REST e crie seu arquivo de credenciais usando databricks configure --token.

      • Especifique as credenciais usando a variável de ambiente:

        # Configure MLflow to communicate with a Databricks-hosted tracking server
        export MLFLOW_TRACKING_URI=databricks
        # Specify the workspace hostname and token
        export DATABRICKS_HOST="..."
        export DATABRICKS_TOKEN="..."
        # Or specify your Databricks username & password
        export DATABRICKS_USERNAME="..."
        export DATABRICKS_PASSWORD="..."
        

passo 2: configurar aplicativos MLflow

Configure os aplicativos MLflow para logs no Databricks definindo o URI de acompanhamento como databricks ou databricks://<profileName>, se você especificou um nome de perfil por meio de --profile ao criar seu arquivo de credenciais. Por exemplo, você pode fazer isso definindo a variável de ambiente MLFLOW_TRACKING_URI como “databricks”.

passo 3: Configurar a CLI do MLflow

Configure a CLI do MLflow para se comunicar com um servidor de acompanhamento Databricks com a variável de ambiente MLFLOW_TRACKING_URI . Por exemplo, para criar um experimento usando a CLI com o acompanhamento URI databricks, execução:

# Replace <your-username> with your Databricks username
export MLFLOW_TRACKING_URI=databricks
mlflow experiments create -n /Users/<your-username>/my-experiment