Criação de uma execução de treinamento usando a IU do Mosaic AI Model Training
Importante
Este recurso está em prévia pública em us-east-1
e us-west-2
.
Este artigo descreve como criar e configurar uma execução de treinamento usando a IU do Mosaic AI Model Training (o antigo Foundation Model Training). Você também pode criar uma execução usando a API. Para obter instruções, consulte Criar uma execução de treinamento usando a API do Mosaic AI Model Training.
Requisitos
Consulte Requisitos.
Criar uma execução de treinamento usando a interface do usuário
Siga as etapas para criar uma execução de treinamento usando a interface do usuário.
Na barra lateral esquerda, clique em Experimentos.
No cartão Treinamento do Modelo do Mosaic AI , clique em Criar Experimento do Modelo do Mosaic AI.
O formulário Mosaic AI Model Training é aberto. Os itens marcados com um asterisco são obrigatórios. Faça suas seleções e clique em Start Training (Iniciar treinamento).
Tipo: selecione a tarefa a ser executada.
Tarefa
Descrição
Ajuste fino de instruções
Continuar treinando um modelo base com instruções e respostas rápidas para otimizar o modelo para uma tarefa específica.
Pré-treinamento contínuo
Continuar treinando um modelo básico para dar a ele conhecimento específico do domínio.
Conclusão do bate-papo
Continuar treinando um modelo base com logs de conversa para otimizá-lo para perguntas e respostas ou aplicações de conversação.
Selecione o modelo de base: Selecione o modelo a ser ajustado ou treinado. Para obter uma lista dos modelos compatíveis, consulte Modelos compatíveis.
Dados de treinamento: clique em Procurar para selecionar uma tabela no Unity Catalog ou insira o URL completo do dataset do Hugging Face. Para ver as recomendações de tamanho de dados, consulte Tamanho de dados recomendado para treinamento de modelo.
Se você selecionar uma tabela no Unity Catalog, também deverá selecionar a computação a ser usada para ler a tabela.
Registro no local: selecione o catálogo e o esquema do Unity Catalog nos menus suspensos. O modelo treinado é salvo nesse local.
Nome do modelo: o modelo é salvo com esse nome no catálogo e no esquema que você especificou. Um nome default aparece neste campo, mas você pode alterá-lo se desejar.
Opções avançadas: para maior personalização, você pode definir configurações opcionais para avaliação, ajuste de hiperparâmetros ou treinar a partir de um modelo proprietário existente.
Contexto
Descrição
Duração do treinamento
Duração da execução de treinamento, especificada em épocas (por exemplo,
10ep
) ou tokens (por exemplo,1000000tok
). O default é1ep
.Taxa de aprendizagem
Taxa de aprendizagem para treinamento de modelos. O default é
5e-7
. O otimizador é o DecoupledLionW com betas de 0,99 e 0,95 e sem decaimento de peso. O programador da taxa de aprendizagem é o LinearWithWarmupSchedule com um aquecimento de 2% da duração total do treinamento e um multiplicador de taxa de aprendizagem final de 0.Comprimento do contexto
O comprimento máximo da sequência da amostra de dados. Dados maiores que esta configuração serão truncados. O default depende do modelo selecionado.
Dados de avaliação
Clique em Procurar para selecionar uma tabela no Unity Catalog ou insira o URL completo do dataset do Hugging Face. Se deixar esse campo em branco, não será realizada nenhuma avaliação.
Solicitações de avaliação de modelo
Digite instruções opcionais a serem usadas para avaliar o modelo.
Nome do experimento
Por default, atribui-se um novo nome gerado automaticamente a cada execução. Você pode optar por inserir um nome personalizado ou selecionar um experimento existente na lista suspensa.
Pesos personalizados
Por padrão, o treinamento começa usando os pesos originais do modelo selecionado. Para começar com pesos personalizados de um ponto de verificação do Compositor, insira o caminho para a tabela do Unity Catalog que contém os valores do ponto de verificação.
Próximos passos
Após a conclusão da execução do treinamento, você poderá revisar as métricas no MLflow e implantar o modelo para inferência. Consulte as etapas 5 a 7 do tutorial: criar e implantar uma execução do treinamento do Mosaic AI Model.
Consulte o Notebook Ajuste fino de instruções: Reconhecimento de entidades nomeadas para ver um exemplo de ajuste fino de instruções que aborda a preparação de dados, o ajuste fino, o treinamento, a execução, a configuração e a implantação.