Modelos de linguagem grande (LLMs) em Databricks

A Databricks simplifica o acesso e a criação de grandes modelos de linguagem disponíveis publicamente.

Databricks Runtime for Machine Learning inclui bibliotecas como Hugging Face Transformers e LangChain que permitem que o senhor integre modelos pré-treinados existentes ou outras bibliotecas de código aberto ao seu fluxo de trabalho. A partir daí, o senhor pode aproveitar os recursos da plataforma Databricks para fazer o ajuste fino dos LLMs usando seus próprios dados para obter um melhor desempenho do domínio.

Além disso, o Databricks oferece funcionalidade integrada para que os usuários do SQL acessem e experimentem LLMs como o Azure OpenAI e o OpenAI usando as funções do AI.

Ajuste fino do modelo básico

important

Esse recurso está em Public Preview. Entre em contato com a equipe do Databricks account para se inscrever no Public Preview.

O Foundation Model Fine-tuning (agora parte do Mosaic AI Model treinamento) é uma interface simples para a pilha de treinamento Databricks para realizar o ajuste fino completo do modelo.

Você pode fazer o seguinte usando o Foundation Model Fine-tuning:

Faça o ajuste fino de um modelo com seus dados personalizados, com os pontos de verificação salvos no MLflow. Você mantém o controle total do modelo ajustado.
Registre automaticamente o modelo no Unity Catalog para fácil implantação com o serviço do modelo.
Ajuste um modelo proprietário completo carregando os pesos de um modelo previamente ajustado.

Consulte Ajuste fino do modelo básico.

Hugging Face Transformadores

Com o Hugging Face Transformers no Databricks, o senhor pode escalar seus aplicativos de lotes de processamento de linguagem natural (NLP) e ajustar modelos para aplicativos de modelos de linguagem grande.

A biblioteca Hugging Face transformers vem pré-instalada em Databricks Runtime 10.4 LTS ML e acima. Muitos dos modelos populares de NLP funcionam melhor em hardware de GPU, portanto, o senhor pode obter o melhor desempenho usando hardware de GPU recente, a menos que use um modelo otimizado especificamente para uso em CPUs.

Espião

O DSpy automatiza o ajuste imediato ao traduzir assinaturas de linguagem natural definidas pelo usuário em instruções completas e alguns exemplos.

Consulte Criar aplicativos generativos AI usando o DSPy em Databricks para obter exemplos de como usar o DSPy.

LangChain

LangChain está disponível como uma variante experimental do MLflow que permite que os clientes do LangChain aproveitem as ferramentas robustas e os recursos de acompanhamento de experimentos do MLflow diretamente do ambiente Databricks.

O LangChain é uma estrutura de software projetada para ajudar a criar aplicativos que utilizam modelos de linguagem grandes (LLMs) e os combinam com dados externos para proporcionar mais contexto de treinamento para seus LLMs.

Databricks Runtime ML inclui langchain em Databricks Runtime 13.1 ML e acima.

Saiba mais sobre as integrações específicas da Databricks com o LangChain.

AI funções

info

Visualização

Esse recurso está em Public Preview.

AI são SQL funções integradas do que permitem aos SQL usuários do:

Use o Databricks Foundation Model APIs para realizar várias tarefas com os dados de sua empresa.
Acesse modelos externos como o GPT-4 da OpenAI e experimente com eles.
Modelos de consulta hospedados pelo ponto de extremidade Mosaic AI Model Serving a partir de consultas SQL.

Ajuste fino do modelo básico​

Hugging Face Transformadores​

Espião​

LangChain​

AI funções​

Ajuste fino do modelo básico

Hugging Face Transformadores

Espião

LangChain

AI funções