Modelos de linguagem grande (LLMs) em Databricks
A Databricks simplifica o acesso e a criação de grandes modelos de linguagem disponíveis publicamente.
Databricks Runtime for Machine Learning inclui bibliotecas como Hugging Face Transformers e LangChain que permitem que o senhor integre modelos pré-treinados existentes ou outras bibliotecas de código aberto ao seu fluxo de trabalho. A partir daí, o senhor pode aproveitar os recursos da plataforma Databricks para fazer o ajuste fino dos LLMs usando seus próprios dados para obter um melhor desempenho do domínio.
Além disso, o Databricks oferece funcionalidade integrada para que os usuários do SQL acessem e experimentem LLMs como o Azure OpenAI e o OpenAI usando as funções do AI.
Ajuste fino do modelo básico
Esse recurso está em Public Preview. Entre em contato com a equipe do Databricks account para se inscrever no Public Preview.
O Foundation Model Fine-tuning (agora parte do Mosaic AI Model treinamento) é uma interface simples para a pilha de treinamento Databricks para realizar o ajuste fino completo do modelo.
Você pode fazer o seguinte usando o Foundation Model Fine-tuning:
- Faça o ajuste fino de um modelo com seus dados personalizados, com os pontos de verificação salvos no MLflow. Você mantém o controle total do modelo ajustado.
- Registre automaticamente o modelo no Unity Catalog para fácil implantação com o serviço do modelo.
- Ajuste um modelo proprietário completo carregando os pesos de um modelo previamente ajustado.
Consulte Ajuste fino do modelo básico.
Hugging Face Transformadores
Com o Hugging Face Transformers no Databricks, o senhor pode escalar seus aplicativos de lotes de processamento de linguagem natural (NLP) e ajustar modelos para aplicativos de modelos de linguagem grande.
A biblioteca Hugging Face transformers
vem pré-instalada em Databricks Runtime 10.4 LTS ML e acima. Muitos dos modelos populares de NLP funcionam melhor em hardware de GPU, portanto, o senhor pode obter o melhor desempenho usando hardware de GPU recente, a menos que use um modelo otimizado especificamente para uso em CPUs.
Espião
O DSpy automatiza o ajuste imediato ao traduzir assinaturas de linguagem natural definidas pelo usuário em instruções completas e alguns exemplos.
Consulte Criar aplicativos generativos AI usando o DSPy em Databricks para obter exemplos de como usar o DSPy.
LangChain
LangChain está disponível como uma variante experimental do MLflow que permite que os clientes do LangChain aproveitem as ferramentas robustas e os recursos de acompanhamento de experimentos do MLflow diretamente do ambiente Databricks.
O LangChain é uma estrutura de software projetada para ajudar a criar aplicativos que utilizam modelos de linguagem grandes (LLMs) e os combinam com dados externos para proporcionar mais contexto de treinamento para seus LLMs.
Databricks Runtime ML inclui langchain
em Databricks Runtime 13.1 ML e acima.
Saiba mais sobre as integrações específicas da Databricks com o LangChain.
AI funções
Visualização
Esse recurso está em Public Preview.
AI são SQL funções integradas do que permitem aos SQL usuários do:
- Use o Databricks Foundation Model APIs para realizar várias tarefas com os dados de sua empresa.
- Acesse modelos externos como o GPT-4 da OpenAI e experimente com eles.
- Modelos de consulta hospedados pelo ponto de extremidade Mosaic AI Model Serving a partir de consultas SQL.