workspace repositório de recursos (Legado)
Observação
Esta documentação abrange o workspace repositório de recursos. Use esta página somente se o seu workspace não estiver habilitado para Unity Catalog.
Databricks recomenda o uso do recurso engenharia em Unity Catalog. workspace repositório de recursos será descontinuado no futuro.
Por que usar o workspace repositório de recursos?
workspace O repositório de recursos é totalmente integrado a outros componentes do Databricks.
Possibilidade de descoberta. A interface do Feature Store, acessível a partir do espaço de trabalho do Databricks, permite que você navegue e pesquise recursos existentes.
Linhagem. Quando o senhor cria uma tabela de recursos em Databricks, a fonte de dados usada para criar a tabela de recursos é salva e fica acessível. Para cada recurso em uma tabela de recursos, o senhor também pode acessar os modelos, o Notebook, o Job e o endpoint que usam o recurso.
Integração com pontuação e veiculação de modelo. Quando você usa recursos da Feature Store para treinar um modelo, o modelo é empacotado com metadados de recursos. Quando você usa o modelo para pontuação em lote ou inferência on-line, ele recupera automaticamente os recursos da Feature Store. O chamador não precisa saber sobre eles ou incluir lógica para procurar ou unir recursos para pontuar novos dados. Isso torna a implantação e as atualizações do modelo muito mais fáceis.
Pesquisas pontuais. O Feature Store oferece suporte a casos de uso de séries temporais e baseados em eventos que exigem precisão no ponto no tempo.
Como funciona o workspace repositório de recursos?
O típico machine learning fluxo de trabalho usando repositório de recursos segue esse caminho:
Escreva um código para converter dados brutos em recurso e crie um Spark DataFrame contendo o recurso desejado.
Escreva o DataFrame como uma tabela de recursos no workspace repositório de recursos.
ensinar um modelo usando recurso do repositório de recursos. Quando o senhor faz isso, o modelo armazena as especificações do recurso usado para o treinamento. Quando o modelo é usado para inferência, ele automaticamente junta recurso das tabelas de recurso apropriadas.
modelo de registro em Model Registry.
Agora o senhor pode usar o modelo para fazer previsões sobre novos dados. Para muitos casos de uso, o modelo recupera automaticamente o recurso necessário do repositório de recursos.
Para casos de uso de serviços de tempo real, publique o recurso em um armazenamento on-line. Consulte Lojas on-line de terceiros.
No momento da inferência, o modelo lê os recursos pré-computados do armazenamento on-line e os une aos dados fornecidos na solicitação do cliente para o modelo de atendimento endpoint.
começar a usar workspace repositório de recursos
Para começar, experimente estes exemplos do Notebook. O site básico Notebook mostra aos senhores como criar uma tabela de recursos, usá-la para ensinar um modelo e, em seguida, realizar a pontuação de lotes usando a pesquisa automática de recursos. Ele também apresenta a UI do recurso engenharia e mostra como o senhor pode usá-la para pesquisar recursos e entender como os recursos são criados e usados.
O exemplo de táxi Notebook ilustra o processo de criação de recursos, atualizando-os e usando-os para treinamento de modelos e inferência de lotes.
Tipos de dados compatíveis
Para conhecer os tipos de dados compatíveis, consulte Tipos de dados compatíveis.