workspace recurso Store (legado)

Observação

Esta documentação abrange o recurso Store do espaço de trabalho. workspace recurso Store está disponível somente para workspaces criados antes de 19 de agosto de 2024, 4:00:00 PM (UTC).

Databricks recomenda o uso do recurso engenharia em Unity Catalog. workspace recurso Store será preterido no futuro.

Por que usar o recurso de espaço de trabalho Store?

O workspace recurso Store é totalmente integrado a outros componentes do Databricks.

  • Possibilidade de descoberta. A interface do Feature Store, acessível a partir do espaço de trabalho do Databricks, permite que você navegue e pesquise recursos existentes.

  • Linhagem. Quando o senhor cria uma tabela de recursos em Databricks, a fonte de dados usada para criar a tabela de recursos é salva e fica acessível. Para cada recurso em uma tabela de recursos, o senhor também pode acessar os modelos, o Notebook, o Job e o endpoint que usam o recurso.

  • Integração com pontuação e veiculação de modelo. Quando você usa recursos da Feature Store para treinar um modelo, o modelo é empacotado com metadados de recursos. Quando você usa o modelo para pontuação em lote ou inferência on-line, ele recupera automaticamente os recursos da Feature Store. O chamador não precisa saber sobre eles ou incluir lógica para procurar ou unir recursos para pontuar novos dados. Isso torna a implantação e as atualizações do modelo muito mais fáceis.

  • Pesquisas pontuais. O Feature Store oferece suporte a casos de uso de séries temporais e baseados em eventos que exigem precisão no ponto no tempo.

Como funciona o workspace recurso Store?

O típico machine learning fluxo de trabalho usando repositório de recursos segue esse caminho:

  1. Escreva um código para converter dados brutos em recurso e crie um Spark DataFrame contendo o recurso desejado.

  2. Escreva o site DataFrame como uma tabela de recursos no espaço de trabalho Recurso Store.

  3. ensinar um modelo usando recurso do repositório de recursos. Quando o senhor faz isso, o modelo armazena as especificações do recurso usado para o treinamento. Quando o modelo é usado para inferência, ele automaticamente junta recurso das tabelas de recurso apropriadas.

  4. modelo de registro em Model Registry.

Agora o senhor pode usar o modelo para fazer previsões sobre novos dados. Para muitos casos de uso, o modelo recupera automaticamente o recurso necessário do repositório de recursos.

repositório de recursos fluxo de trabalho para lotes machine learning casos de uso.

Para casos de uso de serviços de tempo real, publique o recurso em um armazenamento on-line. Consulte Lojas on-line de terceiros.

No momento da inferência, o modelo lê os recursos pré-computados do armazenamento on-line e os une aos dados fornecidos na solicitação do cliente para o modelo de atendimento endpoint.

repositório de recursos flow for modelo do machine learning que são atendidos.

começar a usar o workspace recurso Store

Para começar, experimente estes exemplos do Notebook. O site básico Notebook mostra aos senhores como criar uma tabela de recursos, usá-la para ensinar um modelo e, em seguida, realizar a pontuação de lotes usando a pesquisa automática de recursos. Ele também apresenta a UI do recurso engenharia e mostra como o senhor pode usá-la para pesquisar recursos e entender como os recursos são criados e usados.

Exemplo básico de workspace repositório de recursos Notebook

Abra o bloco de anotações em outra guia

O exemplo de táxi Notebook ilustra o processo de criação de recursos, atualizando-os e usando-os para treinamento de modelos e inferência de lotes.

workspace repositório de recursos taxi example Notebook

Abra o bloco de anotações em outra guia

Tipos de dados compatíveis

Para conhecer os tipos de dados compatíveis, consulte Tipos de dados compatíveis.