Pular para o conteúdo principal

workspace recurso Store (legado)

nota

Esta documentação abrange o recurso Store do espaço de trabalho. workspace recurso Store está disponível somente para workspaces criados antes de 19 de agosto de 2024, 4:00:00 PM (UTC).

Databricks recomenda o uso do recurso engenharia em Unity Catalog. workspace recurso Store será preterido no futuro.

Por que usar o recurso de espaço de trabalho Store?

O workspace recurso Store é totalmente integrado a outros componentes do Databricks.

  • Possibilidade de descoberta. A interface do Feature Store, acessível a partir do espaço de trabalho do Databricks, permite que você navegue e pesquise recursos existentes.
  • Linhagem. Quando o senhor cria uma tabela de recursos em Databricks, a fonte de dados usada para criar a tabela de recursos é salva e fica acessível. Para cada recurso em uma tabela de recursos, o senhor também pode acessar os modelos, o Notebook, o Job e o endpoint que usam o recurso.
  • Integração com pontuação e veiculação de modelo. Quando você usa recursos da Feature Store para treinar um modelo, o modelo é empacotado com metadados de recursos. Quando você usa o modelo para pontuação em lote ou inferência on-line, ele recupera automaticamente os recursos da Feature Store. O chamador não precisa saber sobre eles ou incluir lógica para procurar ou unir recursos para pontuar novos dados. Isso torna a implantação e as atualizações do modelo muito mais fáceis.
  • Pesquisas pontuais. O Feature Store oferece suporte a casos de uso de séries temporais e baseados em eventos que exigem precisão no ponto no tempo.

Como funciona o workspace recurso Store?

O fluxo de trabalho típico de aprendizado de máquina usando o recurso Store segue esse caminho:

  1. Escreva um código para converter dados brutos em recurso e crie um Spark DataFrame contendo o recurso desejado.
  2. Escreva o site DataFrame como uma tabela de recursos no espaço de trabalho Recurso Store.
  3. Treine um modelo usando recurso da loja de recurso. Quando o senhor faz isso, o modelo armazena as especificações do recurso usado para o treinamento. Quando o modelo é usado para inferência, ele automaticamente junta os recursos das tabelas de recursos apropriadas.
  4. modelo de registro em Model Registry.

Agora você pode usar o modelo para fazer previsões sobre novos dados. Para muitos casos de uso, o modelo recupera automaticamente o recurso de que precisa no Recurso Store.

Recurso Store fluxo de trabalho para muitos casos de uso de aprendizado de máquina.

Para casos de uso de serviços de tempo real, publique o recurso em um armazenamento on-line. Veja lojas online de terceiros.

No momento da inferência, o modelo lê os recursos pré-computados do armazenamento on-line e os une aos dados fornecidos na solicitação do cliente para o modelo de atendimento endpoint.

Recurso Fluxo de armazenamento para o modelo de aprendizado de máquina que é servido.

começar a usar o workspace recurso Store

Para começar, experimente estes exemplos do Notebook. O Notebook básico orienta o senhor sobre como criar uma tabela de recursos, usá-la para treinar um modelo e, em seguida, executar a pontuação de lotes usando a pesquisa automática de recursos. Ele também apresenta a UI do recurso engenharia e mostra como o senhor pode usá-la para pesquisar recursos e entender como os recursos são criados e usados.

Espaço de trabalho básico recurso Store exemplo Notebook

Open notebook in new tab

O Notebook de exemplo de táxi ilustra o processo de criação de recursos, atualizando-os e usando-os para treinamento de modelos e inferência de lotes.

workspace recurso Store taxi example Notebook

Open notebook in new tab

Tipos de dados compatíveis

Para os tipos de dados compatíveis, consulte Tipos de dados compatíveis.