Pular para o conteúdo principal

Usar recurso no fluxo de trabalho on-line

Ao usar Databricks Feature Store, cada etapa do seu processo de desenvolvimento de modelos é integrada à plataforma Databricks Data Intelligence. Isso significa que você pode criar pipelines de dados automatizados para compute e fornecer valores de recursos, enquanto Databricks cuida da infraestrutura para você. A plataforma Databricks oferece serviço em tempo real para recursos e modelos, incluindo o cálculo sob demanda de valores de recursos.

Pesquisa automática de recursos

Ao ensinar um modelo usando Databricks Feature Store e disponibilizá-lo com Databricks servindo modelo, o modelo busca automaticamente os valores dos recursos em um Databricks Online Feature Store ou em um armazenamento online de terceiros. Isso acontece automaticamente, sem necessidade de configuração.

importante

As tabelas online do Databricks não são mais suportadas. Se você já possui tabelas online, a Databricks recomenda que você as migre para o Databricks Online Feature Store. Consulte Migrar de tabelas online legadas e de terceiros.

Quando uma solicitação de pontuação chega ao modelo, o servindo modelo recupera automaticamente os valores de recurso publicados necessários ao modelo. Dessa forma, os valores de recurso mais recentes são sempre usados para as previsões. Para obter detalhes e exemplos de Notebook, consulte servindo modelo com pesquisa automática de recurso.

O diagrama a seguir ilustra a relação entre os componentes da plataforma para atendimento em tempo real.

recurso Store fluxo de trabalho com pesquisa on-line

Recurso sob demanda

Os aplicativos reais do modelo do machine learning for tempo geralmente exigem os valores de recurso mais recentes. No exemplo mostrado no diagrama, um recurso para um modelo de recomendação de restaurante é a distância atual do usuário em relação a um restaurante. Esse recurso deve ser calculado "sob demanda", ou seja, no momento da solicitação de pontuação. Ao receber uma solicitação de pontuação, o modelo procura a localização do restaurante e aplica uma função predefinida para calcular a distância entre a localização atual do usuário e o restaurante. Essa distância é passada como uma entrada para o modelo, juntamente com outros recursos pré-computados do armazenamento de recursos. Para obter mais informações, consulte computar recurso on-demand.

compute recurso on demand fluxo de trabalho