Solução de problemas e limitações
Solução de problemas
Mensagem de erro: Database recommender_system does not exist in the Hive metastore.
Uma tabela de recursos é armazenada como uma tabela Delta. O banco de dados é especificado pelo prefixo do nome da tabela, portanto, uma tabela de recurso recommender_system.customer_features será armazenado no banco de dados recommender_system .
Para criar o banco de dados, execute:
%sql CREATE DATABASE IF NOT EXISTS recommender_system;
Mensagem de erro: ModuleNotFoundError: No module named 'databricks.feature_engineering' ou ModuleNotFoundError: No module named 'databricks.feature_store'
Esse erro ocorre quando o databricks-recurso-engenharia não está instalado no site Databricks Runtime que o senhor está usando.
O databricks-recurso-engenharia está disponível em PyPI, e pode ser instalado com:
%pip install databricks-feature-engineering
Mensagem de erro: ModuleNotFoundError: No module named 'databricks.feature_store'
Esse erro ocorre quando o databricks-recurso-store não está instalado no site Databricks Runtime que o senhor está usando.
Para Databricks Runtime 14.3 e acima, instale o databricks-recurso-engenharia via %pip install databricks-feature-engineering
O databricks-recurso-store está disponível em PyPI e pode ser instalado com:
%pip install databricks-feature-store
Mensagem de erro: Invalid input. Data is not compatible with model signature. Cannot convert non-finite values...'
Esse erro pode ocorrer ao usar um modelo de recurso Store-pacote em Mosaic AI Model Serving. Ao fornecer valores de recurso personalizados em uma entrada para o site endpoint, o senhor deve fornecer um valor para o recurso para cada linha da entrada ou para nenhuma linha. O senhor não pode fornecer valores personalizados para um recurso apenas para algumas linhas.
Mensagem de erro: No suitable online store found for feature tables
Esse erro ocorre ao configurar um endpoint Mosaic AI Model Serving para um modelo com pesquisa automática de recursos ou Feature Serving. A mensagem de erro aparece no log de eventos do endpoint de serviço com falha. Isso indica uma desconexão entre sua tabela de recursos offline e o Feature Store Online.
Causa 1: Tabela não publicada
As tabelas de recursos offline precisam estar disponíveis em um armazenamento online para consulta. A causa mais comum do erro é que a tabela de recursos necessária (listada na mensagem de erro) ainda não foi publicada no Feature Store Online.
Resolução : Siga as instruções Feature Store Online para publicar a(s) tabela(s) mencionada(s) no erro.
Causa 2: Tabela de origem recriada (ID incompatível)
Solução : Você pode verificar se os IDs das tabelas correspondem e corrigir o problema.
-
Obtenha o ID da tabela de recursos offline:
- Acesse o Explorador de Catálogo.
- Localize sua tabela de recursos.
- Abra a tab Detalhes e encontre o
Table ID.
-
Obtenha o ID da fonte da tabela online:
- Localize a tabela online correspondente no Explorador de Catálogo.
- Abra a tab Detalhes .
- Procure em Propriedades para encontrar o
source_table_id.
-
Comparar e corrigir:
- Se os IDs não coincidirem, o link está quebrado. Isso significa que a tabela de origem offline foi recriada.
- Escolha uma das opções abaixo para corrigir o problema, dependendo se a tabela offline original pode ser restaurada.
Opção 1: Restaurar a tabela offline anterior
- Use o comando ALTER TABLE RENAME TO para alterar o nome da tabela atual.
- Use o comando UNDROP TABLE WITH ID para restaurar a tabela anterior usando o
source_table_idregistrado na propriedade Tabela Online. - Atualize ou recrie o endpoint de serviço para conectar-se às novas tabelas online.
Opção 2: Mantenha a tabela offline atual e publique-a no armazenamento online.
- Siga as instruções para publicar a tabela de recursos.
- Atualize ou recrie o endpoint de serviço para conectar-se às novas tabelas online.
- Opcional : Limpe a tabela online antiga para evitar confusão.
Limitações
-
Um modelo pode usar no máximo 50 tabelas e 100 funções para treinamento.
-
clusters Databricks Runtime ML não são suportados ao usar o pipeline LakeFlow Spark Declarative como tabelas de recursos. Em vez disso, use um recurso compute de modo de acesso padrão e instale manualmente o cliente usando
pip install databricks-feature-engineering. Você também deve instalar qualquer outra biblioteca ML necessária.Python%pip install databricks-feature-engineering -
Databricks O recurso Store do espaço de trabalho herdado não suporta a exclusão de recursos individuais de uma tabela de recursos.
-
Um máximo de 100 recursos on-demand pode ser usado em um modelo.