Solução de problemas e limitações
Solução de problemas
"O banco de dados recommender_system não existe no Hive metastore."
Uma tabela de recursos é armazenada como uma tabela Delta. O banco de dados é especificado pelo prefixo do nome da tabela, portanto, uma tabela de recurso recommender_system.customer_features será armazenado no banco de dados recommender_system .
Para criar o banco de dados, execute:
%sql CREATE DATABASE IF NOT EXISTS recommender_system;
"ModuleNotFoundError: Nenhum módulo chamado 'databricks.feature_engineering'" ou "ModuleNotFoundError: Nenhum módulo chamado 'databricks.feature_store'"
Esse erro ocorre quando o databricks-recurso-engenharia não está instalado no site Databricks Runtime que o senhor está usando.
O databricks-recurso-engenharia está disponível em PyPI, e pode ser instalado com:
%pip install databricks-feature-engineering
"ModuleNotFoundError: Nenhum módulo chamado 'databricks.feature_store'"
Esse erro ocorre quando o databricks-recurso-store não está instalado no site Databricks Runtime que o senhor está usando.
Para Databricks Runtime 14.3 e acima, instale o databricks-recurso-engenharia via %pip install databricks-feature-engineering
O databricks-recurso-store está disponível em PyPI e pode ser instalado com:
%pip install databricks-feature-store
Entrada inválida. Os dados não são compatíveis com a assinatura do modelo. Não é possível converter valores não finitos...'"
Este erro pode ocorrer ao utilizar um modelo de repositório de recursos-pacote no modelo instalado. Ao fornecer valores de recurso personalizados em uma entrada para o endpoint, você deve fornecer um valor para o recurso para cada linha na entrada ou para nenhuma linha. Não é possível fornecer valores personalizados para um recurso apenas para algumas linhas.
"Nenhum armazenamento online adequado encontrado para tabelas de recursos"
Esse erro ocorre ao criar ou recriar um endpoint de serviço para um modelo com pesquisa automática de recursos ou Feature Serving. A mensagem de erro aparece no log de eventos do endpoint de serviço com falha. Isso indica uma desconexão entre sua tabela de recursos offline e o Feature Store Online.
Causa 1: Tabela não publicada
As tabelas de recursos offline precisam estar disponíveis em um armazenamento online para consulta. A causa mais comum do erro é que a tabela de recursos necessária (listada na mensagem de erro) ainda não foi publicada no Feature Store Online.
Resolução : Siga as instruções Feature Store Online para publicar a(s) tabela(s) mencionada(s) no erro.
Causa 2: Tabela de origem recriada (ID incompatível)
Neste caso, uma tabela de recursos offline foi publicada em um armazenamento online e, posteriormente, a tabela de recursos offline foi excluída e recriada. A tabela online rastreia sua origem por meio de source_table_id, que aponta para table_id da tabela offline. Mesmo que a tabela de recurso offline recriada tenha o mesmo nome, ela tem um novo table_id, então o source_table_id da tabela online ainda aponta para a tabela offline antiga (excluída).
Diagnóstico : Você pode verificar se esse é o problema seguindo os passos abaixo:
-
Obtenha o ID da tabela de recursos offline:
- Acesse o Explorador de Catálogo.
- Localize sua tabela de recursos.
- Abra a tab Detalhes e encontre o
table_id.
-
Obtenha o ID da fonte da tabela online:
- Localize a tabela online correspondente no Explorador de Catálogo.
- Abra a tab Detalhes .
- Procure em Propriedades para encontrar o
source_table_id.
Se os IDs não coincidirem, o link está quebrado. Isso significa que a tabela de origem offline foi recriada. Existem duas opções para resolver esse problema.
Opção de resolução 1: Restaurar a tabela offline anterior :
- Use o comando ALTER TABLE RENAME TO para alterar o nome da tabela atual.
- Use o comando UNDROP TABLE WITH ID para restaurar a tabela anterior usando o
source_table_idregistrado na propriedade Tabela Online. - Atualize ou recrie o endpoint de serviço para conectar-se às novas tabelas online.
Opção de resolução 2: Manter a tabela offline atual e publicá-la em um novo armazenamento online :
- Siga as instruções para publicar a tabela de recursos.
- Atualize ou recrie o endpoint de serviço para conectar-se às novas tabelas online.
- Opcional : Limpe a tabela online antiga para evitar confusão.
Limitações
-
Um FeatureSpec pode conter no máximo 1000 recursos. Utilizar um grande número de recursos em um único FeatureSpec pode aumentar a latência Feature Serving .
-
É possível utilizar no máximo 50 tabelas para ensinar um modelo.
-
É possível utilizar no máximo 100 recursos sob demanda em um modelo.
-
clusters Databricks Runtime ML não são suportados ao usar o pipeline LakeFlow Spark Declarative como tabelas de recursos. Em vez disso, use um recurso compute de modo de acesso padrão e instale manualmente o cliente usando
pip install databricks-feature-engineering. Você também deve instalar qualquer outra biblioteca ML necessária.Python%pip install databricks-feature-engineering -
Databricks O recurso Store do espaço de trabalho herdado não suporta a exclusão de recursos individuais de uma tabela de recursos.