recurso governança e linhagem
Esta página descreve os recursos de governança e linhagem da Recurso Engenharia em Unity Catalog.
Para obter informações sobre o monitoramento do desempenho de um modelo servido e alterações nos dados da tabela de recursos, consulte o monitoramento de lakehouse.
Controle o acesso às tabelas de recursos
O controle de acesso para tabelas de recurso em Unity Catalog é gerenciado por Unity Catalog. Consulte os privilégios do Unity Catalog.
visualizar a tabela de recursos, a função e a linhagem do modelo
Quando o senhor log um modelo usando FeatureEngineeringClient.log_model
, o recurso usado no modelo é automaticamente rastreado e pode ser visualizado no Lineage tab do Catalog Explorer. Além das tabelas de recurso, os UDFs do site Python que são usados para compute recurso sob demanda também são rastreados.
Como capturar a linhagem de uma tabela, função ou modelo de recurso
As tabelas e funções de acompanhamento de linhagem usadas nos modelos são capturadas automaticamente quando o senhor chama log_model
. Veja o código de exemplo a seguir.
from databricks.feature_engineering import FeatureEngineeringClient, FeatureLookup, FeatureFunction
fe = FeatureEngineeringClient()
features = [
FeatureLookup(
table_name = "main.on_demand_demo.restaurant_features",
feature_names = ["latitude", "longitude"],
rename_outputs={"latitude": "restaurant_latitude", "longitude": "restaurant_longitude"},
lookup_key = "restaurant_id",
timestamp_lookup_key = "ts"
),
FeatureFunction(
udf_name="main.on_demand_demo.extract_user_latitude",
output_name="user_latitude",
input_bindings={"blob": "json_blob"},
),
FeatureFunction(
udf_name="main.on_demand_demo.extract_user_longitude",
output_name="user_longitude",
input_bindings={"blob": "json_blob"},
),
FeatureFunction(
udf_name="main.on_demand_demo.haversine_distance",
output_name="distance",
input_bindings={"x1": "restaurant_longitude", "y1": "restaurant_latitude", "x2": "user_longitude", "y2": "user_latitude"},
)
]
training_set = fe.create_training_set(
label_df, feature_lookups=features, label="label", exclude_columns=["restaurant_id", "json_blob", "restaurant_latitude", "restaurant_longitude", "user_latitude", "user_longitude", "ts"]
)
class IsClose(mlflow.pyfunc.PythonModel):
def predict(self, ctx, inp):
return (inp['distance'] < 2.5).values
model_name = "fe_packaged_model"
mlflow.set_registry_uri("databricks-uc")
fe.log_model(
IsClose(),
model_name,
flavor=mlflow.pyfunc,
training_set=training_set,
registered_model_name=registered_model_name
)
visualizar a linhagem de uma tabela, modelo ou função de recurso
Para view a linhagem de uma tabela, modelo ou função de recurso, siga estas etapas:
-
Navegue até a tabela, a versão do modelo ou a página da função no Catalog Explorer.
-
Selecione a linhagem tab. A barra lateral esquerda mostra os componentes do site Unity Catalog que foram registrados com essa tabela, versão do modelo ou função.
-
Clique em See lineage graph (Ver gráfico de linhagem ). O gráfico de linhagem é exibido. Para obter detalhes sobre como explorar o gráfico de linhagem, consulte Capturar e explorar a linhagem.
-
Para fechar o gráfico de linhagem, clique em
no canto superior direito.