Pré-processar dados para aprendizado de máquina e aprendizado profundo

Você pode usar Databricks Feature Store para criar novos recursos, explorar e reutilizar recursos existentes, selecionar recursos para treinamento e pontuação modelo do machine learning e publicar recursos em lojas online de baixa latência para inferência em tempo real.

Em dataset grandes, você pode usar Spark SQL e MLlib para engenharia de recursos. A biblioteca de terceiros incluída no Databricks Runtime ML, como Scikit-Learn também fornece métodos auxiliares úteis. Para obter exemplos, consulte o seguinte Notebook machine learning para Scikit-Learn e MLlib:

Para processamento de recursos de aprendizagem profunda mais complexos, este exemplo Notebook ilustra como usar o aprendizado de transferência para caracterização: