Compartir a través de


Preprocesamiento de datos para el aprendizaje automático y el aprendizaje profundo

Puede usar el Almacén de características de Databricks para crear nuevas características, explorar y volver a usar las características existentes, seleccionar características para entrenar y puntuar modelos de aprendizaje automático, y publicar características en almacenes en línea de baja latencia para la inferencia en tiempo real.

En grandes conjuntos de datos, puede usar Spark SQL y MLlib para la ingeniería de características. Las bibliotecas de terceros incluidas en Databricks Runtime ML como, por ejemplo, scikit-learn, también proporcionan métodos auxiliares útiles. Para obtener ejemplos, consulte los siguientes cuadernos de Machine Learning para scikit-learn y MLlib:

Para un procesamiento de características de aprendizaje profundo más complejo, este cuaderno de ejemplo muestra cómo usar el aprendizaje por transferencia para la caracterización: