Erreur lors de l’importation de OneHotEncoderEstimator

Problème

vous avez migré un bloc-notes de Databricks Runtime 6,4 pour Machine Learning ou une version antérieure à Databricks Runtime 7,3 pour Machine Learning ou version ultérieure.

Vous tentez d’importer OneHotEncoderEstimator et vous recevez une erreur d’importation.

ImportError: cannot import name 'OneHotEncoderEstimator' from 'pyspark.ml.feature' (/databricks/spark/python/pyspark/ml/feature.py)

Cause

OneHotEncoderEstimator a été renommé OneHotEncoder en Apache Spark 3,0.

Solution

Vous devez remplacer OneHotEncoderEstimator les références dans votre bloc-notes par OneHotEncoder .

par exemple, l’exemple de code suivant retourne une erreur d’importation dans Databricks Runtime 7,3 pour Machine Learning ou version ultérieure :

from pyspark.ml.feature import OneHotEncoderEstimator

l’exemple de code suivant fonctionne correctement dans Databricks Runtime 7,3 pour Machine Learning ou version ultérieure :

from pyspark.ml.feature import OneHotEncoder