Δημιουργία του πρώτου σας μοντέλου SynapseML
Αυτό το άρθρο παρουσιάζει τον τρόπο δημιουργίας του πρώτου σας μοντέλου εκμάθησης μηχανής χρησιμοποιώντας το SynapseML και παρουσιάζει τον τρόπο με τον οποίο το SynapseML απλοποιεί σύνθετες εργασίες εκμάθησης μηχανής. Χρησιμοποιούμε το SynapseML για τη δημιουργία μιας μικρής διοχέτευσης εκπαίδευσης εκμάθησης μηχανής που περιλαμβάνει ένα στάδιο δυνατότητας και ένα στάδιο παλινδρόμησης LightGBM. Η διοχέτευση προβλέπει αξιολογήσεις με βάση το κείμενο αναθεώρησης από ένα σύνολο δεδομένων κριτικών βιβλίων amazon. Τέλος, παρουσιάζουμε τον τρόπο με τον οποίο το SynapseML απλοποιεί τη χρήση προκατασκευασμένων μοντέλων για την επίλυση προβλημάτων εκμάθησης μηχανής.
Προαπαιτούμενα στοιχεία
Λάβετε μια συνδρομή Microsoft Fabric. Εναλλακτικά, εγγραφείτε για μια δωρεάν δοκιμαστική έκδοση του Microsoft Fabric.
Εισέλθετε στο Microsoft Fabric.
Χρησιμοποιήστε την εναλλαγή εμπειρίας στην αριστερή πλευρά της αρχικής σελίδας σας για να μεταβείτε στην εμπειρία Synapse Data Science.
- Μεταβείτε στην εμπειρία επιστήμης δεδομένων στο Microsoft Fabric.
- Δημιουργήστε ένα νέο σημειωματάριο.
- Επισυνάψτε το σημειωματάριό σας σε ένα lakehouse. Στην αριστερή πλευρά του σημειωματάριού σας, επιλέξτε Προσθήκη για να προσθέσετε μια υπάρχουσα λίμνη ή να δημιουργήσετε μια νέα.
- Αποκτήστε ένα κλειδί υπηρεσιών Azure AI ακολουθώντας τη Γρήγορη εκκίνηση: Δημιουργήστε έναν πόρο πολλαπλών υπηρεσιών για τις υπηρεσίες Azure AI γρήγορη εκκίνηση. Θα χρειαστείτε αυτό το κλειδί για την ενότητα Χρήση των υπηρεσιών AI του Azure για τον μετασχηματισμό δεδομένων σε ένα βήμα αυτού του άρθρου.
Ρύθμιση του περιβάλλοντος
Εισαγάγετε βιβλιοθήκες SynapseML και προετοιμάστε την περίοδο λειτουργίας Spark.
from pyspark.sql import SparkSession
from synapse.ml.core.platform import *
spark = SparkSession.builder.getOrCreate()
Φόρτωση συνόλου δεδομένων
Φορτώστε το σύνολο δεδομένων σας και διαιρέστε το σε σύνολα εκπαίδευσης και δοκιμών.
train, test = (
spark.read.parquet(
"wasbs://publicwasb@mmlspark.blob.core.windows.net/BookReviewsFromAmazon10K.parquet"
)
.limit(1000)
.cache()
.randomSplit([0.8, 0.2])
)
display(train)
Δημιουργία της διοχέτευσης εκπαίδευσης
Δημιουργήστε μια διοχέτευση που διαθέτει δεδομένα χρησιμοποιώντας TextFeaturizer
από τη synapse.ml.featurize.text
βιβλιοθήκη και αντλεί μια αξιολόγηση χρησιμοποιώντας τη LightGBMRegressor
συνάρτηση .
from pyspark.ml import Pipeline
from synapse.ml.featurize.text import TextFeaturizer
from synapse.ml.lightgbm import LightGBMRegressor
model = Pipeline(
stages=[
TextFeaturizer(inputCol="text", outputCol="features"),
LightGBMRegressor(featuresCol="features", labelCol="rating"),
]
).fit(train)
Πρόβλεψη της εξόδου των δεδομένων δοκιμής
Καλέστε τη transform
συνάρτηση στο μοντέλο για να προβλέψετε και να εμφανίσετε την έξοδο των δεδομένων δοκιμής ως πλαίσιο δεδομένων.
display(model.transform(test))
Χρήση των υπηρεσιών AI του Azure για τον μετασχηματισμό δεδομένων σε ένα βήμα
Εναλλακτικά, για αυτές τις εργασίες που έχουν μια προκατασκευασμένο λύση, μπορείτε να χρησιμοποιήσετε την ενοποίηση του SynapseML με τις υπηρεσίες AI του Azure για να μετασχηματίσετε τα δεδομένα σας σε ένα βήμα.
from synapse.ml.cognitive import TextSentiment
from synapse.ml.core.platform import find_secret
model = TextSentiment(
textCol="text",
outputCol="sentiment",
subscriptionKey=find_secret("cognitive-api-key"), # Replace it with your cognitive service key, check prerequisites for more details
).setLocation("eastus")
display(model.transform(test))
Σχετικό περιεχόμενο
Σχόλια
https://aka.ms/ContentUserFeedback.
Σύντομα διαθέσιμα: Καθ' όλη τη διάρκεια του 2024 θα καταργήσουμε σταδιακά τα ζητήματα GitHub ως μηχανισμό ανάδρασης για το περιεχόμενο και θα το αντικαταστήσουμε με ένα νέο σύστημα ανάδρασης. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα:Υποβολή και προβολή σχολίων για