Υπολογισμμένα σενάρια πίνακα και περιπτώσεις χρήσης

Υπάρχουν πλεονεκτήματα στη χρήση υπολογισμών πινάκων σε μια ροή δεδομένων. Αυτό το άρθρο περιγράφει περιπτώσεις χρήσης για υπολογισμένους πίνακες και περιγράφει τον τρόπο με τον οποίο λειτουργούν στο παρασκήνιο.

Τι είναι ένας υπολογισμένος πίνακας;

Ένας πίνακας αντιπροσωπεύει την έξοδο δεδομένων ενός ερωτήματος που δημιουργήθηκε σε μια ροή δεδομένων, μετά την ανανέωση της ροής δεδομένων. Αντιπροσωπεύει δεδομένα από μια προέλευση και, προαιρετικά, τους μετασχηματισμούς που έχουν εφαρμοστεί σε αυτή. Ορισμένες φορές, μπορεί να θέλετε να δημιουργήσετε νέους πίνακες που αποτελούν συνάρτηση ενός πίνακα που προσελήφθησε προηγουμένως.

Παρόλο που είναι δυνατό να επαναλάβετε τα ερωτήματα που δημιούργησαν έναν πίνακα και να εφαρμόσετε νέους μετασχηματισμούς σε αυτά, αυτή η προσέγγιση έχει μειονεκτήματα: τα δεδομένα προσλαμβάνονται δύο φορές και ο φόρτος στην προέλευση δεδομένων διπλασιάζεται.

Οι υπολογισμένοι πίνακες επιλύουν και τα δύο προβλήματα. Οι υπολογισμένοι πίνακες μοιάζουν με άλλους πίνακες ως προς το ότι λαμβάνουν δεδομένα από μια προέλευση και μπορείτε να εφαρμόσετε περαιτέρω μετασχηματισμούς για να τους δημιουργήσετε. Ωστόσο, τα δεδομένα τους προέρχονται από τη ροή δεδομένων χώρου αποθήκευσης που χρησιμοποιείται και όχι από την αρχική προέλευση δεδομένων. Αυτό σημαίνει ότι δημιουργήθηκαν προηγουμένως από μια ροή δεδομένων και, στη συνέχεια, επαναχρησιμοποιήθηκαν.

Οι υπολογισμένοι πίνακες μπορούν να δημιουργηθούν με αναφορά σε έναν πίνακα στην ίδια ροή δεδομένων ή με αναφορά σε έναν πίνακα που δημιουργήθηκε σε διαφορετική ροή δεδομένων.

Στιγμιότυπο οθόνης με έμφαση σε έναν υπολογισμένο πίνακα.

Γιατί να χρησιμοποιήσω έναν υπολογισμένο πίνακα;

Η εκτέλεση όλων των βημάτων μετασχηματισμού σε έναν πίνακα μπορεί να είναι αργή. Μπορεί να υπάρχουν πολλοί λόγοι για αυτήν την επιβράδυνση. Η προέλευση δεδομένων μπορεί να είναι αργή ή οι μετασχηματισμοί που κάνετε μπορεί να χρειαστεί να αντιγραφούν σε δύο ή περισσότερα ερωτήματα. Μπορεί να είναι επωφελές να προσλάβετε πρώτα τα δεδομένα από την προέλευση και, στη συνέχεια, να τα χρησιμοποιήσετε ξανά σε έναν ή περισσότερους πίνακες. Σε αυτές τις περιπτώσεις, μπορεί να επιλέξετε να δημιουργήσετε δύο πίνακες: έναν που λαμβάνει δεδομένα από την προέλευση δεδομένων και έναν άλλο, έναν υπολογισμένο πίνακα, ο οποίος εφαρμόζει περισσότερους μετασχηματισμούς σε δεδομένα που έχουν ήδη εγγραφεί στη λίμνη δεδομένων που χρησιμοποιείται από μια ροή δεδομένων. Αυτή η αλλαγή μπορεί να αυξήσει την απόδοση και την επαναχρησιμότητα των δεδομένων, εξοικονομώντας χρόνο και πόρους.

Για παράδειγμα, εάν δύο πίνακες μοιράζονται ακόμη και ένα μέρος της λογικής μετασχηματισμού τους, χωρίς υπολογισμένο πίνακα, ο μετασχηματισμός πρέπει να γίνει δύο φορές.

Εικόνα που εμφανίζει τον μετασχηματισμό των δεδομένων που πραγματοποιήθηκε δύο φορές.

Ωστόσο, εάν χρησιμοποιείται ένας υπολογισμένος πίνακας, τότε το κοινό (κοινόχρηστο) τμήμα του μετασχηματισμού επεξεργάζεται μία φορά και αποθηκεύεται στο Azure Data Lake Υπηρεσία αποθήκευσης. Η επεξεργασία των υπόλοιπων μετασχηματισμών προκύπτει από την έξοδο του κοινού μετασχηματισμού. Συνολικά, αυτή η επεξεργασία είναι πολύ ταχύτερη.

Εικόνα που εμφανίζει συνήθεις μετασχηματισμούς που έγιναν μία φορά στον υπολογισμένο πίνακα και αποθηκεύτηκε στη λίμνη δεδομένων και τους υπόλοιπους μοναδικούς μετασχηματισμούς που πραγματοποιήθηκαν αργότερα.

Ένας υπολογισμένος πίνακας παρέχει ένα σημείο ως πηγαίο κώδικα για τον μετασχηματισμό και επιταχύνει τον μετασχηματισμό, επειδή χρειάζεται να γίνει μόνο μία φορά αντί για πολλές φορές. Επίσης, μειώνεται ο φόρτος στην προέλευση δεδομένων.

Παράδειγμα σεναρίου για τη χρήση ενός υπολογισμένου πίνακα

Εάν δημιουργείτε έναν πίνακα συνάθροισης στο Power BI για να επιταχύνετε το μοντέλο δεδομένων, μπορείτε να δημιουργήσετε τον πίνακα συνάθροισης αναφέροντας τον αρχικό πίνακα και εφαρμόζοντας περισσότερους μετασχηματισμούς σε αυτόν. Χρησιμοποιώντας αυτήν την προσέγγιση, δεν χρειάζεται να αναπαραγάγετε τον μετασχηματισμό σας από την προέλευση (το τμήμα που προέρχεται από τον αρχικό πίνακα).

Για παράδειγμα, η παρακάτω εικόνα εμφανίζει έναν πίνακα Orders.

Στιγμιότυπο οθόνης του πίνακα Orders.

Χρησιμοποιώντας μια αναφορά από αυτόν τον πίνακα, μπορείτε να δημιουργήσετε έναν υπολογισμένο πίνακα.

Δημιουργία ενός υπολογισμένου πίνακα.

Στιγμιότυπο οθόνης που δείχνει πώς μπορείτε να δημιουργήσετε έναν υπολογισμένο πίνακα από τον πίνακα Orders. Πρώτα κάντε δεξί κλικ στον πίνακα Orders στο τμήμα παραθύρου Ερωτήματα και επιλέξτε Αναφορά από το αναπτυσσόμενο μενού. Αυτή η ενέργεια δημιουργεί τον υπολογισμένο πίνακα, ο οποίος μετονομάζεται εδώ σε Συγκεντρωτικές παραγγελίες.

Ο υπολογισμένος πίνακας μπορεί να έχει περαιτέρω μετασχηματισμούς. Για παράδειγμα, μπορείτε να χρησιμοποιήσετε την Ομαδοποίηση κατά για να συγκεντρώσετε τα δεδομένα σε επίπεδο πελάτη.

Στιγμιότυπο οθόνης του πίνακα συγκεντρωτικών αποτελεσμάτων Orders με έμφαση στη στήλη Customer.

Αυτό σημαίνει ότι ο πίνακας Συγκεντρωτικές παραγγελίες λαμβάνει δεδομένα από τον πίνακα Orders και όχι ξανά από την προέλευση δεδομένων. Επειδή ορισμένοι από τους μετασχηματισμούς που πρέπει να εκτελεστούν έχουν ήδη γίνει στον πίνακα Orders, οι επιδόσεις είναι καλύτερες και ο μετασχηματισμός δεδομένων είναι ταχύτερος.

Υπολογισμένος πίνακας σε άλλες ροές δεδομένων

Μπορείτε επίσης να δημιουργήσετε έναν υπολογισμένο πίνακα σε άλλες ροές δεδομένων. Μπορεί να δημιουργηθεί με τη λήψη δεδομένων από μια ροή δεδομένων με τη σύνδεση ροής δεδομένων Microsoft Power Platform.

Λήψη δεδομένων από ροές δεδομένων Power Platform.

Εικόνα τονίζει τη σύνδεση ροών δεδομένων Power Platform από το παράθυρο επιλογή προέλευσης δεδομένων Power Query. Περιλαμβάνεται επίσης μια περιγραφή που αναφέρει ότι ένας πίνακας ροής δεδομένων μπορεί να δημιουργηθεί με βάση τα δεδομένα από έναν άλλο πίνακα ροής δεδομένων, ο οποίος είναι ήδη μόνιμος στον χώρο αποθήκευσης.

Η έννοια του υπολογισμένου πίνακα είναι να διατηρείται ένας πίνακας στον χώρο αποθήκευσης και άλλοι πίνακες να προέρχονται από αυτόν, ώστε να μπορείτε να μειώσετε τον χρόνο ανάγνωσης από την προέλευση δεδομένων και να μοιραστείτε ορισμένους από τους συνήθεις μετασχηματισμούς. Αυτή η μείωση μπορεί να επιτευχθεί με τη λήψη δεδομένων από άλλες ροές δεδομένων μέσω της σύνδεσης ροής δεδομένων ή με την αναφορά ενός άλλου ερωτήματος στην ίδια ροή δεδομένων.

Υπολογισμένος πίνακας: Με μετασχηματισμούς ή χωρίς;

Τώρα που γνωρίζετε ότι οι υπολογισμένοι πίνακες είναι ιδανικοί για τη βελτίωση των επιδόσεων του μετασχηματισμού δεδομένων, μια καλή ερώτηση είναι εάν οι μετασχηματισμοί πρέπει πάντα να ανατίθενται στον υπολογιζόμενη πίνακα ή εάν πρέπει να εφαρμόζονται στον πίνακα προέλευσης. Δηλαδή, θα πρέπει πάντα τα δεδομένα να προσλαμβάνεται σε έναν πίνακα και, στη συνέχεια, να μετασχηματίζεται σε έναν υπολογισμένο πίνακα; Ποια είναι τα πλεονεκτήματα και τα μειονεκτήματα;

Φόρτωση δεδομένων χωρίς μετασχηματισμό για αρχεία κειμένου/CSV

Όταν μια προέλευση δεδομένων δεν υποστηρίζει αναδίπλωση ερωτήματος (όπως αρχεία κειμένου/CSV), υπάρχει μικρό όφελος στην εφαρμογή μετασχηματισμών κατά τη λήψη δεδομένων από την προέλευση, ιδιαίτερα εάν οι όγκοι δεδομένων είναι μεγάλοι. Ο πίνακας προέλευσης θα πρέπει απλώς να φορτώνει δεδομένα από το αρχείο Κειμένου/CSV χωρίς να εφαρμόζονται μετασχηματισμοί. Στη συνέχεια, οι υπολογισμένοι πίνακες μπορούν να λαμβάνουν δεδομένα από τον πίνακα προέλευσης και να εκτελούν τον μετασχηματισμό πάνω από τα δεδομένα πρόσληψης.

Θα μπορούσατε να ρωτήσετε, ποια είναι η τιμή της δημιουργίας ενός πίνακα προέλευσης που λαμβάνει μόνο δεδομένα; Ένας τέτοιος πίνακας μπορεί να εξακολουθεί να είναι χρήσιμος, επειδή εάν τα δεδομένα από την προέλευση χρησιμοποιούνται σε περισσότερους από έναν πίνακες, μειώνει τον φόρτο στην προέλευση δεδομένων. Επιπλέον, τα δεδομένα μπορούν πλέον να επαναχρησιμοποιηθούν από άλλα άτομα και ροές δεδομένων. Οι υπολογισμένοι πίνακες είναι ιδιαίτερα χρήσιμοι σε σενάρια όπου ο όγκος των δεδομένων είναι μεγάλος ή όταν η πρόσβαση σε μια προέλευση δεδομένων γίνεται μέσω μιας πύλης δεδομένων εσωτερικής εγκατάστασης, επειδή μειώνουν την κυκλοφορία από την πύλη και τον φόρτο στις προελεύσεις δεδομένων που βρίσκονται πίσω από αυτές.

Πραγματοποίηση ορισμένων από τους συνήθεις μετασχηματισμούς για έναν πίνακα SQL

Εάν η προέλευση δεδομένων σας υποστηρίζει αναδίπλωση ερωτήματος, είναι καλό να εκτελέσετε ορισμένους από τους μετασχηματισμούς στον πίνακα προέλευσης, επειδή το ερώτημα αναδιπλώνεται στην προέλευση δεδομένων και μόνο τα μετασχηματισμένοι δεδομένα θα ανακτηθούν από αυτή. Αυτές οι αλλαγές βελτιώνουν τις συνολικές επιδόσεις. Το σύνολο μετασχηματισμών που είναι κοινό σε μεταγενέστερους υπολογισμένους πίνακες πρέπει να εφαρμοστεί στον πίνακα προέλευσης, ώστε να μπορούν να αναδιπλωθούν στην προέλευση. Άλλοι μετασχηματισμοί που εφαρμόζονται μόνο σε πίνακες κατάντη θα πρέπει να γίνονται σε υπολογισμένους πίνακες.