สถานการณ์และกรณีการใช้เอนทิตีที่ประมวลผล

ประโยชน์ของการใช้เอนทิตี ที่ประมวลผลใน กระแสข้อมูลจะมีประโยชน์ บทความนี้อธิบายให้ใช้กรณีต่างๆ ในเอนทิตีที่ประมวลผลและอธิบายวิธีการที่พวกเขาอยู่เบื้องหลัง

เอนทิตีที่ประมวลผลคืออะไร

เอนทิตีแสดงผลลัพธ์ข้อมูลของคิวรีที่สร้างขึ้นในกระแสข้อมูลหลังจากรีเฟรชกระแสข้อมูลแล้ว ซึ่งแสดงข้อมูลจากแหล่งข้อมูล และการแปลงที่ใช้กับแหล่งข้อมูลเป็นทางเลือก บางครั้งคุณอาจต้องการสร้างเอนทิตีใหม่ที่เป็นฟังก์ชันของเอนทิตีที่เพิ่มเข้าไว้ก่อนหน้านี้

แม้ว่าเป็นไปได้ที่จะทําซ้ําคิวรีที่สร้างเอนทิตีและใช้การแปลงใหม่วิธีการนี้มีข้อเสีย: ข้อมูลจะย่อยสองครั้ง และโหลดบนแหล่งข้อมูลจะถูกเพิ่มเป็นสองเท่า

เอนทิตีที่ประมวลผลแล้วช่วยแก้ปัญหาทั้งสองอย่าง เอนทิตีที่ประมวลผลจะคล้ายกับเอนทิตีอื่น ๆ ที่พวกเขารับข้อมูลจากแหล่งข้อมูล และคุณสามารถใช้การแปลงเพิ่มเติมเพื่อสร้างเอนทิตีดังกล่าวได้ แต่ข้อมูลของกระแสข้อมูลมาจากกระแสข้อมูลการจัดเก็บข้อมูลที่ใช้และไม่ใช่แหล่งข้อมูลต้นฉบับ กล่าวคือ กระแสข้อมูลถูกสร้างขึ้นก่อนหน้านี้และถูกนากลับมาใช้ใหม่

เอนทิตีที่ประมวลผลแล้วสามารถสร้างขึ้นได้โดยการอ้างอิงเอนทิตีในกระแสข้อมูลเดียวกันหรือโดยการอ้างอิงเอนทิตีที่สร้างขึ้นในกระแสข้อมูลที่แตกต่างกัน

เอนทิตีที่ประมวลผล

เหตุใดจึงใช้เอนทิตีที่ประมวลผล

การปฏิบัติตามขั้นตอนการแปลงทั้งหมดในเอนทิตีเดียวอาจช้าได้ อาจมีหลายสาเหตุในการที่การชะลอตัวของแหล่งข้อมูลอาจช้า หรือการแปลงที่คุณคุณสร้างอยู่อาจต้องมีการคิวรีสองคิว — รีหรือมากกว่า อาจมีข้อดีคือการรวบรวมข้อมูลจากแหล่งข้อมูลก่อน จากนั้นจึงใช้อีกครั้งในเอนทิตีหนึ่งหรือหลายเอนทิตี ในกรณีดังกล่าว คุณอาจเลือกที่จะสร้างเอนทิตีสองรายการ: เอนทิตีหนึ่งรับข้อมูลจากแหล่งข้อมูล และเอนทิตีที่ประมวลผลอื่นที่ใช้การแปลงเพิ่มเติมกับข้อมูลที่เขียนลงในที่จัดเก็บข้อมูลที่กระแสข้อมูลใช้ — — อยู่แล้ว สิ่งนี้สามารถเพิ่มประสิทธิภาพการคํานวณและความสามารถในการใช้ข้อมูลใหม่ การประหยัดเวลาและทรัพยากร

ตัวอย่างเช่น ถ้าเอนทิตีสองรายการใช้ร่วมกันแม้แต่เป็นส่วนหนึ่งของตรรกะการแปลงข้อมูล ซึ่งไม่มีเอนทิตีที่ประมวลผล การแปลงจะต้องเสร็จสองครั้ง

รูปภาพแสดงการแปลงข้อมูลที่เกิดขึ้นสองครั้ง

อย่างไรก็ตาม ถ้ามีการใช้เอนทิตีที่ประมวลผล แล้วส่วนทั่วไป (ใช้ร่วมกัน) ของการแปลงจะได้รับการประมวลผลหนึ่งครั้งและจัดเก็บไว้ในAzure Data Lake Storageดังกล่าว จากนั้น การแปลงที่เหลือจะได้รับการประมวลผลจากผลลัพธ์ของการแปลงทั่วไป โดยรวมแล้ว การประมวลผลนี้เร็วขึ้นมาก

รูปภาพแสดงการแปลงทั่วไปที่เสร็จสิ้นแล้วครั้งเดียวในเอนทิตีที่ประมวลผล และจัดเก็บไว้ใน data lake และการแปลงข้อมูลเฉพาะที่เหลืออยู่ในภายหลัง

เอนทิตีที่ประมวลผลมีให้บริการเพียงที่เดียวที่เป็นโค้ดต้นทางในการแปลงข้อมูล และเร่งความเร็วการแปลงข้อมูล เนื่องจากเอนทิตีนั้นต้องใช้สถานที่เดียวแทนที่จะเป็นหลายครั้ง การโหลดบนแหล่งข้อมูลลดลงด้วย

สถานการณ์ตัวอย่างการใช้เอนทิตีที่ประมวลผล

ถ้าคุณสร้างตารางรวมใน Power BI เพื่อเพิ่มความเร็วรูปแบบข้อมูล คุณสามารถสร้างตารางรวมโดยการอ้างอิงตารางเดิมและใช้การแปลงเพิ่มเติม โดยการใช้วิธีการนี้ คุณไม่ต ้นหาการแปลงของคุณจากแหล่งข้อมูล (ส่วนที่เป็นจากตารางต้นฉบับ)

ตัวอย่างเช่น รูปภาพต่อไปนี้แสดงเอนทิตี Orders

เอนทิตี้การสั่งซื้อ

คุณสามารถสร้างเอนทิตีที่ประมวลผลโดยใช้การอ้างอิงจากเอนทิตีนี้

สร้างเอนทิตีที่ประมวลผล

รูปภาพแสดงวิธีการสร้างเอนทิตีที่ประมวลผลจากเอนทิตี Orders ก่อนอื่นคลิกขวาที่เอนทิตี Orders ในบานหน้าต่าง คิวรี เลือกตัวเลือก การอ้างอิง จากเมนูดรอปดาวน์ ซึ่งสร้างเอนทิตีที่ประมวลผลไว้ ซึ่งถูกเปลี่ยนชื่อที่นี่เป็น การรวมการสั่งซื้อ

เอนทิตีที่ประมวลผลแล้วสามารถมีการแปลงเพิ่มเติมได้ ตัวอย่างเช่น คุณสามารถใช้จัดกลุ่ม ตาม เพื่อรวมข้อมูลในระดับลูกค้าได้

รูปภาพแสดงคอลัมน์ลูกค้าในเอนทิตีรวมการสั่งซื้อที่ถูกเน้น

ซึ่งหมายความว่าเอนทิตี้รวมใบสั่งซื้อจะได้รับข้อมูลจากเอนทิตี้สั่ง และไม่ใช่จากแหล่งข้อมูลอีกครั้ง เนื่องจากการแปลงบางอย่างที่จะต้องแล้วในเอนทิตี Orders ประสิทธิภาพการคํานวณจะดีขึ้นและการแปลงข้อมูลจะเร็วขึ้น

เอนทิตีที่ประมวลผลในกระแสข้อมูลอื่น ๆ

คุณยังสามารถสร้างเอนทิตีที่ประมวลผลในกระแสข้อมูลอื่น ๆ ได้ ซึ่งสามารถสร้างได้โดยการรับข้อมูลจากกระแสข้อมูลด้วยตัวเชื่อมต่อMicrosoft Power Platformกระแสข้อมูล

<รับข้อมูลจากPower Platformข้อมูล>

รูปภาพเน้นPower Platformตัวเชื่อมต่อกระแสข้อมูลจากหน้าต่างแหล่งข้อมูล Power Query choos ด้วยรายละเอียดที่ระบุว่าเอนทิตีกระแสข้อมูลหนึ่งสามารถสร้างขึ้นที่ด้านบนของข้อมูลจากเอนทิตีกระแสข้อมูลอื่นซึ่งยังคงอยู่ที่เก็บข้อมูลอยู่แล้ว

แนวคิดของเอนทิตีที่ประมวลผลคือการให้ตารางคงอยู่ในที่เก็บข้อมูลและตารางอื่น ๆ ที่มีแหล่งที่มาจากตารางดังกล่าว เพื่อให้คุณสามารถลดเวลาการอ่านจากแหล่งข้อมูลและแชร์การแปลงทั่วไปบางส่วน ซึ่งสามารถบรรลุผลได้โดยการรับข้อมูลจากกระแสข้อมูลอื่นผ่านตัวเชื่อมต่อกระแสข้อมูลหรืออ้างอิงคิวรีอื่นในกระแสข้อมูลเดียวกัน

เอนทิตีที่ประมวลผล: ที่มีการแปลงหรือไม่มี?

หลังจากที่คุณทราบว่าเอนทิตีที่คํานวณนั้นยอดเยี่ยมในการปรับปรุงประสิทธิภาพของการแปลงข้อมูล แล้วคําถามที่ดีก็คือการแปลงควรเลื่อนออกไปยังเอนทิตีที่คํานวณเสมอหรือควรจะใช้กับเอนทิตีต้นทางหรือไม่ นั่นคือข้อมูลควรถูกย่อยในเอนทิตีเดียวและแปลงแล้วในเอนทิตีที่ประมวลผลหรือไม่ ข้อดีและข้อเสียคืออะไร

โหลดข้อมูลโดยไม่มีการแปลงไฟล์ข้อความ/CSV

เมื่อแหล่งข้อมูลไม่สนับสนุนการพับคิวรี (เช่น ไฟล์ข้อความ/CSV) จะได้รับประโยชน์เล็กน้อยในการใช้การแปลงเมื่อรับข้อมูลจากแหล่งข้อมูล โดยเฉพาะอย่างยิ่งถ้าปริมาณข้อมูลมีขนาดใหญ่ เอนทิตีต้นทางควรโหลดข้อมูลจากไฟล์ข้อความ/CSV โดยไม่ต้องใช้การแปลงข้อมูลใดๆ จากนั้น เอนทิตีที่ประมวลผลจะสามารถรับข้อมูลจากเอนทิตีต้นทางและดการแปลงข้อมูลที่ด้านบนของข้อมูลที่ย่อยแล้ว

คุณอาจถามว่า ค่าของการสร้างเอนทิตีต้นทางที่รวบรวมข้อมูลเท่านั้นคืออะไร เอนทิตีดังกล่าวยังคงมีประโยชน์เนื่องจากถ้าข้อมูลจากแหล่งข้อมูลถูกใช้ในเอนทิตีมากกว่าหนึ่งเอนทิตี จะลดการโหลดบนแหล่งข้อมูล นอกจากนี้ ในขณะนี้ข้อมูลสามารถถูกผู้อื่นและกระแสข้อมูลกลับมาใช้ใหม่ได้ เอนทิตีที่ประมวลผลจะมีประโยชน์อย่างยิ่งในสถานการณ์ที่ปริมาณข้อมูลมีขนาดใหญ่ หรือเมื่อมีการเข้าถึงแหล่งข้อมูลผ่านเกตเวย์ข้อมูลภายในองค์กร เนื่องจากลดปริมาณการใช้งานจากเกตเวย์และโหลดบนแหล่งข้อมูลที่อยู่เบื้องหลัง

การเปลี่ยนแปลงทั่วไปบางอย่างSQLตาราง

ถ้าแหล่งข้อมูลของคุณสนับสนุนการพับคิวรี การพับคิวรีและการดึงข้อมูลที่แปลงแล้วในเอนทิตีแหล่งข้อมูลจะพับคิวรีไปยังแหล่งข้อมูลและจะดึงข้อมูลเฉพาะข้อมูลที่แปลงแล้วเท่านั้น ซึ่งช่วยปรับปรุงประสิทธิภาพโดยรวม ชุดของการแปลงข้อมูลที่จะใช้ทั่วไปในเอนทิตีที่ประมวลผลแบบดาวน์สตรีมควรใช้ในเอนทิตีต้นทางดังนั้นจึงสามารถพับไปยังแหล่งข้อมูลได้ การแปลงอื่น ๆ ที่ใช้กับเอนทิตีดาวน์สตรีมเท่านั้นควรได้รับการเสร็จสิ้นในเอนทิตีที่ประมวลผล