ฟีเจอร์พรีเมียมของกระแสข้อมูลPremium features of dataflows

มีการสนับสนุนกระแสข้อมูลสำหรับผู้ใช้ Power BI Pro และ Power BI PremiumDataflows are supported for Power BI Pro and Power BI Premium users. คุณลักษณะบางอย่างสามารถใช้ได้กับการสมัครใช้งาน Power BI Premium เท่านั้นSome features are only available with a Power BI Premium subscription. บทความนี้อธิบายและแสดงรายละเอียดคุณลักษณะเฉพาะ Premium และการใช้งานของคุณลักษณะดังกล่าวเท่านั้นThis article describes and details the Premium-only features and their uses.

คุณลักษณะต่อไปนี้พร้อมใช้งานกับ Power BI Premium เท่านั้น:The following features are available only with Power BI Premium:

  • กลไกการคำนวณขั้นสูงEnhanced compute engine
  • Direct QueryDirect Query
  • เอนทิตีที่คำนวณComputed entities
  • เอนทิตีที่เชื่อมโยงLinked Entities
  • การรีเฟรชแบบเพิ่มIncremental refresh

ส่วนต่อไปนี้อธิบายคุณลักษณะแต่ละอย่างโดยละเอียดThe following sections described each of these features in detail.

กลไกการคำนวณขั้นสูงThe enhanced compute engine

กลไกการคำนวณขั้นสูงใน Power BI ช่วยให้ผู้สมัครใช้งาน Power BI Premium สามารถใช้ความจุของพวกเขาเพื่อปรับใช้กระแสข้อมูลในระดับประสิทธิภาพสูงสุดThe enhanced compute engine in Power BI enables Power BI Premium subscribers to use their capacity to optimize the use of dataflows. การใช้กลไกการคำนวณขั้นสูงมีข้อดีดังต่อไปนี้:Using the enhanced compute engine provides the following advantages:

  • ลดเวลาการรีเฟรชที่จำเป็นสำหรับขั้นตอน ETL ที่ใช้งานเป็นเวลานานผ่านเอนทิตีที่มีการคำนวณลงได้อย่างมาก เช่น การดำเนินการ รวม แยกแยะ กรอง และ จัดกลุ่มตามDrastically reduces the refresh time required for long-running ETL steps over computed entities, such as performing joins, distinct, filters, and group by
  • ดำเนินการคิวรี DirectQuery ผ่านเอนทิตีPerform DirectQuery queries over entities

โดยค่าเริ่มต้น กลไกการคำนวณขั้นสูงจะ เปิดBy default, the enhanced compute engine is On. หากกลไกการคำนวณขั้นสูงไม่ได้เปิดอยู่ การเปิดใช้งานกลไกการคำนวณขั้นสูงจะอธิบายไว้ในส่วนถัดไปพร้อมกับคำตอบสำหรับคำถามทั่วไปIf the enhanced compute engine is not on, enabling the enhanced compute engine is described in the next section, along with answers to common questions.

การใช้กลไกการคำนวณขั้นสูงUsing the enhanced compute engine

กลไกการคำนวณขั้นสูงเปิดใช้งานจากหน้า การตั้งค่าความจุ ในบริการของ Power BI ในส่วน กระแสข้อมูลThe enhanced compute engine is enabled from the Capacity Settings page in the Power BI service, in the dataflows section. โดยค่าเริ่มต้น กลไกการคำนวณขั้นสูงจะ ปิดBy default, the enhanced compute engine is Off. เมื่อต้องการเปิดใช้งานกลไกการคำนวณขั้นสูง ให้สลับเป็น เปิด ดังที่แสดงในภาพต่อไปนี้ แล้วบันทึกการตั้งค่าของคุณTo enable the enhanced compute engine, switch the toggle to On as shown in the following image, and save your settings.

เปิดกลไกการคำนวณขั้นสูง

ข้อสำคัญ

กลไกการคำนวณขั้นสูงทำงานเฉพาะสำหรับความจุ Power BI ของ A3 และใหญ่กว่าThe enhanced compute engine works only for Power BI capacities of A3 and larger.

เมื่อเปิดกลไกการคำนวณขั้นสูงแล้ว ให้กลับไปที่ กระแสข้อมูล คุณควรจะมองเห็นการปรับปรุงประสิทธิภาพที่ดีขึ้นในเอนทิตีที่คำนวณใดก็ตามซึ่งทำงานที่ซับซ้อนต่าง ๆ เช่น รวม หรือ จัดกลุ่มตาม การดำเนินการสำหรับกระแสข้อมูลที่สร้างจากเอนทิตีที่ลิงก์ซึ่งมีอยู่แล้วบนความจุเดียวกันOnce the enhanced compute engine is on, return to dataflows and you should see a performance improvement in any computed entity that performs complex operations, such as joins or group by operations for dataflows created from existing linked entities on the same capacity.

เพื่อใช้กลไกการคำนวณให้ได้รับประโยชน์สูงสุด ให้แยกขั้นตอน ETL ออกเป็นกระแสข้อมูลที่แยกจากกันสองรายการด้วยวิธีการต่อไปนี้:To make best use of the compute engine, split the ETL stage into two separate dataflows, in the following way:

  • กระแสข้อมูล 1 - กระแสข้อมูลนี้ควรส่งถ่ายรายการที่จำเป็นทั้งหมดจากแหล่งข้อมูล และวางลงในกระแสข้อมูล 2Dataflow 1 - this dataflow should only be ingesting all of the required from a data source, and placing it into dataflow 2.
  • กระแสข้อมูล 2 - ดำเนินการ ETL ทั้งหมดในกระแสข้อมูลที่สองนี้ แต่ตรวจสอบให้แน่ใจว่าคุณกำลังอ้างอิงกระแสข้อมูล 1 ที่ควรมีความจุเดียวกันอยู่Dataflow 2 - perform all ETL operations in this second dataflow, but ensure you're referencing Dataflow 1, which should be on the same capacity. นอกจากนี้ ตรวจสอบให้แน่ใจว่าคุณดำเนินงานที่สามารถพับได้ก่อน (กรอง, จัดกลุ่มตาม, แยกแยะ, รวม) ก่อนที่จะดำเนินการอืนใด เพื่อให้แน่ใจว่าสามารถใช้ประโยชน์จากกลไกการคำนวณได้Also ensure you perform operations that can fold (filter, group by, distinct, join) first, before any other operation, to ensure the compute engine is utilized.

คำถามที่พบทั่วไปและคำตอบCommon questions and answers

คำถาม: ฉันเปิดใช้กลไกการคำนวณขั้นสูง แต่ระบบรีเฟรชช้าลงQuestion: I've enabled the enhanced compute engine, but my refreshes are slower. ทำไม?Why?

คำตอบ: หากคุณเปิดใช้กลไกการคำนวณขั้นสูง มีคำอธิบายสองแบบที่เป็นไปได้ ที่อาจทำให้เวลารีเฟรชช้าลง:Answer: If you enable the enhanced compute engine, there are two possible explanations that could lead to slower refresh times:

  • เมื่อเปิดใช้กลไกการคำนวณขั้นสูง ระบบต้องการหน่วยความจำบางส่วนเพื่อทำงานได้อย่างถูกต้องWhen the enhanced compute engine is enabled, it requires some memory to function properly. ดังนั้น หน่วยความจำที่พร้อมสำหรับการรีเฟรชจะลดลง และจะเพิ่มความเป็นไปได้เช่นเดียวกันนี้ต่อรายการรีเฟรชที่รอต่อคิวดำเนินการอยู่ ซึ่งจะลดกระแสข้อมูลที่อาจรีเฟรชอยู่ในเวลาเดียวกันเช่นกันAs such, memory available to perform a refresh is reduced and therefore increases the likelihood of refreshes to be queued, which in turn reduces the number of dataflows that can refresh concurrently. เพื่อแก้ไขปัญหานี้ เมื่อเปิดใช้การคำนวณขั้นสูง ให้เพิ่มหน่วยความจำที่กำหนดมาสำหรับกระแสข้อมูล เพื่อให้แน่ใจว่าหน่วยข้อมูลที่พร้อมใช้งานสำหรับการรีเฟรชกระแสข้อมูลในเวลาเดียวกันจะยังคงเหมือนเดิมTo address this, when enabling enhanced compute, increase the memory assigned for dataflows to ensure the memory available for concurrent dataflow refreshes remains the same.

  • อีกเหตุผลหนึ่งที่คุณอาจพบการรีเฟรชช้าลงคือว่ากลไกการคำนวณจะทำงานที่ด้านบนของเอนทิตีที่มีอยู่เท่านั้นAnother reason you may encounter slower refreshes is that the compute engine only works on top of existing entities. ถ้ากระแสข้อมูลของคุณอ้างอิงแหล่งข้อมูลที่ไม่ใช่กระแสข้อมูล คุณจะไม่เห็นการปรับปรุงIf your dataflow references a data source that's not a dataflow, you won't see an improvement. ประสิทธิภาพการทำงานจะไม่เพี่มขึ้น เนื่องจากในสถานการณ์สมมติครั้งใหญ่บางอย่าง ค่าเริ่มต้นจากแหล่งข้อมูลจะช้าลง เนื่องจากข้อมูลจำเป็นต้องผ่านไปยังกลไกการคำนวณขั้นสูงThere will be no performance increase, since in some big data scenarios, the initial read from a data source would be slower because the data needs to be passed to the enhanced compute engine.

คำถาม: ฉันไม่เห็นการสลับกลไกการคำนวณขั้นสูงQuestion: I cannot see the enhanced compute engine toggle. ทำไม?Why?

คำตอบ: กลไกการคำนวณขั้นสูงถูกปล่อยออกมาในขั้นตอนต่างๆ ไปยังภูมิภาคต่าง ๆ ทั่วโลกAnswer: The enhanced compute engine is being released in stages to regions around the world. เราคาดการณ์ว่า ระบบจะรองรับในทุกภูมิภาคภายในสิ้นปีค.ศ.2020We anticipate all regions will supported by the end of 2020.

คำถาม: ประเภทข้อมูลที่ได้รับการสนับสนุนสำหรับกลไกการคำนวณคืออะไรQuestion: What are the supported data types for the compute engine?

คำตอบ: ปัจจุบัน กลไกการคำนวณขั้นสูงและกระแสข้อมูลสนับสนุนประเภทข้อมูลต่อไปนี้Answer: The enhanced compute engine and dataflows currently support the following data types. หากกระแสข้อมูลของคุณไม่ได้ใช้หนึ่งในประเภทข้อมูลต่อไปนี้ จะมีข้อผิดพลาดเกิดขึ้นระหว่างการรีเฟรช:If your dataflow doesn't use one of the following data types, an error occurs during refresh:

  • วันที่/เวลาDate/Time
  • เลขทศนิยมDecimal Number
  • ข้อความText
  • จำนวนเต็มWhole number
  • วันที่/เวลา/โซนDate/Time/Zone
  • จริง/เท็จTrue/False
  • วันที่Date
  • เวลาTime

ใช้ DirectQuery ด้วยกระแสข้อมูลใน Power BI (ตัวอย่าง)Use DirectQuery with dataflows in Power BI (preview)

คุณสามารถใช้ DirectQuery เพื่อเชื่อมต่อโดยตรงไปยังกระแสข้อมูล และเชื่อมต่อโดยตรงกับกระแสข้อมูลของคุณโดยไม่ต้องนำเข้าข้อมูลYou can use DirectQuery to connect directly to dataflows, and thereby connect directly to your dataflow without having to import its data.

การใช้ DirectQuery กับกระแสข้อมูลช่วยให้สามารถปรับปรุงขั้นตอนต่อไปนี้ในกระบวนการ Power BI และกระแสข้อมูลของคุณได้เช่น:Using DirectQuery with dataflows enables the following enhancements to your Power BI and dataflows processes:

  • หลีกเลี่ยงการกำหนดตารางเวลาการรีเฟรชแยกต่างหาก-DirectQuery เชื่อมต่อโดยตรงกับกระแสข้อมูลโดยไม่จำเป็นต้องสร้างชุดข้อมูลที่นำเข้าAvoid separate refresh schedules - DirectQuery connects directly to a dataflow, removing the need to create an imported dataset. เช่นเดียวกับการใช้ DirectQuery ด้วยกระแสข้อมูลของคุณหมายความว่าคุณไม่จำเป็นต้องกำหนดตารางเวลาการรีเฟรชแยกต่างหากสำหรับกระแสข้อมูลและชุดข้อมูล เพื่อให้แน่ใจว่าข้อมูลของคุณจะถูกซิงโครไนซ์As such, using DirectQuery with your dataflows means you no longer need separate refresh schedules for the dataflow and the dataset to ensure your data is synchronized.

  • การกรองข้อมูล- DirectQuery มีประโยชน์สำหรับการทำงานบนมุมมองที่กรองแล้วของข้อมูลภายในกระแสข้อมูลFiltering data - DirectQuery is useful for working on a filtered view of data inside a dataflow. ถ้าคุณต้องการกรองข้อมูลและทำงานกับชุดย่อยของข้อมูลที่มีขนาดเล็กลงในกระแสข้อมูลของคุณ คุณสามารถใช้ DirectQuery (และโปรแกรมคำนวณ) เพื่อกรองข้อมูลของกระแสข้อมูล และทำงานกับชุดย่อยที่กรองแล้วที่คุณต้องการIf you want to filter data, and thereby work with a smaller subset of the data in your dataflow, you can use DirectQuery (and the compute engine) to filter dataflow data and work with the filtered subset you need.

การใช้ DirectQuery สำหรับกระแสข้อมูลUsing DirectQuery for dataflows

การใช้ DirectQuery ด้วยกระแสข้อมูลคือคุณลักษณะตัวอย่างที่พร้อมใช้งานเริ่มตั้งแต่ Power BI Desktop รุ่นเดือนพฤษภาคม 2020Using DirectQuery with dataflows is a preview feature available beginning with the May 2020 version of Power BI Desktop.

นอกจากนี้ ยังมีข้อกำหนดเบื้องต้นสำหรับการใช้ DirectQuery กับกระแสข้อมูล:There are also prerequisites for using DirectQuery with dataflows:

  • กระแสข้อมูลของคุณต้องอยู่ภายในพื้นที่ทำงานที่เปิดใช้ Power BI PremiumYour dataflow must reside within a Power BI Premium enabled workspace
  • ต้องเปิดใช้งาน กลไกการคำนวณThe compute engine must be turned on

เปิดใช้งาน DirectQuery สำหรับกระแสข้อมูลEnable DirectQuery for dataflows

เพื่อให้แน่ใจว่ากระแสข้อมูลของคุณพร้อมใช้งานสำหรับการเข้าถึง DirectQuery โปรแกรมการคำนวณขั้นสูงจะต้องอยู่ในสถานะที่ปรับให้เหมาะสมแล้วTo ensure your dataflow is available for DirectQuery access, the enhanced compute engine must be in its optimized state. เมื่อต้องการเปิดใช้งาน DirectQuery สำหรับกระแสข้อมูล ให้ตั้งค่าตัวเลือก การตั้งค่าโปรแกรมการคำนวณขั้นสูง ใหม่เป็น เปิดTo enable DirectQuery for dataflows, set the new Enhanced compute engine settings option to On. รูปภาพต่อไปนี้แสดงการตั้งค่าที่เลือกอย่างถูกต้องThe following image shows the setting properly selected.

การควบคุมแยกย่อยสำหรับ Direct Query

เมื่อคุณใช้การตั้งค่าดังกล่าว ให้รีเฟรชกระแสข้อมูลเพื่อทำให้การปรับให้เหมาะสมมีผลOnce you've applied that setting, refresh the dataflow for the optimization to take effect.

ข้อควรพิจารณาและข้อจำกัดสำหรับ DirectQueryConsiderations and limitations for DirectQuery

มีข้อจำกัดที่เป็นที่รู้กันสองสามประการในเรื่องของ DirectQuery และกระแสข้อมูลThere are a few known limitations with DirectQuery and dataflows:

  • ในระหว่างช่วงเวลาการแสดงตัวอย่างของคุณลักษณะนี้ ลูกค้าบางรายอาจพบปัญหาเกี่ยวกับการหมดเวลา หรือประสิทธิภาพการทำงานเมื่อใช้ DirectQuery กับกระแสข้อมูลDuring the preview period of this feature, some customers may experience timeouts or performance issues when using DirectQuery with dataflows. ปัญหาดังกล่าวจะได้รับการแก้ไขในระหว่างช่วงเวลาการแสดงตัวอย่างนี้Such issues are being actively addressed during this preview period.

  • ขณะนี้ยังไม่รองรับแบบจำลองแบบรวม/แบบผสมที่มีการนำเข้าและแหล่งข้อมูล DirectQueryComposite/mixed models that have import and DirectQuery data sources are currently not supported.

  • กระแสข้อมูลขนาดใหญ่อาจมีปัญหาเกี่ยวกับปัญหาการหมดเวลาเมื่อดูการแสดงภาพLarge dataflows may have trouble with timeout issues when viewing visualizations. กระแสข้อมูลขนาดใหญ่ที่ประสบกับปัญหาการหมดเวลาควรใช้โหมดการนำเข้าLarge dataflows that run into trouble with timeout issues should use Import mode.

  • ภายใต้การตั้งค่าแหล่งข้อมูล ตัวเชื่อมต่อกระแสข้อมูลจะแสดงข้อมูลประจำตัวที่ไม่ถูกต้องหากคุณกำลังใช้ DirectQueryUnder data source settings, the dataflow connector will show invalid credentials if you are using DirectQuery. การดำเนินการนี้จะไม่ส่งผลกระทบต่อลักษณะการทำงาน และชุดข้อมูลจะทำงานได้อย่างถูกต้องThis does not affect the behavior, and the dataset will work properly.

เอนทิตีที่คำนวณComputed entities

คุณสามารถดำเนินการ การประมวลผลในที่จัดเก็บ ได้เมื่อใช้ กระแสข้อมูล ที่มีการสมัครใช้งาน Power BI PremiumYou can perform in-storage computations when using dataflows with a Power BI Premium subscription. ซึ่งจะช่วยให้คุณคำนวณกระแสข้อมูลที่มีอยู่แล้วและส่งผลลัพธ์กลับได้ โดยจะทำให้คุณได้เพ่งความสนใจไปยังการสร้างและการวิเคราะห์รายงานThis lets you perform calculations on your existing dataflows, and return results that enable you to focus on report creation and analytics.

เอนทิตีที่คำนวณ

เมื่อต้องการทำเนินการการคำนวณในที่จัดเก็บ คุณต้องสร้างกระแสข้อมูลและนำข้อมูลเข้าที่จัดเก็บกระแสข้อมูลของ Power BI ก่อนเป็นอันดับแรกTo perform in-storage computations, you first must create the dataflow and bring data into that Power BI dataflow storage. เมื่อคุณมีกระแสข้อมูลที่มีข้อมูลแล้ว คุณก็จะสามารถสร้าง เอนทิตีที่คำนวณไว้ ได้ ซึ่งเป็นเอนทิตีที่ใช้ประมวลผลในที่จัดเก็บOnce you have a dataflow that contains data, you can create computed entities, which are entities that perform in-storage computations.

ข้อควรพิจารณาและข้อจำกัดของเอนทิตีที่คำนวณConsiderations and limitations of computed entities

  • เมื่อทำงานโดยใช้กระแสข้อมูลที่สร้างขึ้นในบัญชี Azure Data Lake Storage Gen2 ภายในองค์กร เอนทิตีที่มีลิงก์และเอนทิตีที่มีการคำนวณจะทำงานได้อย่างมีประสิทธิภาพต่อเมื่อเอนทิตี้ทั้งสองอยู่ในบัญชีที่เก็บข้อมูลเดียวกันWhen working with dataflows created in an organization's Azure Data Lake Storage Gen2 account, linked entities and computed entities only work properly when the entities reside in the same storage account.

ตามแนวทางปฏิบัติที่ดีที่สุดเมื่อทำการคำนวณข้อมูลที่รวมเข้าด้วยกันโดยข้อมูลภายในองค์กรและข้อมูลบนคลาวด์ ให้สร้างกระแสข้อมูลใหม่สำหรับแหล่งข้อมูลแต่ละแหล่ง (หนึ่งรายการสำหรับภายในองค์กรและอีกแหล่งหนึ่งสำหรับระบบคลาวด์) จากนั้นสร้างกระแสข้อมูลที่สามเพื่อรวม/คำนวณทั้งสองแหล่งข้อมูลAs a best practice, when doing computations on data joined by on-premises and cloud data, create a new dataflow for each source (one for on-premises and one for cloud) and then create a third dataflow to merge/compute over these two data sources.

เอนทิตีที่เชื่อมโยงLinked entities

คุณสามารถอ้างอิงกระแสข้อมูลที่มีอยู่เมื่อใช้กับการสมัครใช้งาน Power BI Premium ซึ่งช่วยให้คุณทำการคำนวณในเอนทิตีเหล่านี้โดยใช้เอนทิตีที่คำนวณหรืออนุญาตให้คุณสร้างตาราง "งแหล่งที่มาจริงเพียงแหล่งเดียว" ที่คุณสามารถใช้ซ้ำภายในกระแสข้อมูลหลายรายการได้You can reference existing dataflows when using with a Power BI Premium subscription, which lets you either perform calculation on these entities using computed entities or allows you to create a "single source of the truth" table that you can reuse within multiple dataflows.

การรีเฟรชแบบเพิ่มIncremental refresh

คุณสามารถตั้งค่ากระแสข้อมูลให้รีเฟรชทีละน้อยเพื่อหลีกเลี่ยงการดึงข้อมูลทั้งหมดในทุกการรีเฟรชDataflows can be set to refresh incrementally to avoid having to pull all the data on every refresh. เมื่อต้องการทำเช่นนั้น ให้เลือกกระแสข้อมูล แล้วเลือกไอคอนรีเฟรชแบบเพิ่มหน่วยTo do so, select the dataflow then select the incremental refresh icon.

การรีเฟรชแบบเพิ่ม

การตั้งค่าการรีเฟรชแบบเพิ่มหน่วยจะเพิ่มพารามิเตอร์ให้กับกระแสข้อมูลเพื่อระบุช่วงวันที่Setting incremental refresh adds parameters to the dataflow to specify the date range. สำหรับข้อมูลโดยละเอียดเกี่ยวกับวิธีตั้งค่าการรีเฟรชแบบเพิ่มหน่วย โปรดดูบทความ การรีเฟรชแบบเพิ่มหน่วยFor detailed information on how to set up incremental refresh, see the incremental refresh article.

ข้อควรพิจารณาเมื่อไม่ควรตั้งค่าการรีเฟรชแบบเพิ่มหน่วยConsiderations for when not to set incremental refresh

อย่าตั้งค่ากระแสข้อมูลเป็นการรีเฟรชแบบเพิ่มหน่วยในสถานการณ์ต่อไปนี้:Do not set a dataflow to incremental refresh in the following situations:

  • เอนทิตีที่เชื่อมโยงไม่ควรใช้การรีเฟรชแบบเพิ่มหน่วยหากอ้างอิงกระแสข้อมูลLinked entities should not use incremental refresh if they reference a dataflow. กระแสข้อมูลไม่สนับสนุนการพับคิวรี (แม้ว่าเอนทิตีจะเปิดใช้งาน Direct Query)Dataflows does not support query folding (even if the entity is DirectQuery enabled).
  • ชุดข้อมูลที่อ้างอิงกระแสข้อมูลไม่ควรใช้การรีเฟรชแบบเพิ่มหน่วยDatasets referencing dataflows should not use incremental refresh. โดยทั่วไปการรีเฟรชกระแสข้อมูลควรทำงานได้ดีRefreshes to dataflows should generally perform well. ถ้าการรีเฟรชใช้เวลานานกว่าที่คาดไว้ ให้พิจารณาใช้กลไกการคำนวณและหรือโหมด DirectQueryIf the refreshes take longer than expected, consider using the compute engine and or DirectQuery mode.

ขั้นตอนถัดไปNext steps

บทความต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับกระแสข้อมูลและ Power BI:The following articles provide more information about dataflows and Power BI: