Veri akışlarının Premium özellikleriPremium features of dataflows

Veri akışları Power BI Pro ve Power BI Premium kullanıcıları için desteklenir.Dataflows are supported for Power BI Pro and Power BI Premium users. Bazı özellikler yalnızca Power BI Premium aboneliğiyle kullanılabilir.Some features are only available with a Power BI Premium subscription. Bu makalede Premium aboneliğine özgü özellikler ve kullanım alanları anlatılmıştır.This article describes and details the Premium-only features and their uses.

Aşağıdaki özellikler yalnızca Power BI Premium ile birlikte kullanılabilir:The following features are available only with Power BI Premium:

  • Geliştirilmiş işlem altyapısıEnhanced compute engine
  • Direct QueryDirect Query
  • Hesaplanan varlıklarComputed entities
  • Bağlantılı varlıklarLinked Entities
  • Artımlı yenilemeIncremental refresh

Aşağıdaki bölümlerde bu özellikler daha ayrıntılı olarak açıklanmıştır.The following sections described each of these features in detail.

Geliştirilmiş işlem altyapısıThe enhanced compute engine

Power BI geliştirilmiş işlem altyapısı, Power BI Premium abonelerinin kapasitelerini kullanarak veri akışlarının kullanımını iyileştirmelerini sağlar.The enhanced compute engine in Power BI enables Power BI Premium subscribers to use their capacity to optimize the use of dataflows. Geliştirilmiş işlem altyapısını kullanmak şu avantajları sunar:Using the enhanced compute engine provides the following advantages:

  • Birleştirme, benzersiz, filtre ve gruplama gibi işlemleri gibi hesaplanan varlıklar üzerinde gerçekleştirilen uzun süreli ETL adımları için gerekli olan yenileme süresini önemli ölçüde azaltır.Drastically reduces the refresh time required for long-running ETL steps over computed entities, such as performing joins, distinct, filters, and group by
  • Varlıklar üzerinde DirectQuery sorgusu gerçekleştirmePerform DirectQuery queries over entities

Geliştirilmiş işlem altyapısı varsayılan olarak Açık durumdadır.By default, the enhanced compute engine is On. Gelişmiş işlem altyapısı açık değilse bunu etkinleştirme işlemi, sık sorulan soruların yanıtlarıyla birlikte sonraki bölümde açıklanmaktadır.If the enhanced compute engine is not on, enabling the enhanced compute engine is described in the next section, along with answers to common questions.

Geliştirilmiş işlem altyapısını kullanmaUsing the enhanced compute engine

Geliştirilmiş işlem altyapısı, Power BI hizmetinin Kapasite Ayarları sayfasının veri akışları bölümünden etkinleştirilir.The enhanced compute engine is enabled from the Capacity Settings page in the Power BI service, in the dataflows section. Geliştirilmiş işlem altyapısı varsayılan olarak Kapalı durumdadır.By default, the enhanced compute engine is Off. Geliştirilmiş işlem altyapısını etkinleştirmek için aşağıdaki görüntüde gösterildiği gibi düğmeyi Açık duruma getirin ve ayarlarınızı kaydedin.To enable the enhanced compute engine, switch the toggle to On as shown in the following image, and save your settings.

Geliştirilmiş işlem altyapısını açın

Önemli

Geliştirilmiş işlem altyapısı yalnızca A3 ve üzeri Power BI kapasitelerinde çalışır.The enhanced compute engine works only for Power BI capacities of A3 and larger.

Geliştirilmiş işlem altyapısı açıldıktan sonra veri akışlarına döndüğünüzde, aynı kapasitedeki var olan bağlantılı varlıklardan oluşan veri akışları için birleşim veya gruplama gibi karmaşık işlemler gerçekleştirilen hesaplanan varlıklarda performans artışı görmeniz gerekir.Once the enhanced compute engine is on, return to dataflows and you should see a performance improvement in any computed entity that performs complex operations, such as joins or group by operations for dataflows created from existing linked entities on the same capacity.

İşlem altyapısını en verimli şekilde kullanmak için ETL aşamasını şu şekilde iki ayrı veri akışına ayırın:To make best use of the compute engine, split the ETL stage into two separate dataflows, in the following way:

  • Veri akışı 1: Bu veri akışı yalnızca veri kaynağındaki gerekli verileri almalı ve veri akışı 2 içine yerleştirmelidir.Dataflow 1 - this dataflow should only be ingesting all of the required from a data source, and placing it into dataflow 2.
  • Veri akışı 2: Tüm ETL işlemlerini bu ikinci veri akışında gerçekleştirin ancak aynı kapasite üzerinde yer alan Veri akışı 1'e başvurduğunuzdan emin olun.Dataflow 2 - perform all ETL operations in this second dataflow, but ensure you're referencing Dataflow 1, which should be on the same capacity. Ayrıca işlem altyapısının kullanıldığından emin olmak için diğer işlemlerden önce katlanabilecek (filtre, gruplama, benzersiz, birleşim) işlemler gerçekleştirdiğinizden emin olun.Also ensure you perform operations that can fold (filter, group by, distinct, join) first, before any other operation, to ensure the compute engine is utilized.

Sık sorulan sorular ve yanıtlarıCommon questions and answers

Soru: Geliştirilmiş işlem altyapısını etkinleştirdim ancak veriler daha yavaş yenileniyor.Question: I've enabled the enhanced compute engine, but my refreshes are slower. Neden mi?Why?

Cevap: Geliştirilmiş işlem altyapısını etkinleştirmenize rağmen verilerin yavaş yenilenmesinin iki nedeni olabilir:Answer: If you enable the enhanced compute engine, there are two possible explanations that could lead to slower refresh times:

  • Geliştirilmiş işlem altyapısı etkinleştirildikten sonra düzgün çalışmak için bir miktar belleğe ihtiyaç duyar.When the enhanced compute engine is enabled, it requires some memory to function properly. Bu nedenle yenileme gerçekleştirme için ayrılan bellek miktarı azalır ve bunun sonucunda yenileme işlemleri kuyruğa alınır ve eşzamanlı olarak yenilenebilecek veri akışı sayısı azalır.As such, memory available to perform a refresh is reduced and therefore increases the likelihood of refreshes to be queued, which in turn reduces the number of dataflows that can refresh concurrently. Bu sorunu çözmek için geliştirilmiş işlemi etkinleştirdiğinizde veri akışlarına ayrılan belleği artırarak eşzamanlı veri akışı yenileme işlemleri için gerekli belleği aynı düzeyde kalmasını sağlayın.To address this, when enabling enhanced compute, increase the memory assigned for dataflows to ensure the memory available for concurrent dataflow refreshes remains the same.

  • Yenileme işlemlerinin yavaş olmasının bir diğer nedeni de işlem altyapısının yalnızca var olan varlıklarla birlikte çalışmasıdır.Another reason you may encounter slower refreshes is that the compute engine only works on top of existing entities. Veri akışınızın, veri akışı olmayan bir veri kaynağına başvurması durumunda geliştirme göremezsiniz.If your dataflow references a data source that's not a dataflow, you won't see an improvement. Bazı büyük veri senaryolarında verilerin geliştirilmiş işlem altyapısına geçirilmesi gerektiğinden veri kaynağından gerçekleştirilen ilk okuma işlemi daha yavaş olacağından performans artışı yaşanmayacaktır.There will be no performance increase, since in some big data scenarios, the initial read from a data source would be slower because the data needs to be passed to the enhanced compute engine.

Soru: Geliştirilmiş işlem altyapısını açma veya kapatma seçeneğini göremiyorum.Question: I cannot see the enhanced compute engine toggle. Neden mi?Why?

Cevap: Geliştirilmiş işlem altyapısı, dünyanın farklı yerlerindeki bölgelerde aşamalı olarak kullanıma sunulmaktadır.Answer: The enhanced compute engine is being released in stages to regions around the world. Bu desteğin 2020'nin sonuna kadar tüm bölgelere yayılmış olmasını planlıyoruz.We anticipate all regions will supported by the end of 2020.

Soru: İşlem altyapısı için desteklenen veri türleri nelerdir?Question: What are the supported data types for the compute engine?

Cevap: Geliştirilmiş işlem altyapısı ve veri akışları şu anda aşağıdaki veri türlerini desteklemektedir.Answer: The enhanced compute engine and dataflows currently support the following data types. Veri akışınız aşağıdaki veri türlerinden birini kullanmıyorsa yenileme sırasında hata oluşur:If your dataflow doesn't use one of the following data types, an error occurs during refresh:

  • Tarih/SaatDate/Time
  • Ondalık SayıDecimal Number
  • MetinText
  • Tam sayıWhole number
  • Tarih/Saat/BölgeDate/Time/Zone
  • True/FalseTrue/False
  • TarihDate
  • SaatTime

Power BI’da veri akışları ile DirectQuery kullanma (önizleme)Use DirectQuery with dataflows in Power BI (preview)

Veri akışlarına doğrudan bağlanmak için DirectQuery’yi kullanabilir ve böylece verilerini içeri aktarmak zorunda kalmadan veri akışınıza doğrudan bağlanabilirsiniz.You can use DirectQuery to connect directly to dataflows, and thereby connect directly to your dataflow without having to import its data.

Veri akışlarıyla DirectQuery’nin kullanılması Power BI ve veri akışı işlemlerinizde şu geliştirmelere olanak tanır:Using DirectQuery with dataflows enables the following enhancements to your Power BI and dataflows processes:

  • Ayrı yenileme zamanlamalarından kaçınma - DirectQuery doğrudan veri akışına bağlandığından içeri aktarılan bir veri kümesi oluşturma ihtiyacını ortadan kaldırır.Avoid separate refresh schedules - DirectQuery connects directly to a dataflow, removing the need to create an imported dataset. Dolayısıyla veri akışlarınız için DirectQuery’yi kullandığınızda artık veri akışı için ayrı yenileme zamanlamalarına ve verilerinizin eşitlendiğinden emin olmak için bir veri kümesine gerek kalmaz.As such, using DirectQuery with your dataflows means you no longer need separate refresh schedules for the dataflow and the dataset to ensure your data is synchronized.

  • Verileri filtreleme - DirectQuery, veri akışının içinde verilerin filtrelenmiş görünümüyle çalışmak için yararlıdır.Filtering data - DirectQuery is useful for working on a filtered view of data inside a dataflow. Verileri filtrelemek ve böylece veri akışınızdaki verilerin daha küçük bir alt kümesiyle çalışmak istiyorsanız DirectQuery’yi (ve işlem altyapısını) kullanarak veri akışı verilerini filtreleyebilir ve ihtiyacınız olan filtrelenmiş alt kümeyle çalışabilirsiniz.If you want to filter data, and thereby work with a smaller subset of the data in your dataflow, you can use DirectQuery (and the compute engine) to filter dataflow data and work with the filtered subset you need.

Veri akışları için DirectQuery kullanmaUsing DirectQuery for dataflows

Veri akışlarıyla DirectQuery kullanma, Power BI Desktop’ın Mayıs 2020 sürümünden başlayarak kullanıma sunulan bir önizleme özelliğidir.Using DirectQuery with dataflows is a preview feature available beginning with the May 2020 version of Power BI Desktop.

Veri akışlarıyla DirectQuery kullanmanın önkoşulları da vardır:There are also prerequisites for using DirectQuery with dataflows:

  • Veri akışınız Power BI Premium etkinleştirilmiş bir çalışma alanının içinde yer almalıdırYour dataflow must reside within a Power BI Premium enabled workspace
  • İşlem altyapısı açık olmalıdırThe compute engine must be turned on

Veri akışları için DirectQuery’yi etkinleştirmeEnable DirectQuery for dataflows

Veri akışınızın DirectQuery erişiminde kullanılabildiğinden emin olmak için gelişmiş işlem altyapısının iyileştirilmiş durumda olması gerekir.To ensure your dataflow is available for DirectQuery access, the enhanced compute engine must be in its optimized state. Veri akışlarında DirectQuery’yi etkinleştirmek için yeni Gelişmiş işlem altyapısı ayarları seçeneğini Açık olarak ayarlayın.To enable DirectQuery for dataflows, set the new Enhanced compute engine settings option to On. Aşağıdaki resimde düzgün bir şekilde seçilmiş ayar gösterilir.The following image shows the setting properly selected.

DirectQuery için ayrıntılı denetim

Bu ayarı uyguladıktan sonra, iyileştirmenin geçerlilik kazanması için veri akışını yenileyin.Once you've applied that setting, refresh the dataflow for the optimization to take effect.

DirectQuery için önemli noktalar ve sınırlamalarConsiderations and limitations for DirectQuery

DirectQuery ve veri akışlarıyla ilgili bilinen birkaç sınırlama vardır:There are a few known limitations with DirectQuery and dataflows:

  • Bu özelliğin önizleme dönemi boyunca bazı müşteriler veri akışlarıyla DirectQuery’yi kullanırken zaman aşımlarıyla veya performans sorunlarıyla karşılaşabilir.During the preview period of this feature, some customers may experience timeouts or performance issues when using DirectQuery with dataflows. Bu önizleme döneminde bu tür sorunlar üzerinde etkin bir şekilde çalışılmaktadır.Such issues are being actively addressed during this preview period.

  • İçeri aktarma ve DirectQuery veri kaynaklarına sahip bileşik/karışık modeller şu anda desteklenmiyor.Composite/mixed models that have import and DirectQuery data sources are currently not supported.

  • Büyük veri akışlarında görselleştirmeler görüntülenirken zaman aşımı sorunları ortaya çıkabilir.Large dataflows may have trouble with timeout issues when viewing visualizations. Zaman aşımı sorunlarıyla karşılaşılan büyük veri akışlarında İçeri aktarma modu kullanılmalıdır.Large dataflows that run into trouble with timeout issues should use Import mode.

  • DirectQuery kullanıyorsanız veri akışı bağlayıcısı, veri kaynağı ayarları bölümünde geçersiz kimlik bilgileri gösterir.Under data source settings, the dataflow connector will show invalid credentials if you are using DirectQuery. Bu, davranışı etkilemez ve veri kümesi düzgün bir şekilde çalışır.This does not affect the behavior, and the dataset will work properly.

Hesaplanan varlıklarComputed entities

Bir Power BI Premium aboneliği ile veri akışlarını kullanırken depolama içi hesaplamalar yapabilirsiniz.You can perform in-storage computations when using dataflows with a Power BI Premium subscription. Bu özellik, mevcut veri akışlarınızda hesaplamalar yapmanıza ve rapor oluşturma ve analizine odaklanmanızı sağlayan sonuçlar döndürmenize olanak sağlar.This lets you perform calculations on your existing dataflows, and return results that enable you to focus on report creation and analytics.

Hesaplanan varlık

Depolama içi hesaplamalar yapmak için ilk olarak veri akışını oluşturmanız ve verileri Power BI veri akışı depolama alanına getirmeniz gerekir.To perform in-storage computations, you first must create the dataflow and bring data into that Power BI dataflow storage. Veri içeren bir veri akışı elde ettikten sonra, depolama içi hesaplamalar yapan varlıklar olan hesaplanan varlıklar oluşturabilirsiniz.Once you have a dataflow that contains data, you can create computed entities, which are entities that perform in-storage computations.

Hesaplanan varlıklarla ilgili önemli noktalar ve sınırlamalarConsiderations and limitations of computed entities

  • Bir kuruluşun Azure Data Lake Storage 2. Nesil hesabında oluşturulan veri akışlarıyla çalışırken bağlantılı varlıklar ve hesaplanan varlıklar yalnızca varlıklar aynı depolama hesabında bulunduğunda düzgün şekilde çalışır.When working with dataflows created in an organization's Azure Data Lake Storage Gen2 account, linked entities and computed entities only work properly when the entities reside in the same storage account.

Şirket içi ve bulut verileri tarafından birleştirilen veriler üzerinde hesaplamalar gerçekleştirirken en iyi deneyim olarak, her veri kaynağı için yeni bir veri akışı oluşturun (bir tane şirket içi ortam, bir tane bulut için) ve daha sonra bu iki veri kaynağında birleştirme/işlem gerçekleştirecek üçüncü bir veri akışı oluşturun.As a best practice, when doing computations on data joined by on-premises and cloud data, create a new dataflow for each source (one for on-premises and one for cloud) and then create a third dataflow to merge/compute over these two data sources.

Bağlantılı varlıklarLinked entities

Power BI Premium aboneliği kullandığınızda var olan veri akışlarına başvurabilirsiniz. Bu sayede hesaplanan varlıkları kullanarak bu varlıklarla ilgili hesaplama gerçekleştirebilir veya birden çok veri akışında yeniden kullanabileceğiniz "tek gerçeklik kaynağı" olan bir tablo oluşturabilirsiniz.You can reference existing dataflows when using with a Power BI Premium subscription, which lets you either perform calculation on these entities using computed entities or allows you to create a "single source of the truth" table that you can reuse within multiple dataflows.

Artımlı yenilemeIncremental refresh

Her yenileme işleminde verilerin çekilmesinden kaçınmak için veri akışları artımlı olarak yenilenecek şekilde ayarlanabilir.Dataflows can be set to refresh incrementally to avoid having to pull all the data on every refresh. Bunun için veri akışını seçtikten sonra artımlı yenileme simgesini seçin.To do so, select the dataflow then select the incremental refresh icon.

Artımlı yenileme

Artımlı yenileme ayarlandığında veri akışına tarih aralığını belirten parametreler eklenir.Setting incremental refresh adds parameters to the dataflow to specify the date range. Artımlı yenilemeyi ayarlama hakkında ayrıntılı bilgi için artımlı yenileme makalesini inceleyin.For detailed information on how to set up incremental refresh, see the incremental refresh article.

Artımlı yenilemenin kullanılmaması gereken durumlarConsiderations for when not to set incremental refresh

Aşağıdaki durumlarda veri akışını artımlı yenileme olarak ayarlamayın:Do not set a dataflow to incremental refresh in the following situations:

  • Veri akışına başvuran bağlantılı varlıklar için artımlı yenileme kullanılmamalıdır.Linked entities should not use incremental refresh if they reference a dataflow. Veri akışları sorgu katlamayı desteklemez (varlık DirectQuery desteğine sahip olsa dahi).Dataflows does not support query folding (even if the entity is DirectQuery enabled).
  • Veri akışlarına başvuran veri kümeleri için artımlı yenileme kullanılmamalıdır.Datasets referencing dataflows should not use incremental refresh. Veri akışı yenileme performansı yeterli olmalıdır.Refreshes to dataflows should generally perform well. Yenileme işlemleri beklenenden uzun sürüyorsa işlem altyapısını veya DirectQuery modunu kullanabilirsiniz.If the refreshes take longer than expected, consider using the compute engine and or DirectQuery mode.

Sonraki adımlarNext steps

Aşağıdaki makaleler veri akışları ve Power BI hakkında daha fazla bilgi sunmaktadır:The following articles provide more information about dataflows and Power BI: