Share via


串流資料流 (預覽)

組織想要使用數據,而不是幾天或幾周后的數據。 Power BI 的願景很簡單:批次、即時和串流之間的差異應該會消失。 用戶應該能夠在所有數據可供使用時立即使用。

重要

串流數據流已淘汰,且已不再提供。 Azure 串流分析 已合併串流數據流的功能。 如需串流數據流淘汰的詳細資訊,請參閱 淘汰公告

分析師通常需要技術協助來處理串流數據源、數據準備、複雜的時間型作業,以及實時數據視覺效果。 IT 部門通常會依賴自定義建置的系統,以及各種廠商的技術組合,對數據執行及時分析。 如果沒有這種複雜性,他們就無法近乎即時地提供決策者的資訊。

串流數據流可讓作者連線、擷取、混搭、模型,並根據在 Power BI 服務 中以近乎實時數據串流為基礎的報表。 服務可啟用拖放、無程式代碼體驗。

如果您需要透過包含圖表檢視的使用者介面(UI),輕鬆進行數據混搭,您可以混合串流數據與批次數據。 產生的最後一個專案是數據流,可以即時取用以建立高度互動式、近乎實時的報告。 Power BI 中的所有數據視覺效果功能都可與串流數據搭配運作,就像使用批次數據一樣。

Diagram showing an example of mixed streaming and batch data in a simple workflow that creates real-time reports in Power BI.

用戶可以執行數據準備作業,例如聯結和篩選。 它們也可以針對分組作業執行時間範圍匯總(例如輪轉、跳動和會話視窗)。

Power BI 中的串流數據流可讓組織:

  • 近乎即時地做出自信的決策。 組織可以更靈活,並根據最新的深入解析採取有意義的動作。
  • 將串流數據大眾化。 組織可以使用無程式代碼解決方案讓數據更容易存取且更容易解譯,而此輔助功能可減少 IT 資源。
  • 使用具有整合式數據儲存和商業智慧的端對端串流分析解決方案,加速深入解析的時間。

串流數據流支援 DirectQuery 和 自動頁面重新整理/變更偵測。 此支援可讓使用者使用Power BI 中可用的任何視覺效果,以近乎即時的方式,每秒建置更新的報表。

需求

建立第一個串流數據流之前,請確定您符合下列所有需求:

  • 若要建立及執行串流數據流,您需要屬於 進階版 容量進階版 每位使用者 (PPU) 授權的工作區。

    重要

    如果您使用 PPU 授權,而且希望其他使用者使用以即時更新的串流數據流所建立的報表,他們也需要 PPU 授權。 然後,如果重新整理速度比每 30 分鐘快一次,他們可以使用相同的重新整理頻率來取用報表。

  • 為您的租用戶啟用數據流。 如需詳細資訊,請參閱在Power BI進階版 中啟用資料流。

  • 若要確定串流數據流在 進階版 容量中運作,必須開啟增強型計算引擎。 引擎預設為開啟,但 Power BI 容量管理員可以將其關閉。 若是如此,請連絡您的系統管理員以開啟它。

    增強型計算引擎僅適用於 進階版 P 或 Embedded A3 和更大的容量。 若要使用串流數據流,您需要任何大小的 PPU、進階版 P 容量,或內嵌 A3 或更大的容量。 如需 進階版 SKU 及其規格的詳細資訊,請參閱 Power BI 內嵌式分析中的容量和 SKU。

  • 若要建立即時更新的報表,請確定您的系統管理員 (容量或Power BI for PPU) 已啟用自動頁面重新整理。 也請確定系統管理員已允許符合您需求的最小重新整理間隔。 如需詳細資訊,請參閱 Power BI中的自動頁面重新整理。

建立串流數據流

串流數據流與其數據流相對一樣,是 Power BI 服務 工作區中建立和管理的實體(數據表)集合。 數據表是一組欄位,用來儲存數據,與資料庫中的數據表非常類似。

您可以直接從數據流建立所在的工作區,在串流數據流中新增和編輯數據表。 一般數據流的主要差異在於您不需要擔心重新整理或頻率。 由於串流數據的本質,因此會有連續串流傳入。 除非您停止重新整理,否則重新整理是常數或無限的。

注意

每個工作區只能有一種類型的數據流。 如果您的 進階版 工作區中已經有一般數據流,您將無法建立串流數據流(反之亦然)。

若要建立串流資料流:

  1. 在瀏覽器中開啟 Power BI 服務,然後選取已啟用 進階版 的工作區。 (串流數據流,例如一般數據流,無法在 中 取得我的工作區

  2. 選取 [ 新增 ] 下拉功能表,然後選擇 [ 串流數據流]。

    Screenshot that shows the New menu options with streaming dataflow highlighted.

  3. 在開啟的側邊窗格中,您必須為串流數據流命名。 在 [ 名稱 ] 方塊中輸入名稱 (1),然後選取 [ 建立 ] (2)。

    Screenshot of the new streaming dataflow pane with name and create highlighted.

    串流數據流的空白圖表檢視隨即出現。

下列螢幕快照顯示已完成的數據流。 它會醒目提示您在串流數據流 UI 中撰寫的所有可用區段。

Screenshot of an example dataflow window with the ribbon, diagram view, side pane, and tabs highlighted.

  1. 功能區:在功能區上,區段會遵循「傳統」分析程序的順序:輸入(也稱為數據源)、轉換(串流 ETL 作業)、輸出,以及用來儲存進度的按鈕。

  2. 圖表檢視:此檢視是數據流的圖形表示法,從輸入到作業到輸出。

  3. 側邊窗格:根據您在圖表檢視中選取的元件而定,您可以設定來修改每個輸入、轉換或輸出。

  4. 數據預覽、撰寫錯誤和運行時間錯誤的索引標籤:針對顯示的每個卡片,數據預覽會顯示該步驟的結果(輸入實時顯示,以及轉換和輸出的隨選)。

    本節也會摘要說明您在數據流中可能擁有的任何撰寫錯誤或警告。 選取每個錯誤或警告會選取該轉換。 此外,您可以在數據流執行之後存取運行時間錯誤,例如已卸除的訊息。

    您可以選取右上角的箭號,將串流數據流的這個區段降至最低。

串流數據流是以三個主要元件為基礎所建置: 串流輸入轉換輸出。 您可以視需要擁有多個元件,包括多個輸入、具有多個轉換的平行分支,以及多個輸出。

新增串流輸入

若要新增串流輸入,請選取功能區上的圖示,並提供側邊窗格上設定所需的資訊。 自 2021 年 7 月起,串流數據流的預覽支援 Azure 事件中樞Azure IoT 中樞 作為輸入。

Azure 事件中樞 和 Azure IoT 中樞 服務建置在通用架構上,以利快速且可調整的事件擷取和取用。 IoT 中樞 特別針對IoT應用程式與其連結裝置之間的雙向通訊,量身打造為中央訊息中樞。

Azure 事件中樞

Azure 事件中樞是一個巨量資料串流平台與事件擷取服務。 它每秒可接收和處理數百萬個事件。 傳送至事件中樞的數據可以使用任何即時分析提供者來轉換和儲存,或者您可以使用批處理或儲存配接器。

若要將事件中樞設定為串流數據流的輸入,請選取事件中 圖示。 卡片會出現在圖表檢視中,包括其設定的側邊窗格。

Screenshot that shows the event hub card and configuration pane in diagram view.

您可以選擇貼上事件中樞 連接字串。 串流數據流填寫所有必要的資訊,包括選擇性取用者群組(預設為 $Default)。 如果您想要手動輸入所有字段,您可以開啟手動輸入切換來顯示它們。 若要深入瞭解,請參閱取得事件中樞 連接字串

設定事件中樞認證並選取 [連線] 之後,如果您知道功能變數名稱,可以使用 [+ 新增] 字段手動新增欄位。 或者,您可以根據傳入訊息的範例自動偵測欄位和數據類型,選取 [ 自動偵測欄位]。 選取齒輪圖示可讓您視需要編輯認證。

Screenshot that shows input data options, EntryTime is selected with the more options tool tip displayed.

串流數據流偵測到欄位時,您可以在清單中看到它們。 圖表檢視下方的 [數據預覽] 資料表中也有內送訊息的即時預覽

您可以選取每個欄位旁的更多選項 (...) 來編輯功能變數名稱,或移除或變更資料類型。 您也可以從傳入訊息展開、選取和編輯任何巢狀字段,如下圖所示。

Screenshot that shows remove, rename and data type options for input data.

Azure IoT 中樞

IoT 中樞 是裝載於雲端的受控服務。 其可作為IoT應用程式與其連結裝置之間雙向通訊的中央訊息中樞。 您可以可靠地安全地連接數百萬部裝置及其後端解決方案。 幾乎任何裝置都可以連線到IoT中樞。

IoT 中樞 組態類似於事件中樞設定,因為其通用架構。 但有一些差異,包括在哪裡尋找內建端點的事件中樞相容 連接字串。 若要深入瞭解,請參閱 從內建端點讀取裝置到雲端訊息。

 Screenshot that shows the IOT Hub card and configuration pane in diagram view

貼上內建端點的 連接字串 之後,選取、新增、自動偵測和編輯來自 IoT 中樞 的所有功能與事件中樞相同。 您也可以選取齒輪圖示來編輯認證。

提示

如果您有組織 Azure 入口網站 中事件中樞或 IoT 中樞 的存取權,而且想要使用它作為串流數據流的輸入,您可以在下列位置找到 連接字串:

針對事件中樞:

  1. 在 [分析] 區段中,選取 [所有服務>事件中樞]。
  2. 選取 [事件中樞命名空間>實體/事件中樞],然後選取事件中樞名稱。
  3. 在 [ 共用存取原則] 清單中,選取原則。
  4. 選取 [連線 ion 字串-主鍵] 字段旁的 [複製到剪貼簿]。

針對 IoT 中樞:

  1. 在 [物聯網] 區段中,選取 [所有服務> IoT 中樞]。
  2. 選取您要連線的IoT中樞,然後選取 [內建端點]。
  3. 選取 [事件中樞兼容端點] 旁的 [ 複製到剪貼簿 ]。

當您使用來自事件中樞或 IoT 中樞 的串流資料時,您可以存取串流數據流中的下列元資料時間字段:

  • EventProcessedUtcTime:處理事件的日期和時間。
  • EventEnqueuedUtcTime:收到事件的日期和時間。

這兩個字段都不會出現在輸入預覽中。 您必須手動新增它們。

Blob 儲存體

Azure Blob 儲存體是 Microsoft 針對雲端推出的物件儲存體解決方案。 Blob 儲存體已針對儲存大量非結構化資料進行最佳化。 「非結構化資料」是指不符合特定資料模型或定義的資料,例如文字或二進位資料。

您可以使用 Azure Blob 作為串流或參考輸入。 每秒會檢查串流 Blob 是否有更新。 不同於串流 Blob,參考 Blob 只會在重新整理開始時載入。 這是預期不會變更的靜態數據,而靜態數據的建議 限製 為 50 MB 或更少。

Power BI 預期參考 Blob 會與串流來源搭配使用,例如透過 JOIN。 因此,具有參考 Blob 的串流數據流也必須有串流來源。

Azure Blob 的設定與 Azure 事件中樞 節點的設定稍有不同。 若要尋找您的 Azure Blob 連接字串,請參閱檢視帳戶存取密鑰

 Screenshot that shows the Streaming blob card and configuration pane in diagram view

輸入 Blob 連接字串 之後,您必須提供容器的名稱。 您也需要在目錄中輸入路徑模式,才能存取您想要設定為數據流來源的檔案。

對於串流 Blob,目錄路徑模式必須是動態值。 日期必須是 Blob 檔案路徑的一部分, 以 {date} 的形式參考。 此外,不支持路徑模式中的星號 ≦ ,例如 {date}/{time}/*.json。

例如,如果您有一個名為 ExampleContainer 的 Blob,您要將巢狀 .json 檔案儲存在 內,其中第一個層級是建立日期,而第二個層級是建立時間(yyyy-mm-dd/hh),則您的容器輸入會是 “ExampleContainer”。 目錄路徑模式會是 “{date}/{time}”,您可以在其中修改日期和時間模式。

Screenshot that shows the stream blob input boxes used to configure the example container.

當您的 Blob 連線到端點之後,選取、新增、自動偵測和編輯來自 Azure Blob 的欄位的所有功能,與事件中樞相同。 您也可以選取齒輪圖示來編輯認證。

使用即時數據時,通常會壓縮數據,並使用標識符來表示物件。 Blob 的可能使用案例也可能是串流來源的參考數據。 參考數據可讓您將靜態數據聯結至串流數據,以擴充串流以供分析。 當您在不同的百貨公司安裝感測器來測量特定時間有多少人進入商店時,這項功能的快速範例會很有説明。 通常,感測器標識碼必須聯結至靜態數據表,以指出感測器所在的百貨公司以及感測器所在的位置。 現在有了參考數據,就可以在擷取階段聯結此數據,讓您輕鬆查看哪些存放區具有最高的用戶輸出。

注意

如果 Blob 檔案可用,串流數據流作業會每秒從 Azure Blob 記憶體或 ADLS Gen2 輸入提取數據。 如果 Blob 檔案無法使用,則會有指數輪詢,最長的時間延遲為 90 秒。

資料類型

串流資料流欄位的可用資料類型包括:

  • DateTime:ISO 格式的日期和時間欄位
  • 浮點數:十進位數
  • Int:整數
  • 記錄:具有多個記錄的巢狀物件
  • 字串:文字

重要

針對串流輸入選取的數據類型對於串流數據流下游具有重要的影響。 盡早在數據流中選取數據類型,以避免稍後必須停止進行編輯。

新增串流數據轉換

串流數據轉換本質上與批次數據轉換不同。 幾乎所有的串流數據都有一個時間元件,會影響涉及的任何數據準備工作。

若要將串流數據轉換新增至數據流,請選取該轉換功能區上的轉換圖示。 個別卡片會出現在圖表檢視中。 選取它之後,您會看到該轉換的側邊窗格進行設定。

自 2021 年 7 月起,串流數據流支援下列串流轉換。

篩選器

使用篩選轉換,根據輸入中欄位的值來篩選事件。 根據數據類型(數位或文字),轉換會保留符合所選條件的值。

Screenshot that shows the Filter input boxes used to configure the example container.

注意

在每個卡片內,您會看到轉換準備就緒所需的其他資訊。 例如,當您新增卡片時,您會看到「需要設定」訊息。 如果您遺失節點連接器,您會看到「錯誤」或「警告」訊息。

管理欄位

[ 管理欄位 ] 轉換可讓您新增、移除或重新命名來自輸入或其他轉換的欄位。 側邊窗格上的設定可讓您選擇 [ 新增] 欄位或一次新增所有字段,來新增新的設定

Screenshot that shows configuration of the Manage fields transformation.

提示

設定卡片之後,圖表檢視可讓您查看卡片本身內的設定。 例如,在上圖的 [ 管理字段 ] 區域中,您可以看到要管理的前三個字段,以及指派給他們的新名稱。 每個卡片都有相關信息。

彙總

您可以使用匯總轉換來計算匯總(總和、最小值最大值平均),每次新事件在一段時間內發生時。 這項作業也可讓您根據數據中的其他維度來篩選或配量匯總。 您可以在相同的轉換中擁有一或多個匯總。

若要新增匯總,請選取轉換圖示。 然後連接輸入、選取匯總、新增任何篩選或配量維度,然後選擇您想要計算匯總的時間週期。 這個範例會根據車輛在過去 10 秒內來自的狀態計算收費值的總和。

 Screenshot of an aggregate card with an existing aggregate function. The aggregate pane shows the calculation details.

若要將另一個匯總新增至相同的轉換,請選取 [新增聚合函數]。 請記住,篩選或配量會套用至轉換中的所有匯總。

聯結

使用聯結轉換,根據您選取的欄位組結合來自兩個輸入的事件。 如果您未選取欄位組,聯結預設會以時間為基礎。 預設值是讓此轉換與批次不同。

如同一般聯結,您有不同的聯結邏輯選項:

  • 內部聯結:只包含配對相符之兩個數據表的記錄。 在此範例中,即車牌符合這兩個輸入的位置。
  • 左方外部聯結:包含左 (第一個) 數據表中的所有記錄,以及第二個符合欄位組的記錄。 如果沒有相符專案,則來自第二個輸入的欄位會設定空白。

若要選取聯結類型,請選取側邊窗格上慣用類型的圖示。

最後,選取您想要計算聯結的時段。 在此範例中,聯結會查看過去 10 秒。 請記住,期間越長,輸出越少,而您用於轉換的處理資源愈多。

根據預設,會包含這兩個數據表中的所有欄位。 輸出中的前置詞為左(第一個節點)和右(第二個節點),可協助您區分來源。

Screenshot of the event hub and join cards with the join configuration pane open.

分組依據

使用依轉換來計算特定時間範圍內所有事件的匯總。 您可以依一或多個欄位中的值進行分組。 這類似於匯總轉換,但提供更多匯總選項。 它也包含更複雜的時間範圍選項。 同樣類似於 匯總,您可以為每個轉換新增一個以上的匯總。

此轉換中可用的匯總包括: 平均值計數最大值最小值百分位數 (連續和離散)、 標準偏差變數

若要設定此轉換:

  1. 選取您慣用的匯總。
  2. 選擇您要匯總的欄位。
  3. 如果您想要取得另一個維度或類別的匯總計算,請選取選擇性的分組依據欄位(例如 State)。
  4. 選擇時間時段的函式。

若要將另一個匯總新增至相同的轉換,請選取 [新增聚合函數]。 請記住,[ 分組依據 ] 字段和視窗化函式會套用至轉換中的所有匯總。

Screenshot of the Group by card with the configuration pane open.

時間範圍結尾的時間戳會作為轉換輸出的一部分提供以供參考。

本文稍後的一節說明此轉換可用的每種時間範圍類型。

Union

使用聯集轉換來連接兩個或多個輸入,將具有共用欄位的事件(具有相同名稱和數據類型)新增至一個數據表。 不相符的欄位將會卸除,且不會包含在輸出中。

設定時間範圍函式

時間範圍是串流數據中最複雜的概念之一。 此概念位於串流分析的核心。

透過串流數據流,您可以在匯總數據作為依轉換群組的選項時設定時間範圍。

注意

請記住,視窗化作業的所有輸出結果都會在時間範圍結束時計算。 窗口的輸出將是以聚合函數為基礎的單一事件。 此事件會有窗口結尾的時間戳,而且所有視窗函式都會以固定長度定義。

Diagram that shows three time windows on a graph.

有五種時間範圍可供選擇:輪轉、跳動、滑動、會話和快照集。

輪轉時間範圍

輪轉是最常見的時間範圍類型。 輪轉視窗的主要特性是其重複、具有相同的時間長度,且不會重疊。 事件不能屬於一個以上的輪轉視窗。

Diagram that shows a 10-second tumbling window.

當您在串流資料流中設定輪轉視窗時,您必須提供視窗的持續時間(在此案例中為所有視窗相同)。 您也可以提供選擇性位移。 根據預設,輪轉視窗會包含視窗的結尾,並排除開頭。 您可以使用此參數來變更此行為,並在窗口開頭包含事件,並排除結尾的事件。

Screenshot that shows duration and offset settings for a tumbling time window.

跳動時間範圍

依固定期間向前跳動視窗「躍點」。 您可以將這些視窗視為輪轉視窗,這些視窗可以重疊,而且會比視窗大小更頻繁地發出。 事件可以屬於跳躍視窗的多個結果集。 若要讓跳動視窗與輪轉視窗相同,您可以指定躍點大小與視窗大小相同。

Diagram that shows a 10-second hopping window.

當您在串流資料流中設定跳動視窗時,您必須提供視窗的持續時間(與輪轉視窗相同)。 您也需要提供躍點大小,這會告知串流數據流您希望匯總在定義期間計算的頻率。

位移參數也適用於跳躍視窗,原因與輪轉視窗相同。 它會針對跳躍視窗的開頭和結尾定義包含和排除事件的邏輯。

Screenshot that shows hop size, duration, and offset settings for a hopping time window.

滑動視窗

滑動視窗與輪轉或跳躍視窗不同,只有在視窗的內容實際變更時,才會計算時間點的匯總。 當事件進入或結束視窗時,會計算匯總。 因此,每個視窗至少有一個事件。 與跳躍窗口類似,事件可以屬於一個以上的滑動視窗。

Diagram that shows a 10-second sliding window.

您需要滑動視窗的唯一參數是持續時間,因為事件本身會在窗口啟動時定義。 不需要位移邏輯。

Screenshot that shows the duration setting for a sliding time window.

工作階段時間範圍

會話視窗是最複雜的類型。 他們會將抵達類似時間的事件分組,篩選出沒有數據的時間週期。 針對此視窗,必須提供:

  • 逾時:如果沒有新的數據,要等待多久。
  • 持續時間上限:匯總計算數據是否持續持續的時間最長。

如有需要,您也可以定義分割區。

Diagram that shows session windows with a five-minute timeout.

您直接在轉換的側邊窗格上設定會話視窗。 如果您提供分割區,匯總只會將相同索引鍵的事件群組在一起。

Screenshot that shows the duration, timeout, and partition settings for a session time window.

快照集視窗

快照集視窗群組具有相同時間戳的事件。 與其他視窗不同,快照集不需要任何參數,因為它會使用系統的時間。

Diagram that shows a snapshot window on a 35-minute timeline.

定義輸出

設定輸入和轉換之後,是時候定義一或多個輸出了。 自 2021 年 7 月起,串流數據流支援 Power BI 數據表作為唯一的輸出類型。

此輸出是數據流數據表(也就是實體),可用來在Power BI Desktop 中建立報表。 您必須將上一個步驟的節點與您所建立的輸出聯結,使其正常運作。 之後,將資料表命名為 。

Screenshot that shows the output table card and output table configuration pane.

連線到數據流之後,此數據表將可供您建立即時更新報表的視覺效果。

數據預覽和錯誤

串流數據流提供工具來協助您撰寫、疑難解答及評估分析管線的效能,以用於串流數據。

輸入的實時數據預覽

當您連線到事件中樞或 IoT 中樞,並在圖表檢視中選取其卡片([ 數據預覽 ] 索引標籤時,如果下列所有內容都成立,您就會取得數據的即時預覽:

  • 正在推送數據。
  • 輸入已正確設定。
  • 已新增欄位。

如下列螢幕快照所示,如果您想要查看或向下切入特定專案,您可以暫停預覽 (1)。 或者,如果您完成,可以再次啟動它。

您也可以選取特定記錄(資料表中的「儲存格」,然後選取 [顯示詳細數據] 或 [隱藏詳細數據],以查看特定記錄的詳細數據(2)。 此螢幕快照顯示記錄中巢狀物件的詳細檢視。

Screenshot that shows a live data preview with the pause and show or hide options highlighted.

轉換和輸出的靜態預覽

新增並設定圖表檢視中的任何步驟之後,您可以選取靜態數據按鈕來測試其行為。

完成之後,串流數據流會評估正確設定的所有轉換和輸出。 串流數據流接著會在靜態數據預覽中顯示結果,如下圖所示。

Screenshot that shows a static data preview with the refresh and hide options highlighted.

您可以選取 [重新整理靜態預覽] 來重新整理預覽 (1)。 當您這樣做時,串流數據流會從輸入中取得新的數據,並再次評估所有轉換和輸出,其中包含您可能已執行的任何更新。 您也可以使用 [ 顯示] 或 [隱藏詳細資料 ] 選項 (2)。

撰寫錯誤

如果您有任何撰寫錯誤或警告,[ 撰寫錯誤 ] 索引卷標 (1) 會列出它們,如下列螢幕快照所示。 此清單包含錯誤或警告的詳細數據、卡片類型(輸入、轉換或輸出)、錯誤層級,以及錯誤或警告的描述(2)。 當您選取任何錯誤或警告時,會選取個別的卡片,並開啟組態側窗格,讓您進行所需的變更。

Screenshot that shows a list of authoring errors.

運行時錯誤

預覽中最後一個可用的索引標籤是 運行時間錯誤 (1),如下列螢幕快照所示。 此索引標籤會列出在啟動串流數據流之後擷取和分析串流數據流過程中的任何錯誤。 例如,如果訊息損毀,且數據流無法內嵌並執行定義的轉換,您可能會收到運行時錯誤。

因為數據流可能會長時間執行,所以此索引標籤會提供依時間範圍篩選的選項,並視需要下載錯誤清單並重新整理它(2)。

Screenshot that shows the tab for runtime errors, along with options for filtering, downloading, and refreshing.

修改串流數據流的設定

如同一般數據流,視擁有者和作者的需求而定,可以修改串流數據流的設定。 下列設定對串流數據流而言是唯一的。 針對其餘的設定,因為兩種數據流類型之間的共用基礎結構,您可以假設用法相同。

Screenshot that shows settings for a streaming dataflow.

  • 重新整理歷程記錄:因為串流數據流會持續執行,所以重新整理歷程記錄只會顯示數據流啟動時、取消時,或失敗時的信息(適用時會有詳細數據和錯誤碼)。 這項資訊與一般數據流所顯示的類似。 您可以使用這項資訊來針對問題進行疑難解答,或以要求的詳細數據提供 Power BI 支援。

  • 數據來源認證:此設定會顯示已針對特定串流數據流設定的輸入。

  • 增強的計算引擎設定:串流數據流需要增強的計算引擎來提供即時視覺效果,因此預設會開啟此設定,且無法變更。

  • 保留期間:此設定專屬於串流數據流。 您可以在這裏定義想要讓即時數據在報表中可視化的時間長度。 歷程記錄數據預設會儲存在 Azure Blob 儲存體 中。 此設定專屬於數據的即時端 (經常性儲存區)。 最小值為 1 天或 24 小時。

    重要

    此保留期間所儲存的經常性數據量,直接影響到您在此數據上建立報表時的即時視覺效果效能。 您在這裡擁有的保留期越多,報表中的實時視覺效果就越受到低效能的影響。 如果您需要執行歷程記錄分析,您應該使用針對串流數據流提供的冷記憶體。

執行和編輯串流數據流

儲存並設定串流數據流之後,所有專案都可供您執行。 然後,您可以使用您已定義的串流分析邏輯,開始將數據內嵌至 Power BI。

執行串流數據流

若要啟動串流數據流,請先儲存數據流,然後移至您建立數據流的工作區。 將滑鼠停留在串流數據流上,然後選取出現的播放按鈕。 快顯訊息會告訴您正在啟動串流數據流。

Screenshot that shows the play button for starting a streaming dataflow.

注意

最多可能需要五分鐘的時間,數據才會開始內嵌,並讓您查看傳入的數據,以在Power BI Desktop 中建立報表和儀錶板。

編輯串流數據流

串流數據流正在執行時, 無法編輯它。 但是,您可以進入處於執行中狀態的串流數據流,並查看數據流所建置的分析邏輯。

當您進入執行中的串流數據流時,會停用所有編輯選項,並顯示訊息:「數據流在執行時無法編輯。 如果您想要繼續,請停止數據流。數據預覽也已停用。

若要編輯串流數據流,您必須加以停止。 停止的數據流會導致數據遺失。

串流數據流執行時唯一可用的體驗是 [運行時間錯誤 ] 索引標籤,您可以在其中監視數據流對於任何已卸除訊息和類似情況的行為。

Screenshot that shows the disabled data preview when a streaming dataflow is running.

編輯數據流時,請考慮數據記憶體

當您編輯數據流時,必須考慮其他考慮。 類似於一般數據流架構中的任何變更,如果您對輸出數據表進行變更,就會遺失已推送並儲存至 Power BI 的數據。 介面會清楚瞭解串流數據流中這些變更的結果,以及您在儲存之前所做的變更選擇。

此體驗較好地以範例顯示。 下列螢幕快照顯示當您將數據行新增至一個數據表、變更第二個數據表的名稱,並將第三個數據表保留之前相同的訊息。

Screenshot that shows an informational message that lists the changes made to output tables and their impact.

在此範例中,如果您儲存變更,則會刪除已儲存在架構和名稱變更的數據表中的數據。 對於保持不變的數據表,您可以選擇刪除任何舊數據並從頭開始,或儲存它以供稍後分析,以及隨附的新數據。

編輯串流數據流時,請記住這些細微差別,特別是當您稍後需要歷史數據可供進一步分析時。

取用串流數據流

串流數據流執行之後,您就可以開始在串流數據上建立內容。 相較於您必須執行的動作,建立即時更新的報表,沒有任何結構變更。 有一些細微差別和更新需要考慮,以便您可以利用這種新類型的數據準備串流數據。

設定數據記憶體

如先前所述,串流數據流會將數據儲存在下列兩個位置。 這些來源的使用取決於您嘗試執行的分析類型。

  • 經常性儲存區(即時分析):當數據從串流數據流進入Power BI時,數據會儲存在熱位置,讓您能夠使用即時視覺效果進行存取。 此記憶體中儲存的數據量取決於您在串流數據流設定中針對 保留期間 定義的值。 預設值 (和最小值) 為24小時。
  • 冷記憶體 (歷程分析):任何未落在您為保留期間定義的期間內,都會儲存在 Power BI 中的冷記憶體(Blob)中,以便在需要時取用。

注意

這兩個數據儲存位置之間有重疊。 如果您需要同時使用這兩個位置(例如,日間百分比變更),您可能需要重複數據刪除記錄。 這取決於您進行的時間智能計算和保留原則。

連線 從 Power BI Desktop 串流數據流

Power BI Desktop 提供稱為 數據流的 連接器,可供您使用。 在串流數據流的這個連接器中,您會看到兩個符合先前所述數據記憶體的數據表。

若要連線到您的資料以進行串流資料流:

  1. 移至 [ 取得數據],選取 [Power Platform],然後選擇 [數據流 ] 連接器。

    Screenshot of the Get Data window, Power Platform is selected in the navigation pane and Dataflows is highlighted in the main pane.

  2. 使用您的 Power BI 認證登入。

  3. 選取工作區。 尋找包含串流數據流的數據流,然後選取該數據流。 (在此範例中,會呼叫 串流數據流Toll.)

  4. 請注意,所有輸出數據表都會顯示兩次:一個用於串流數據(經常性存取),另一個用於封存數據(冷)。 您可以依資料表名稱和圖示之後新增的標籤加以區分。

    Screenshot of a list of output tables in the Toll dataflow.

  5. 連線 串流數據。 封存的數據案例相同,僅適用於匯入模式。 選取包含標籤 串流經常性存取的數據表,然後選取 [ 載入]。

    Screenshot that shows hot output tables selected for streaming dataflows in Power BI Desktop.

  6. 當系統要求您選擇儲存模式時,如果您想要建立即時視覺效果,請選取 [DirectQuery ]。

    Screenshot that shows the storage mode selected for streaming dataflows in Power BI Desktop.

現在您可以使用Power BI Desktop 中可用的功能來建立視覺效果、量值等等。

注意

一般 Power BI 數據流連接器仍可使用,且會搭配兩個注意事項來處理串流數據流:

  • 它只允許您連線到經常性存取記憶體。
  • 連接器中的數據預覽不適用於串流數據流。

開啟即時視覺效果的自動頁面重新整理

報表準備就緒且您已新增您想要共用的所有內容之後,唯一的剩餘步驟是確定視覺效果已即時更新。 您可以使用稱為 自動頁面重新整理的功能。 這項功能可讓您盡可能多地重新整理 DirectQuery 來源的視覺效果。

如需此功能的詳細資訊,請參閱 Power BI 中的自動頁面重新整理。 本文包含有關如何使用它、如何設定它,以及如何連絡您的系統管理員,如果您遇到問題, 文章會包含相關信息。 以下是如何設定它的基本概念:

  1. 移至您想要即時更新視覺效果的報表頁面。

  2. 清除頁面上的任何視覺效果。 可能的話,請選取頁面的背景。

  3. 移至 [格式] 窗格 (1),然後開啟 [頁面重新整理] (2)。

    Screenshot that shows selections for turning on automatic page refresh.

  4. 設定所需的頻率(如果您的系統管理員允許,則最多每秒一次)。

    Screenshot that shows frequency settings for automatic page refresh.

  5. 若要共用實時報表,請先發佈回 Power BI 服務。 然後,您可以設定語意模型和共用的數據流認證。

提示

如果您的報表未如需要或即時更新,請檢查檔以 取得自動頁面重新整理。 請遵循常見問題和疑難解答指示,找出此問題發生的原因。

考量與限制

一般限制

  • 建立和執行串流數據流需要Power BI進階版 訂用帳戶(容量或 PPU)。
  • 每個工作區只允許一種類型的數據流。
  • 無法連結一般數據流和串流數據流。
  • 小於 A3 的容量不允許使用串流數據流。
  • 如果租使用者中未啟用數據流或增強型計算引擎,則您無法建立或執行串流數據流。
  • 不支援連線到記憶體帳戶的工作區。
  • 每個串流數據流最多可提供每秒 1 MB 的輸送量。

可用性

串流數據流的預覽無法在下列區域中使用:

  • 印度中部
  • 德國北部
  • 挪威東部
  • 挪威西部
  • 阿拉伯聯合大公國中部
  • 南非北部
  • 南非西部
  • 瑞士北部
  • 瑞士西部
  • 巴西東南部

授權

每個租用戶允許的串流數據流數目取決於所使用的授權:

  • 針對一般容量,請使用下列公式來計算容量中允許的串流數據流數目上限:

    每個容量的串流數據流數目上限 = 容量 x 5 中的虛擬核心

    例如,P1 有 8 個虛擬核心:8 * 5 = 40 串流數據流。

  • 針對每個使用者 進階版,每個用戶允許一個串流數據流。 如果其他使用者想要取用 PPU 工作區中的串流數據流,他們也需要 PPU 授權。

數據流撰寫

當您撰寫串流數據流時,請注意下列考慮:

  • 串流數據流的擁有者只能進行修改,而且只有在數據流未執行時,才能進行修改。
  • [我的工作區] 中無法使用串流數據流。

從 Power BI Desktop 連線

您只能使用 從 2021 年 7 月 Power BI Desktop 更新開始提供的數據流 連接器來存取冷記憶體。 先前的Power BI資料流連接器只允許連線到串流資料(經常性存取)記憶體。 連接器的數據預覽無法運作。

本文提供使用串流數據流進行自助串流數據準備的概觀。 下列文章提供如何測試這項功能以及如何在Power BI中使用其他串流數據功能的相關信息: