การกำหนดค่าที่จัดเก็บกระแสข้อมูลเพื่อใช้ Azure Data Lake Gen 2
ข้อมูลที่ใช้กับ Power BI จะถูกเก็บไว้ในที่เก็บข้อมูลภายในโดย Power BI ตามค่าเริ่มต้น ด้วยการรวมกันของกระแสข้อมูลและ Azure Data Lake Storage Gen 2 (ADLS Gen2) คุณสามารถจัดเก็บกระแสข้อมูลของคุณในบัญชี Azure Data Lake Storage Gen2 ภายในองค์กรของคุณได้ โดยหลักๆ แล้วนี้ช่วยให้คุณสามารถ "นําที่เก็บข้อมูลของคุณมาเอง" ไปยังกระแสข้อมูล Power BI และสร้างการเชื่อมต่อที่ระดับผู้เช่าหรือพื้นที่ทํางาน
เหตุผลในการใช้พื้นที่ทํางาน ADLS Gen 2 หรือการเชื่อมต่อของผู้เช่า
หลังจากที่คุณแนบกระแสข้อมูลของคุณแล้ว Power BI จะกําหนดค่าและบันทึกการอ้างอิงเพื่อให้คุณสามารถอ่านและเขียนข้อมูลไปยัง ADLS Gen 2 ของคุณเองได้ Power BI จัดเก็บข้อมูลในรูปแบบ CDM ซึ่งบันทึกเมตาดาต้าเกี่ยวกับข้อมูลของคุณนอกเหนือจากข้อมูลจริงที่สร้างขึ้นโดยกระแสข้อมูลเอง สิ่งนี้จะปลดล็อกความสามารถที่มีประสิทธิภาพมากมายและเปิดใช้งานข้อมูลของคุณและเมตาดาต้าที่เกี่ยวข้องในรูปแบบ CDM เพื่อรองรับความสามารถในการขยายระบบอัตโนมัติการตรวจสอบและสถานการณ์การสํารองข้อมูล ด้วยการทําให้ข้อมูลนี้พร้อมใช้งานและสามารถเข้าถึงได้อย่างกว้างขวางในสภาพแวดล้อมของคุณเอง จะช่วยให้คุณสามารถทําให้ข้อมูลเชิงลึกและข้อมูลที่สร้างขึ้นภายในองค์กรเป็นประชาธิปไตย นอกจากนี้ยังปลดล็อกความสามารถสําหรับคุณในการสร้างโซลูชันเพิ่มเติมที่ CDM รู้จัก (เช่น แอปพลิเคชันแบบกําหนดเองและโซลูชันใน Power Platform, Azure และโซลูชันที่พร้อมใช้งานผ่านคู่ค้าและระบบนิเวศของ ISV) หรือเพียงแค่สามารถอ่าน CSV ได้ ตอนนี้วิศวกรข้อมูล นักวิทยาศาสตร์ข้อมูล และนักวิเคราะห์ของคุณสามารถทํางานกับ ใช้ และนําชุดข้อมูลทั่วไปที่รวบรวมไว้ใน ADLS Gen 2 มาใช้ใหม่ได้
มีวิธีการกําหนดค่าที่เก็บ ADLS Gen 2 ที่จะใช้สองวิธี: คุณสามารถใช้บัญชี ADLS Gen 2 ที่กําหนดให้ผู้เช่า หรือคุณสามารถนําที่เก็บ ADLS Gen 2 ของคุณเองมาใช้ในระดับพื้นที่ทํางาน
สิ่งที่จำเป็นต้องมี
หากต้องการนําบัญชี ADLS Gen 2 ของคุณเองมาใช้ คุณต้องมีสิทธิ์ ระดับเจ้าของ ในเลเยอร์บัญชีที่เก็บข้อมูล สิทธิ์ในกลุ่มทรัพยากรหรือระดับการสมัครใช้งาน จะไม่ ทํางาน ถ้าคุณเป็นผู้ดูแลระบบ คุณยังต้องกําหนดสิทธิ์ เจ้าของ ด้วยตัวคุณเอง ปัจจุบันไม่รองรับบัญชีที่เก็บข้อมูล ADLS Gen2 ที่อยู่เบื้องหลังไฟร์วอลล์
คุณต้องสร้างบัญชีที่เก็บข้อมูลด้วยการเปิดใช้งานเนมสเปซแบบลำดับชั้น (HNS)
บัญชีที่เก็บข้อมูลต้องถูกสร้างขึ้นในผู้เช่า Azure Active Directory เดียวกันกับผู้เช่า Power BI
ผู้ใช้ต้องมีบทบาทเจ้าของข้อมูล Azure Blob บทบาทตัวอ่านข้อมูล Azure Blob และบทบาทเจ้าของที่ระดับบัญชีเก็บข้อมูล (ขอบเขตควรเป็น ทรัพยากรนี้ และไม่ได้รับการสืบทอด) การเปลี่ยนแปลงบทบาทที่ใช้อาจใช้เวลาสักครู่เพื่อทําการซิงค์ และต้องซิงค์ก่อนที่ขั้นตอนต่อไปนี้จะเสร็จสมบูรณ์ในบริการของ Power BI
ภูมิภาคผู้เช่าพื้นที่ทํางาน Power BI ควรเหมือนกับภูมิภาคบัญชีเก็บข้อมูล
จําเป็นต้องใช้ TLS (Transport Layer Security) เวอร์ชัน 1.2 (หรือสูงกว่า) เพื่อรักษาความปลอดภัยจุดสิ้นสุดของคุณ เว็บเบราว์เซอร์และแอปพลิเคชันไคลเอ็นต์อื่น ๆ ที่ใช้ TLS เวอร์ชันก่อนหน้า TLS 1.2 จะไม่สามารถเชื่อมต่อได้
การแนบกระแสข้อมูลด้วย ADLS Gen 2 ที่อยู่เบื้องหลังการรับรองความถูกต้องแบบหลายปัจจัย (MFA) ไม่ได้รับการสนับสนุน
สุดท้าย คุณสามารถเชื่อมต่อกับ ADLS Gen 2 ใดก็ได้จากพอร์ทัลผู้ดูแลระบบ แต่ถ้าคุณเชื่อมต่อโดยตรงกับพื้นที่ทํางาน ก่อนอื่นคุณต้องตรวจสอบให้แน่ใจว่าไม่มีกระแสข้อมูลในพื้นที่ทํางานก่อนที่จะเชื่อมต่อ
ตารางต่อไปนี้อธิบายถึงสิทธิ์สําหรับ ADLS และสําหรับ Power BI ที่จําเป็นสําหรับ ADLS Gen 2 และ Power BI:
| การดำเนินการ | สิทธิ์ ADLS | สิทธิ์ Power BI ขั้นต่ํา |
|---|---|---|
| เชื่อมต่อ ADLS Gen 2 กับผู้เช่า Power BI | เจ้าของ | ผู้ดูแลระบบ Power BI |
| เชื่อมต่อ ADLS Gen 2 กับพื้นที่ทํางาน | เจ้าของ | Adminพื้นที่ทํางาน |
| สร้างกระแสข้อมูล Power BI ที่เขียนกลับไปยังบัญชี ADLS ที่เชื่อมต่อกัน | ไม่สามารถใช้งานได้ | ผู้สนับสนุนพื้นที่ทำงาน |
| ใช้กระแสข้อมูล Power BI | ไม่สามารถใช้งานได้ | ผู้ชมพื้นที่ทำงาน |
การเชื่อมต่อกับ Azure Data Lake Gen 2 ในระดับพื้นที่ทํางาน
นำทางไปยังพื้นที่ทำงานที่ไม่มีกระแสข้อมูล เลือก การตั้งค่าพื้นที่ทํางาน เลือกแท็บ การเชื่อมต่อ Azure จากนั้นเลือกส่วน ที่จัดเก็บ

ตัวเลือก ใช้การเชื่อมต่อ Azure ค่าเริ่มต้น จะปรากฏให้เห็นถ้าผู้ดูแลระบบได้กําหนดค่าบัญชี ADLS Gen 2 ที่กําหนดให้กับผู้เช่าแล้ว คุณมีสองตัวเลือก:
- ใช้บัญชี ADLS Gen 2 ที่กําหนดค่าผู้เช่าโดยการเลือกช่องที่เรียกว่า ใช้การเชื่อมต่อ Azure ค่าเริ่มต้น หรือ
- เลือก เชื่อมต่อกับ Azure เพื่อชี้ไปยังบัญชี Azure Storage ใหม่
เมื่อคุณเลือก เชื่อมต่อกับ Azure, Power BI จะดึงรายการการสมัครใช้งาน Azure ที่คุณสามารถเข้าถึงได้ กรอกข้อมูลในดรอปดาวน์และเลือกการสมัครใช้งาน Azure กลุ่มทรัพยากร และบัญชีเก็บข้อมูลที่ถูกต้องที่เปิดใช้งานตัวเลือกเนมสเปซแบบลําดับชั้นซึ่งเป็นแฟล็ก ADLS Gen2

เมื่อเลือกแล้ว ให้เลือก บันทึก และตอนนี้คุณได้เชื่อมต่อพื้นที่ทํางานกับบัญชี ADLS Gen2 ของคุณเองเรียบร้อยแล้ว Power BI กําหนดค่าบัญชีที่เก็บข้อมูลโดยอัตโนมัติด้วยสิทธิ์ที่จําเป็นและตั้งค่าระบบไฟล์ Power BI ที่จะเขียนข้อมูล ณ จุดนี้ข้อมูลทั้งหมดของกระแสข้อมูลภายในพื้นที่ทำงานนี้จะเขียนลงในระบบไฟล์นี้โดยตรง ซึ่งสามารถใช้กับบริการ Azure อื่น ๆ ได้โดยสร้างแหล่งข้อมูลเดียวสำหรับข้อมูลองค์กรหรือแผนกทั้งหมดของคุณ
การทําความเข้าใจเกี่ยวกับการกําหนดค่า
การกําหนดค่าการเชื่อมต่อ Azure เป็นการตั้งค่าทางเลือกที่มีคุณสมบัติเพิ่มเติมที่สามารถเลือกตั้งค่าได้:
- ที่เก็บข้อมูลระดับผู้เช่า ซึ่งช่วยให้คุณตั้งค่าเริ่มต้น และ/หรือ
- ที่เก็บข้อมูลระดับพื้นที่ทํางาน ซึ่งช่วยให้คุณสามารถระบุการเชื่อมต่อต่อพื้นที่ทํางานได้
คุณสามารถเลือกกําหนดค่าที่เก็บข้อมูลระดับผู้เช่าได้ถ้าคุณต้องการใช้ที่จัดเก็บข้อมูลแบบรวมศูนย์เท่านั้น หรือต้องการให้เป็นตัวเลือกเริ่มต้น เราจะไม่เริ่มใช้ค่าเริ่มต้นโดยอัตโนมัติเพื่อให้มีความยืดหยุ่นในการกําหนดค่าของคุณ เพื่อให้คุณมีความยืดหยุ่นในการกําหนดค่าพื้นที่ทํางานที่ใช้การเชื่อมต่อนี้ตามที่คุณเห็นว่าเหมาะสม ถ้าคุณกําหนดค่าบัญชี ADLS Gen 2 ที่กําหนดให้ผู้เช่า คุณยังต้องกําหนดค่าแต่ละพื้นที่ทํางานเพื่อใช้ตัวเลือกค่าเริ่มต้นนี้
นอกจากนี้ คุณยังสามารถกําหนดสิทธิ์การจัดเก็บระดับพื้นที่ทํางานเป็นตัวเลือกแยกต่างหาก ซึ่งมีความยืดหยุ่นที่สมบูรณ์ในการตั้งค่าบัญชี ADLS Gen 2 เฉพาะบนพื้นที่ทํางานตามพื้นที่ทํางาน
ในการสรุป ถ้าอนุญาตให้มีที่เก็บข้อมูลระดับผู้เช่าและระดับพื้นที่ทํางาน ผู้ดูแลระบบพื้นที่ทํางานสามารถใช้การเชื่อมต่อ ADLS ค่าเริ่มต้น หรือเลือกที่จะกําหนดค่าบัญชีเก็บข้อมูลอื่นที่แยกต่างหากจากค่าเริ่มต้น ถ้าไม่ได้ตั้งค่าที่เก็บข้อมูลผู้เช่า ผู้ดูแลระบบพื้นที่ทํางานสามารถกําหนดค่าบัญชี ADLS บนพื้นที่ทํางานได้ตามพื้นที่ทํางาน สุดท้าย ถ้าผู้เช่าระดับที่เก็บข้อมูลถูกเลือก และไม่ได้รับอนุญาตให้เก็บระดับพื้นที่ทํางาน ผู้ดูแลระบบพื้นที่ทํางานสามารถกําหนดค่ากระแสข้อมูลของพวกเขาเพื่อใช้การเชื่อมต่อนี้
การทําความเข้าใจโครงสร้างและรูปแบบสําหรับการเชื่อมต่อพื้นที่ทํางาน ADLS Gen 2
ในบัญชีที่เก็บข้อมูล ADLS Gen 2 กระแสข้อมูลทั้งหมดจะถูกเก็บไว้ในคอนเทนเนอร์ powerbi ของระบบไฟล์
โครงสร้างของคอนเทนเนอร์ powerbi มีลักษณะดังนี้: <workspace name>/<dataflow name>/model.json <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots>
ตําแหน่งที่ตั้งที่กระแสข้อมูลจัดเก็บข้อมูลในลําดับชั้นโฟลเดอร์สําหรับ ADLS Gen 2 ถูกกําหนดโดยว่าพื้นที่ทํางานอยู่ในความจุที่ใช้ร่วมกันหรือความจุพรีเมียม โครงสร้างไฟล์หลังจากรีเฟรชสําหรับแต่ละชนิดความจุจะแสดงในตารางด้านล่าง
| ความจุแบบพรีเมียม | ความจุที่ใช้ร่วมกัน |
|---|---|
<workspace name>/<dataflow name>/<table name>/<tablesnapshots> |
<workspace name>/<dataflow name>/<table name>/<tablesnapshots> |
ด้านล่างนี้คือตัวอย่างที่ใช้ตาราง Orders ของตัวอย่าง Northwind Odata

ในภาพด้านบน:
- model.json เป็นกระแสข้อมูลเวอร์ชันล่าสุด
- model.json.snapshots เป็นเวอร์ชันก่อนหน้าทั้งหมดของกระแสข้อมูล ซึ่งจะเป็นประโยชน์ถ้าคุณต้องการ Mashup เวอร์ชันก่อนหน้า หรือการตั้งค่าแบบเพิ่มหน่วย
- table.snapshots.csvคือข้อมูลที่คุณได้รับจากการรีเฟรช ซึ่งจะเป็นประโยชน์สําหรับการรีเฟรชแบบเพิ่มหน่วย และสําหรับการรีเฟรชที่ใช้ร่วมกันซึ่งผู้ใช้กําลังทํางานอยู่ในปัญหาการหมดเวลาการรีเฟรชเนื่องจากขนาดข้อมูล พวกเขาสามารถดูที่สแนปช็อตล่าสุดเพื่อดูว่าข้อมูลอยู่ในไฟล์ csv มากแค่ไหน
เราเขียนไปยังบัญชีที่เก็บข้อมูลนี้เท่านั้น และจะไม่ลบข้อมูลในขณะนี้ ซึ่งหมายความว่าแม้หลังจากแยกออกเราจะไม่ลบออกจากบัญชี ADLS ดังนั้นไฟล์ข้างต้นทั้งหมดจะยังคงถูกเก็บไว้
หมายเหตุ
ไฟล์ model.json สามารถอ้างอิงไปยัง model.json อีกตัวซึ่งเป็นกระแสข้อมูลอีกตัวหนึ่งในพื้นที่ทํางานเดียวกัน หรือในกระแสข้อมูลในพื้นที่ทํางานอื่น ครั้งเดียวที่ model.json จะอ้างอิงไปยังtable.snapshot.csvคือการรีเฟรชแบบเพิ่มหน่วย
ความสามารถในการเพิ่มสําหรับการเชื่อมต่อพื้นที่ทํางาน ADLS Gen 2
ถ้าคุณกําลังเชื่อมต่อ ADLS Gen 2 กับ Power BI คุณสามารถทําสิ่งนี้ได้ในระดับพื้นที่ทํางานหรือระดับผู้เช่า ตรวจสอบให้แน่ใจว่าคุณมีระดับการเข้าถึงที่ถูกต้อง เรียนรู้เพิ่มเติมใน ข้อกําหนดเบื้องต้น
โครงสร้างที่เก็บข้อมูลจะเป็นไปตามรูปแบบ Common Data Model เรียนรู้เพิ่มเติมเกี่ยวกับโครงสร้างที่เก็บข้อมูลและ CDM โดยไปที่ โครงสร้างพื้นที่จัดเก็บสําหรับกระแสข้อมูลการวิเคราะห์ และ Common Data Model และ Azure Data Lake Storage รุ่น2
เมื่อกําหนดค่าอย่างเหมาะสม แล้ว ข้อมูลและเมตาดาต้าจะอยู่ในตัวควบคุมของคุณ แอปพลิเคชันจํานวนมากตระหนักถึง CDM และข้อมูลสามารถขยายได้โดยใช้ Azure, PowerApps และ PowerAutomate รวมถึงระบบนิเวศของบุคคลที่สามโดยสอดคล้องกับรูปแบบหรือโดยการอ่านข้อมูลดิบ
การแยก Azure Data Lake Gen 2 ออกจากพื้นที่ทำงานหรือผู้เช่า
หากต้องการลบการเชื่อมต่อในระดับพื้นที่ทำงาน ก่อนอื่นคุณต้องแน่ใจว่าคุณได้ลบกระแสข้อมูลทั้งหมดในพื้นที่ทำงานแล้ว เมื่อลบกระแสข้อมูลทั้งหมดแล้ว ให้เลือก ยกเลิกการเชื่อมต่อ ในการตั้งค่าพื้นที่ทำงาน เช่นเดียวกันกับผู้เช่า แต่ก่อนอื่นคุณต้องแน่ใจว่าคุณได้ยกเลิกการเชื่อมต่อพื้นที่ทำงานทั้งหมดจากบัญชีที่เก็บข้อมูลของผู้เช่าแล้ว ก่อนที่คุณจะสามารถยกเลิกการเชื่อมต่อในระดับผู้เช่าได้
การปิดใช้งาน Azure Data Lake Gen 2
ใน พอร์ทัลผู้ดูแลระบบ ภายใต้ กระแสข้อมูล คุณสามารถปิดใช้งานการเข้าถึงสำหรับผู้ใช้เพื่อใช้คุณลักษณะนี้และสามารถไม่อนุญาตให้ผู้ดูแลระบบพื้นที่ทำงานนำ Azure Storage ของตนเองมาใช้ได้
การแปลงกลับจาก Azure Data Lake Gen 2
เมื่อที่เก็บกระแสข้อมูลได้รับการกําหนดค่าให้ใช้ Azure Data Lake Gen 2 จะไม่มีการแปลงกลับโดยอัตโนมัติ กระบวนการในการกลับไปยังที่เก็บข้อมูลที่มีการจัดการของ Power BI เป็นแบบแมนวล
หากต้องการแปลงกลับการโยกย้ายที่คุณดําเนินการกับ Gen 2 คุณจะต้องลบกระแสข้อมูลของคุณแล้วสร้างขึ้นใหม่ในพื้นที่ทํางานเดียวกัน จากนั้นเนื่องจากเราไม่ได้ลบข้อมูลจาก ADLS Gen 2 ให้ไปที่ทรัพยากรเองและล้างข้อมูล ซึ่งจะเกี่ยวข้องกับขั้นตอนต่อไปนี้
ส่งออกสําเนาของกระแสข้อมูลจาก Power BI หรือคัดลอกไฟล์ model.json ไฟล์ model.json ถูกเก็บไว้ใน ADLS
ลบกระแสข้อมูล
แยก ADLS
การสร้างกระแสข้อมูลโดยใช้การนําเข้าใหม่ โปรดทราบว่าข้อมูลการรีเฟรชแบบเพิ่มหน่วย (ถ้ามี) จะต้องถูกลบก่อนที่จะนําเข้า ซึ่งสามารถทําได้โดยการลบพาร์ติชันที่เกี่ยวข้องในไฟล์ model.json
กําหนดค่านโยบายการรีเฟรช/สร้างนโยบายการรีเฟรชแบบเพิ่มหน่วย
การเชื่อมต่อกับข้อมูลโดยใช้ตัวเชื่อมต่อ ADLS Gen 2
ขอบเขตของเอกสารนี้อธิบายการเชื่อมต่อกระแสข้อมูล ADLS Gen 2 และไม่ใช่ตัวเชื่อมต่อ Power BI ADLS Gen 2 การทํางานกับตัวเชื่อมต่อ ADLS Gen 2 คือสถานการณ์ที่แยกกันและอาจเพิ่มได้ ตัวเชื่อมต่อ ADLS เพียงแค่ใช้ ADLS เป็นแหล่งข้อมูล ซึ่งหมายความว่าการใช้ PQO เพื่อคิวรีกับข้อมูลนั้นไม่จําเป็นต้องอยู่ในรูปแบบ CDM ซึ่งสามารถเป็นรูปแบบข้อมูลใดก็ตามที่ลูกค้าต้องการ เรียนรู้เพิ่มเติมเกี่ยวกับสถานการณ์นี้ โดยการเยี่ยมชมวิเคราะห์ข้อมูลใน Azure Data Lake Storage รุ่น2 โดยใช้ Power BI
ขั้นตอนถัดไป
บทความต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับกระแสข้อมูลและ Power BI: