การกำหนดค่าที่จัดเก็บกระแสข้อมูลเพื่อใช้ Azure Data Lake Gen 2

ข้อมูลที่ใช้กับ Power BI จะถูกเก็บไว้ในที่เก็บข้อมูลภายในโดย Power BI ตามค่าเริ่มต้น ด้วยการรวมกันของกระแสข้อมูลและ Azure Data Lake Storage Gen 2 (ADLS Gen2) คุณสามารถจัดเก็บกระแสข้อมูลของคุณในบัญชี Azure Data Lake Storage Gen2 ภายในองค์กรของคุณได้ โดยหลัก ๆ แล้วสิ่งนี้จะช่วยให้คุณสามารถ "การจัดเก็บข้อมูลของคุณเอง" ไปยังกระแสข้อมูล Power BI และสร้างการเชื่อมต่อที่ระดับผู้เช่าหรือระดับพื้นที่งาน

เหตุผลในการใช้พื้นที่ใช้งาน ADLS Gen 2 หรือการเชื่อมต่อผู้เช่า

หลังจากที่คุณแนบกระแสข้อมูลของคุณแล้ว Power BI จะกําหนดค่าและบันทึกการอ้างอิงเพื่อให้คุณสามารถอ่านและเขียนข้อมูลลงใน ADLS Gen 2 ของคุณเองได้ Power BI จัดเก็บข้อมูลในรูปแบบ CDM ซึ่งจับเมตาดาต้าเกี่ยวกับข้อมูลของคุณนอกเหนือจากข้อมูลจริงที่สร้างขึ้นโดยกระแสข้อมูลเอง ซึ่งปลดล็อกความสามารถที่มีประสิทธิภาพมากมายและเปิดใช้งานข้อมูลของคุณและเมตาดาต้าที่เกี่ยวข้องในรูปแบบ CDM เพื่อความสามารถในการขยาย ระบบอัตโนมัติ การตรวจสอบ และสถานการณ์สํารอง โดยการใช้ข้อมูลนี้พร้อมใช้งาน และเข้าถึงได้อย่างกว้างขวางในสภาพแวดล้อมของคุณเอง จะช่วยให้คุณสามารถลดรูปข้อมูลเชิงลึกและข้อมูลที่สร้างขึ้นภายในองค์กร นอกจากนี้ยังปลดล็อกความสามารถให้คุณสร้างโซลูชันเพิ่มเติมที่ CDM ทราบ (เช่น แอปพลิเคชันแบบปรับแต่งเองและโซลูชันใน Power Platform, Azure และโซลูชันที่พร้อมใช้งานผ่านคู่ค้าและระบบนิเวศ ISV) หรือสามารถอ่าน CSV ได้ วิศวกรข้อมูลของคุณ นักวิทยาศาสตร์ข้อมูล และนักวิเคราะห์ของคุณสามารถใช้งาน ใช้งาน และใช้ข้อมูลชุดทั่วไปที่รวบรวมข้อมูลที่มีใน ADLS Gen 2 ได้แล้ว

มีวิธีการกําหนดค่าที่เก็บ ADLS Gen 2 ที่จะใช้สองวิธี: คุณสามารถใช้บัญชี ADLS Gen 2 ที่กําหนดให้ผู้เช่า หรือคุณสามารถรวมที่เก็บ ADLS Gen 2 ของคุณเองในระดับพื้นที่งาน

สิ่งที่จำเป็นต้องมี

  • หากต้องการใช้บัญชี ADLS Gen 2 ของคุณเองคุณต้องมีสิทธิ์ระดับเจ้าของในเลเยอร์บัญชีที่เก็บข้อมูล สิทธิ์ที่กลุ่มทรัพยากรหรือระดับการสมัครใช้งาน จะไม่ ใช้งาน หากคุณเป็นผู้ดูแลระบบ คุณยังต้องกำหนดสิทธิ์เจ้าของด้วยตัวคุณเอง ในขณะนี้ไม่ADLS รุ่น2บัญชีเก็บข้อมูลหลัง ไฟร์วอลล์

  • คุณต้องสร้างบัญชีที่เก็บข้อมูลด้วยการเปิดใช้งานเนมสเปซแบบลำดับชั้น (HNS)

  • ต้องสร้างบัญชีเก็บข้อมูลในที่Azure Active Directoryเดียวกันกับผู้เช่า Power BI

  • ต้องใช้ TLS (Transport Layer Security) เวอร์ชัน 1.2 (หรือสูงกว่า) เพื่อรักษาความปลอดภัยจุดสิ้นสุดของคุณ เว็บเบราว์เซอร์และแอปพลิเคชันไคลเอ็นต์อื่น ๆ ที่ใช้ TLS เวอร์ชันก่อนหน้า TLS 1.2 จะไม่สามารถเชื่อมต่อได้

  • ไม่สนับสนุนการแนบกระแสข้อมูลด้วย ADLS Gen 2 ที่อยู่เบื้องหลังการรับรองความถูกต้องแบบหลายปัจจัย (MFA)

  • สุดท้ายคุณสามารถเชื่อมต่อกับ ADLS Gen 2 จากพอร์ทัลผู้ดูแลระบบ แต่ถ้าคุณเชื่อมต่อโดยตรงกับพื้นที่งาน ก่อนอื่นคุณต้องตรวจสอบให้แน่ใจว่าไม่มีกระแสข้อมูลในพื้นที่งานก่อนที่จะเชื่อมต่อ

ตารางต่อไปนี้อธิบายถึงสิทธิ์ของ ADLS และ Power BI ที่ต้องมีใน ADLS Gen 2 และ Power BI:

การดำเนินการ สิทธิ์ ADLS สิทธิ์ขั้นต่สุดของ Power BI
เชื่อมต่อ ADLS Gen 2 กับผู้เช่า Power BI เจ้าของ ผู้ดูแลระบบ Power BI
เชื่อมต่อ ADLS Gen 2 เป็นพื้นที่งาน เจ้าของ ผู้ดูแลระบบพื้นที่งาน
สร้างกระแสข้อมูล Power BI ที่เขียนกลับไปยังบัญชี ADLS ที่เชื่อมต่ออยู่ ไม่สามารถใช้งานได้ ผู้สนับสนุนพื้นที่ทำงาน
ใช้กระแสข้อมูล Power BI ไม่สามารถใช้งานได้ ผู้ชมพื้นที่ทำงาน

การเชื่อมต่อกับ Azure Data Lake Gen 2 ในระดับพื้นที่ใช้งาน

นำทางไปยังพื้นที่ทำงานที่ไม่มีกระแสข้อมูล เลือก การตั้งค่าพื้นที่ งาน เลือกแท็บ การเชื่อมต่อ Azure จากนั้นเลือกส่วน ที่จัดเก็บ

เชื่อมต่อไปยัง Azure

ตัวเลือก ใช้การเชื่อมต่อ Azure ค่าเริ่มต้น จะปรากฏให้เห็นหากผู้ดูแลระบบได้กําหนดค่าบัญชี ADLS Gen 2 ที่กําหนดให้ผู้เช่าแล้ว คุณมีสองตัวเลือก:

  • ใช้บัญชี ADLS Gen 2 ที่กําหนดค่าผู้เช่า โดยการเลือก กล่องที่เรียกว่า ใช้การเชื่อมต่อ Azure ค่าเริ่มต้น หรือ
  • เลือก เชื่อมต่อ ไปยัง Azure เพื่อชี้ไปยังบัญชีที่เก็บข้อมูล Azure ใหม่

เมื่อคุณเลือก เชื่อมต่อ ไปที่ Azure แล้ว Power BI จะดึงรายการการสมัครใช้งาน Azure ที่คุณสามารถเข้าถึงได้ กรอกข้อมูลในดรอปดาวน์และเลือกการสมัครใช้งาน Azure กลุ่มทรัพยากร และบัญชีหน่วยเก็บข้อมูลที่ถูกต้องที่เปิดใช้งานตัวเลือกเนมสเปซแบบลADLS รุ่น2ซึ่งเป็นค่าADLS รุ่น2กลุ่ม

รายละเอียดการสมัครใช้งาน

เมื่อเลือกแล้ว ให้เลือก บันทึก และตอนนี้คุณได้เชื่อมต่อพื้นที่งานกับบัญชีบัญชีADLS รุ่น2เสร็จเรียบร้อยแล้ว Power BI จะกําหนดค่าบัญชีที่เก็บข้อมูลโดยอัตโนมัติด้วยสิทธิ์ที่กําหนดและตั้งค่าระบบไฟล์ Power BI ที่จะเขียนข้อมูล ณ จุดนี้ข้อมูลทั้งหมดของกระแสข้อมูลภายในพื้นที่ทำงานนี้จะเขียนลงในระบบไฟล์นี้โดยตรง ซึ่งสามารถใช้กับบริการ Azure อื่น ๆ ได้โดยสร้างแหล่งข้อมูลเดียวสำหรับข้อมูลองค์กรหรือแผนกทั้งหมดของคุณ

การเข้าใจการกําหนดค่า

การกําหนดค่าการเชื่อมต่อ Azure คือการตั้งค่าทางเลือกที่มีคุณสมบัติเพิ่มเติมที่สามารถเลือกตั้งค่าได้:

  • ที่เก็บข้อมูลระดับผู้เช่า ซึ่งช่วยให้คุณตั้งค่าเริ่มต้น และ/หรือ
  • พื้นที่เก็บข้อมูลระดับพื้นที่งาน ซึ่งคุณสามารถระบุการเชื่อมต่อต่อพื้นที่งานได้

นอกจากนี้ คุณยังสามารถกําหนดค่าที่เก็บข้อมูลระดับผู้เช่าได้หากคุณต้องการใช้เฉพาะที่จัดเก็บข้อมูลแบบรวมศูนย์เท่านั้น หรือต้องการให้เป็นค่าเริ่มต้น เราจะไม่เริ่มใช้ค่าเริ่มต้นโดยอัตโนมัติเพื่ออนุญาตให้มีความยืดหยุ่นในการกําหนดค่าของคุณ ดังนั้นจึงมีความยืดหยุ่นในการกําหนดค่าพื้นที่ใช้งานที่ใช้การเชื่อมต่อนี้ตามที่คุณเห็นว่าเหมาะสม ถ้าคุณกําหนดค่าบัญชี ADLS Gen 2 ที่กําหนดผู้เช่า คุณยังต้องกําหนดค่าแต่ละพื้นที่ใช้งานเพื่อใช้ตัวเลือกค่าเริ่มต้นนี้

นอกจากนี้ คุณยังสามารถกําหนดค่าสิทธิ์พื้นที่จัดเก็บระดับพื้นที่งานเป็นตัวเลือกแยกต่างหาก ซึ่งให้ความยืดหยุ่นที่สมบูรณ์ในการตั้งค่าบัญชี ADLS Gen 2 เฉพาะในพื้นที่งานแยกตามพื้นที่งาน

หากต้องการสรุป ถ้าอนุญาตพื้นที่จัดเก็บระดับผู้เช่าและพื้นที่จัดเก็บระดับพื้นที่งาน ผู้ดูแลระบบพื้นที่งานสามารถเลือกใช้การเชื่อมต่อ ADLS ค่าเริ่มต้น หรือเลือกที่จะกําหนดค่าบัญชีเก็บข้อมูลอื่นที่แยกต่างหากจากค่าเริ่มต้น ถ้าไม่ได้ตั้งค่าที่เก็บข้อมูลผู้เช่า ผู้ดูแลระบบพื้นที่งานสามารถกําหนดค่าบัญชี ADLS บนพื้นที่งานตามพื้นที่งาน สุดท้าย ถ้ามีการเลือกที่เก็บข้อมูลระดับผู้เช่าและพื้นที่จัดเก็บข้อมูลระดับพื้นที่ใช้งานไม่ได้รับอนุญาต ผู้ดูแลระบบพื้นที่งานสามารถกําหนดค่ากระแสข้อมูลของพวกเขาเพื่อใช้การเชื่อมต่อนี้

การเข้าใจโครงสร้างและรูปแบบของการเชื่อมต่อพื้นที่งาน ADLS Gen 2

ในบัญชีที่เก็บข้อมูล ADLS Gen 2 กระแสข้อมูลทั้งหมดจะถูกเก็บไว้ในคอนเทนเนอร์ powerbi ของระบบไฟล์

โครงสร้างของคอนเทนเนอร์ powerbi มีลักษณะดังนี้: <workspace name>/<dataflow name>/model.json <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots>

ที่ตั้งที่กระแสข้อมูลจัดเก็บข้อมูลในลPremiumโฟลเดอร์ของ ADLS Gen 2 จะถูกกําหนดโดยว่าพื้นที่งานอยู่ในความจุPremiumความจุหรือไม่ โครงสร้างไฟล์หลังจากการรีเฟรชของแต่ละชนิดความจุจะแสดงในตารางด้านล่าง

ความจุแบบพรีเมียม ความจุที่ใช้ร่วมกัน
<workspace name>/<dataflow name>/<table name>/<tablesnapshots> <workspace name>/<dataflow name>/<table name>/<tablesnapshots>

ด้านล่างนี้คือตัวอย่างที่ใช้ตาราง Orders ของตัวอย่าง Odata ของ Northwind

ตัวอย่าง Northwind ที่แสดงตาราง Orders

ในรูปด้านบน:

  • Model.json เป็นกระแสข้อมูลเวอร์ชันล่าสุด
  • Model.json.snapshots เป็นเวอร์ชันก่อนหน้าทั้งหมดของกระแสข้อมูล ซึ่งจะเป็นประโยชน์ถ้าคุณต้องการ mashup เวอร์ชันก่อนหน้า หรือการตั้งค่าแบบเพิ่มหน่วย
  • ข้อมูลtable.snapshots.csvคือข้อมูลที่คุณมาจากการรีเฟรช ซึ่งจะเป็นประโยชน์ในการรีเฟรชแบบเพิ่มหน่วย และยังเป็นประโยชน์ในการรีเฟรชที่แชร์ซึ่งผู้ใช้จะพบปัญหาการหมดเวลาการรีเฟรชเนื่องจากขนาดข้อมูล พวกเขาสามารถดูที่สแนปช็อตล่าสุดเพื่อดูว่าข้อมูลอยู่ในไฟล์ csv มากเท่าใด

เราเขียนไปยังบัญชีที่เก็บข้อมูลนี้เท่านั้น และไม่ลบข้อมูลในขณะนี้ ซึ่งหมายความว่าแม้แต่หลังจากแยกออก เราจะไม่ลบออกจากบัญชี ADLS ดังนั้นไฟล์ด้านบนทั้งหมดจะยังคงถูกจัดเก็บไว้

หมายเหตุ

ไฟล์ model.json สามารถอ้างอิงถึง model.json อื่นที่เป็นกระแสข้อมูลอีกตัวหนึ่งในพื้นที่งานเดียวกัน หรือในกระแสข้อมูลในพื้นที่งานอื่น ในครั้งเดียวที่ model.json จะอ้างอิงไปยังตารางtable.snapshot.csvการรีเฟรชแบบเพิ่มหน่วย

การขยายของการเชื่อมต่อพื้นที่งาน ADLS Gen 2

ถ้าคุณพยายามเชื่อมต่อ ADLS Gen 2 ไปยัง Power BI คุณสามารถคุณสามารถสิ่งนี้ได้ในพื้นที่งานหรือระดับผู้เช่า ตรวจสอบให้แน่ใจว่าคุณมีระดับการเข้าถึงที่ถูกต้อง เรียนรู้เพิ่มเติมใน สิ่งที่ ต้องการเบื้องต้น

โครงสร้างที่เก็บข้อมูลเป็นไปตามCommon Data Modelรูปแบบที่ถูกต้อง เรียนรู้เพิ่มเติมเกี่ยวกับโครงสร้างการจัดเก็บและ CDM โดยไปที่ โครงสร้างที่เก็บข้อมูลของกระแสข้อมูลวิเคราะห์ และCommon Data Model และAzure Data Lake Storage รุ่น2คืออะไร

เมื่อกําหนดค่าอย่างถูกต้อง ข้อมูลและเมตาดาต้าอยู่ในตัวควบคุมของคุณ แอปพลิเคชันจํานวนหนึ่งรับทราบ CDM และข้อมูลสามารถขยายได้โดยใช้ Azure, PowerApps และ PowerAutomate ตลอดจนระบบนิเวศของบุคคลที่สามโดยสอดคล้องกับรูปแบบ หรือโดยการอ่านข้อมูลดิบ

การแยก Azure Data Lake Gen 2 ออกจากพื้นที่ทำงานหรือผู้เช่า

หากต้องการลบการเชื่อมต่อในระดับพื้นที่ทำงาน ก่อนอื่นคุณต้องแน่ใจว่าคุณได้ลบกระแสข้อมูลทั้งหมดในพื้นที่ทำงานแล้ว เมื่อลบกระแสข้อมูลทั้งหมดแล้ว ให้เลือก ยกเลิกการเชื่อมต่อ ในการตั้งค่าพื้นที่ทำงาน เช่นเดียวกันกับผู้เช่า แต่ก่อนอื่นคุณต้องแน่ใจว่าคุณได้ยกเลิกการเชื่อมต่อพื้นที่ทำงานทั้งหมดจากบัญชีที่เก็บข้อมูลของผู้เช่าแล้ว ก่อนที่คุณจะสามารถยกเลิกการเชื่อมต่อในระดับผู้เช่าได้

การปิดใช้งาน Azure Data Lake Gen 2

ใน พอร์ทัลผู้ดูแลระบบ ภายใต้ กระแสข้อมูล คุณสามารถปิดใช้งานการเข้าถึงสำหรับผู้ใช้เพื่อใช้คุณลักษณะนี้และสามารถไม่อนุญาตให้ผู้ดูแลระบบพื้นที่ทำงานนำ Azure Storage ของตนเองมาใช้ได้

การเปลี่ยนกลับจาก Azure Data Lake Gen 2

เมื่อมีการกําหนดค่าที่จัดเก็บกระแสข้อมูลให้ใช้ Azure Data Lake Gen 2 แล้ว จะไม่มีวิธีย้อนกลับโดยอัตโนมัติ กระบวนการย้อนกลับไปยังที่เก็บข้อมูลที่จัดการโดย Power BI เป็นไปด้วยตนเอง

เพื่อแปลงกลับการโยกย้ายที่คุณสร้างขึ้นเป็น Gen 2 คุณจะต้องลบกระแสข้อมูลของคุณและสร้างใหม่ในพื้นที่งานเดียวกัน จากนั้นเนื่องจากเราไม่ลบข้อมูลจาก ADLS Gen 2 ให้ไปที่ทรัพยากรนั้นและล้างข้อมูล ซึ่งเกี่ยวข้องกับขั้นตอนต่อไปนี้

  1. ส่งออกสําเนาของกระแสข้อมูลจาก Power BI หรือคัดลอกไฟล์ model.json ไฟล์ model.json จะถูกจัดเก็บไว้ใน ADLS

  2. ลบกระแสข้อมูล

  3. แยก ADLS ออก

  4. สร้างกระแสข้อมูลใหม่โดยใช้การนําเข้า โปรดทราบว่าข้อมูลการรีเฟรชแบบเพิ่มหน่วย (ถ้ามี) จะต้องถูกลบก่อนที่จะนําเข้า ซึ่งสามารถจัดการได้โดยการลบพาร์ติชันที่เกี่ยวข้องในไฟล์ model.json

  5. กําหนดค่านโยบายการรีเฟรช/สร้างนโยบายการรีเฟรชแบบเพิ่มหน่วยใหม่

การเชื่อมต่อกับข้อมูลโดยใช้ตัวเชื่อมต่อ ADLS Gen 2

ขอบเขตของเอกสารนี้จะอธิบายการเชื่อมต่อกระแสข้อมูล ADLS Gen 2 และไม่ใช่ตัวเชื่อมต่อ Power BI ADLS Gen 2 การใช้งานได้กับตัวเชื่อมต่อ ADLS Gen 2 แยกต่างหาก และอาจเพิ่มสถานการณ์ได้ ตัวเชื่อมต่อ ADLS เพียงแค่ใช้ ADLS เป็นแหล่งข้อมูล ซึ่งหมายความว่าการใช้ PQO เพื่อคิวรีกับข้อมูลนั้นไม่ควรจะต้องอยู่ในรูปแบบ CDM จึงสามารถจัดรูปแบบข้อมูลที่ลูกค้าต้องการได้ เรียนรู้เพิ่มเติมเกี่ยวกับสถานการณ์สมมตินี้ โดยไปที่วิเคราะห์ข้อมูลAzure Data Lake Storage รุ่น2โดยใช้ Power BI

ขั้นตอนถัดไป

บทความต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับกระแสข้อมูลและ Power BI: