กําหนดค่าที่จัดเก็บกระแสข้อมูลเพื่อใช้ Azure Data Lake Gen 2

ข้อมูลที่ใช้กับ Power BI จะถูกเก็บไว้ในที่เก็บข้อมูลภายในโดย Power BI ตามค่าเริ่มต้น ด้วยการรวมกันของกระแสข้อมูลและ Azure Data Lake Storage Gen 2 (ADLS Gen2) คุณสามารถจัดเก็บกระแสข้อมูลของคุณในบัญชี Azure Data Lake Storage รุ่น2 ขององค์กรได้ คุณลักษณะนี้จะช่วยให้คุณสามารถ "นําที่เก็บข้อมูลของคุณเอง" ไปยังกระแสข้อมูล Power BI และสร้างการเชื่อมต่อที่ระดับผู้เช่าหรือพื้นที่ทํางาน

เหตุผลในการใช้พื้นที่ทํางาน ADLS Gen 2 หรือการเชื่อมต่อผู้เช่า

หลังจากที่คุณแนบกระแสข้อมูลของคุณแล้ว Power BI จะกําหนดค่าและบันทึกการอ้างอิงเพื่อให้คุณสามารถอ่านและเขียนข้อมูลไปยัง ADLS Gen 2 ของคุณเองได้ Power BI จัดเก็บข้อมูลในรูปแบบ Common Data Model (CDM) ซึ่งจะจับเมตาดาต้าเกี่ยวกับข้อมูลของคุณนอกเหนือจากข้อมูลจริงที่สร้างขึ้นโดยกระแสข้อมูลเอง คุณลักษณะนี้ปลดล็อกความสามารถที่มีประสิทธิภาพมากมายและเปิดใช้งานข้อมูลของคุณและเมตาดาต้าที่เกี่ยวข้องในรูปแบบ CDM เพื่อรองรับความสามารถในการขยาย การทํางานอัตโนมัติ การตรวจสอบ และการสํารองข้อมูล เมื่อคุณทําให้ข้อมูลนี้พร้อมใช้งานและสามารถเข้าถึงได้อย่างกว้างขวางในสภาพแวดล้อมของคุณเอง จะช่วยให้คุณสามารถลดระดับข้อมูลเชิงลึกและข้อมูลที่สร้างขึ้นภายในองค์กรของคุณ นอกจากนี้ยังปลดล็อกความสามารถสําหรับคุณในการสร้างโซลูชันเพิ่มเติมด้วยความซับซ้อนที่หลากหลาย โซลูชันของคุณสามารถเป็นแอปพลิเคชันและโซลูชันแบบกําหนดเองตาม CDM ใน Power Platform, Azure และโซลูชันที่พร้อมใช้งานผ่านระบบคู่ค้าและผู้จําหน่ายซอฟต์แวร์อิสระ (ISV) หรือคุณสามารถสร้างแอปพลิเคชันเพื่ออ่าน CSV ขณะนี้วิศวกรข้อมูล นักวิทยาศาสตร์ข้อมูล และนักวิเคราะห์ของคุณสามารถทํางานกับ ใช้ และนําชุดข้อมูลทั่วไปที่รวบรวมไว้ใน ADLS Gen 2 กลับมาใช้ใหม่ได้

มีวิธีการกําหนดค่าที่เก็บ ADLS Gen 2 ที่จะใช้สองวิธี: คุณสามารถใช้บัญชี ADLS Gen 2 ที่กําหนดให้ผู้เช่า หรือคุณสามารถนําที่เก็บ ADLS Gen 2 ของคุณเองมาใช้ในระดับพื้นที่ทํางาน

ข้อกำหนดเบื้องต้น

  • หากต้องการนําบัญชี ADLS Gen 2 ของคุณเองมาใช้ คุณต้องมีสิทธิ์ ระดับเจ้าของ ในเลเยอร์บัญชีเก็บข้อมูล สิทธิ์ในระดับกลุ่มทรัพยากรหรือการสมัครใช้งานจะไม่ทํางาน ถ้าคุณเป็นผู้ดูแลระบบ คุณยังต้องกําหนดสิทธิ์เจ้าของด้วยตัวคุณเอง ในขณะนี้ยังไม่รองรับบัญชีที่เก็บข้อมูล ADLS Gen2 ที่อยู่เบื้องหลังไฟร์วอลล์

  • ต้องสร้างบัญชีเก็บข้อมูลด้วยการเปิดใช้งานเนมสเปซแบบลําดับชั้น (HNS)

  • ต้องสร้างบัญชีเก็บข้อมูลในผู้เช่า Microsoft Entra เดียวกันกับผู้ เช่า Power BI

  • ผู้ใช้ต้องมีบทบาทเจ้าของ Blob Data Storage บทบาทตัวอ่านข้อมูล Blob ของที่เก็บข้อมูล และบทบาทเจ้าของที่ระดับบัญชีเก็บข้อมูล (ขอบเขตควรเป็น ทรัพยากร นี้และไม่ได้รับการสืบทอด) การเปลี่ยนแปลงบทบาทที่ใช้อาจใช้เวลาสักครู่ในการซิงค์ และต้องซิงค์ก่อนที่ขั้นตอนต่อไปนี้จะสามารถดําเนินการในบริการของ Power BI

  • ภูมิภาคผู้เช่าพื้นที่ทํางาน Power BI ควรเหมือนกับภูมิภาคบัญชีเก็บข้อมูล

  • ต้องใช้ TLS (Transport Layer Security) เวอร์ชัน 1.2 (หรือสูงกว่า) เพื่อรักษาความปลอดภัยจุดสิ้นสุดของคุณ เว็บเบราว์เซอร์และแอปพลิเคชันไคลเอ็นต์อื่นๆ ที่ใช้ TLS เวอร์ชันก่อนหน้า TLS 1.2 จะไม่สามารถเชื่อมต่อได้

  • การแนบกระแสข้อมูลด้วย ADLS Gen 2 ที่อยู่เบื้องหลังการรับรองความถูกต้องแบบหลายปัจจัย (MFA) ไม่ได้รับการสนับสนุน

  • สุดท้าย คุณสามารถเชื่อมต่อกับ ADLS Gen 2 ใดก็ได้จากพอร์ทัลผู้ดูแลระบบ แต่ถ้าคุณเชื่อมต่อโดยตรงกับพื้นที่ทํางาน ก่อนอื่นคุณต้องตรวจสอบให้แน่ใจว่าไม่มีกระแสข้อมูลในพื้นที่ทํางานก่อนที่จะเชื่อมต่อ

หมายเหตุ

นําพื้นที่เก็บข้อมูลของคุณเอง (Azure Data Lake Gen 2) มาใช้ไม่ได้ในบริการของ Power BI สําหรับลูกค้า GCC ของรัฐบาลสหรัฐอเมริกา สําหรับข้อมูลเพิ่มเติมเกี่ยวกับฟีเจอร์ที่พร้อมใช้งาน และไม่สามารถใช้งานได้ โปรดดู ความพร้อมใช้งานของคุณลักษณะ Power BI สําหรับลูกค้าส่วนราชการสหรัฐอเมริกา

ตารางต่อไปนี้อธิบายถึงสิทธิ์สําหรับ ADLS และสําหรับ Power BI ที่จําเป็นสําหรับ ADLS Gen 2 และ Power BI:

การดำเนินการ สิทธิ์ ADLS สิทธิ์ขั้นต่ําของ Power BI
เชื่อมต่อ ADLS Gen 2 ไปยังผู้เช่า Power BI เจ้าของ ผู้ดูแลระบบ Power BI
เชื่อมต่อ ADLS Gen 2 ไปยังพื้นที่ทํางาน เจ้าของ ผู้ดูแลระบบพื้นที่ทํางาน
สร้างกระแสข้อมูล Power BI โดยเขียนกลับไปยังบัญชี ADLS ที่เชื่อมต่อกัน ไม่สามารถใช้งานได้ ผู้สนับสนุนพื้นที่ทํางาน
ใช้กระแสข้อมูล Power BI ไม่สามารถใช้งานได้ ผู้ชมพื้นที่ทํางาน

เชื่อมต่อไปยัง Azure Data Lake Gen 2 ในระดับพื้นที่ทํางาน

นําทางไปยังพื้นที่ทํางานที่ไม่มีกระแสข้อมูล เลือก การตั้งค่าพื้นที่ทํางาน เลือกแท็บ เชื่อมต่อ ions ของ Azure จากนั้นเลือกส่วน ที่เก็บข้อมูล

Screenshot of the Workspace settings pane on the Azure connections tab.

ตัวเลือก ใช้การเชื่อมต่อ Azure ค่าเริ่มต้น จะปรากฏให้เห็นหากผู้ดูแลระบบได้กําหนดค่าบัญชี ADLS Gen 2 ที่กําหนดผู้เช่าแล้ว คุณมีสองตัวเลือก คือ

  • ใช้บัญชี ADLS Gen 2 ที่กําหนดค่าโดยการเลือกช่องที่เรียกว่า ใช้การเชื่อมต่อ Azure ค่าเริ่มต้น หรือ
  • เลือกเชื่อมต่อไปยัง Azure เพื่อชี้ไปยังบัญชีที่เก็บข้อมูล Azure ใหม่

เมื่อคุณเลือกเชื่อมต่อไปยัง Azure Power BI จะดึงรายการการสมัครใช้งาน Azure ที่คุณสามารถเข้าถึงได้ กรอกข้อมูลในรายการดรอปดาวน์ จากนั้นเลือกการสมัครใช้งาน Azure กลุ่มทรัพยากร และบัญชีเก็บข้อมูลที่ถูกต้องที่เปิดใช้งานตัวเลือกเนมสเปซแบบลําดับชั้นซึ่งเป็นค่าสถานะ ADLS Gen2 บัญชีส่วนบุคคลที่ใช้ในการเชื่อมต่อกับ Azure จะถูกใช้เพียงครั้งเดียวเพื่อตั้งค่าการเชื่อมต่อเริ่มต้นและให้สิทธิ์บัญชีบริการของ Power BI ในการอ่านและเขียนข้อมูลหลังจากนั้นบัญชีผู้ใช้เดิมไม่จําเป็นต้องใช้การเชื่อมต่ออีกต่อไป

Screenshot of the Settings window after choosing Connecting to Azure.

หลังจากที่คุณเลือกรายการที่คุณเลือกแล้ว ให้เลือก บันทึก และตอนนี้คุณได้เชื่อมต่อพื้นที่ทํางานกับบัญชี ADLS Gen2 ของคุณเองเรียบร้อยแล้ว Power BI กําหนดค่าบัญชีที่เก็บข้อมูลโดยอัตโนมัติด้วยสิทธิ์ที่จําเป็นและตั้งค่าระบบไฟล์ Power BI ที่จะเขียนข้อมูล ณ จุดนี้ข้อมูลของกระแสข้อมูลทั้งหมดภายในพื้นที่ทํางานนี้จะเขียนลงในระบบไฟล์นี้โดยตรงซึ่งสามารถใช้กับบริการอื่น ๆ ของ Azure ได้ ในตอนนี้คุณมีแหล่งข้อมูลเดียวสําหรับข้อมูลองค์กรหรือแผนกทั้งหมดของคุณ

การกําหนดค่าการเชื่อมต่อ Azure

การกําหนดค่าการเชื่อมต่อ Azure เป็นการตั้งค่าตัวเลือกที่มีคุณสมบัติเพิ่มเติมที่สามารถเลือกตั้งค่าได้:

  • ที่เก็บข้อมูลระดับผู้เช่า ซึ่งช่วยให้คุณตั้งค่าเริ่มต้น และ/หรือ
  • ที่เก็บข้อมูลระดับพื้นที่ทํางาน ซึ่งช่วยให้คุณระบุการเชื่อมต่อต่อพื้นที่ทํางาน

คุณสามารถเลือกที่จะกําหนดค่าที่เก็บข้อมูลระดับผู้เช่าถ้าคุณต้องการใช้ที่จัดเก็บข้อมูลแบบรวมศูนย์เท่านั้น หรือต้องการให้พื้นที่เก็บข้อมูลนี้เป็นตัวเลือกเริ่มต้น เราจะไม่เริ่มต้นโดยอัตโนมัติโดยใช้ค่าเริ่มต้นเพื่อให้มีความยืดหยุ่นในการกําหนดค่าของคุณ เพื่อให้คุณมีความยืดหยุ่นในการกําหนดค่าพื้นที่ทํางานที่ใช้การเชื่อมต่อนี้ตามที่คุณเห็นว่าเหมาะสม ถ้าคุณกําหนดค่าบัญชี ADLS Gen 2 ที่กําหนดโดยผู้เช่า คุณยังต้องกําหนดค่าแต่ละพื้นที่ทํางานเพื่อใช้ตัวเลือกค่าเริ่มต้นนี้

นอกจากนี้ คุณยังสามารถกําหนดค่าสิทธิ์การจัดเก็บข้อมูลระดับพื้นที่ทํางานเป็นตัวเลือกแยกต่างหาก ซึ่งให้ความยืดหยุ่นที่สมบูรณ์ในการตั้งค่าบัญชี ADLS Gen 2 เฉพาะบนพื้นที่ทํางานตามพื้นที่ทํางาน

ในการสรุป ถ้ามีการอนุญาตที่เก็บข้อมูลระดับผู้เช่าและพื้นที่เก็บข้อมูลระดับพื้นที่ทํางาน ผู้ดูแลพื้นที่ทํางานสามารถเลือกใช้การเชื่อมต่อ ADLS ค่าเริ่มต้น หรือเลือกกําหนดค่าบัญชีที่เก็บข้อมูลอื่นแยกต่างหากจากค่าเริ่มต้น ถ้าไม่ได้ตั้งค่าที่เก็บข้อมูลผู้เช่า ผู้ดูแลระบบพื้นที่ทํางานสามารถเลือกที่จะกําหนดค่าบัญชี ADLS บนพื้นที่ทํางานได้ตามพื้นที่ทํางาน สุดท้าย ถ้าเลือกที่เก็บข้อมูลระดับผู้เช่าและไม่อนุญาตให้มีที่เก็บข้อมูลระดับพื้นที่ทํางาน ผู้ดูแลระบบพื้นที่ทํางานสามารถเลือกที่จะกําหนดค่ากระแสข้อมูลเพื่อใช้การเชื่อมต่อนี้ได้

โครงสร้างและรูปแบบสําหรับการเชื่อมต่อพื้นที่ทํางาน ADLS Gen 2

ในบัญชีที่เก็บข้อมูล ADLS Gen 2 กระแสข้อมูลทั้งหมดจะถูกเก็บไว้ใน คอนเทนเนอร์ powerbi ของระบบไฟล์

โครงสร้างของ powerbi container มีลักษณะดังนี้: <workspace name>/<dataflow name>/model.jsonและ <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots><workspace name>/<dataflow name>/<table name>/<tablesnapshots>

ตําแหน่งที่กระแสข้อมูลจัดเก็บข้อมูลในลําดับชั้นโฟลเดอร์สําหรับ ADLS Gen 2 จะเหมือนกันว่าพื้นที่ทํางานอยู่ในความจุที่ใช้ร่วมกันหรือความจุพรีเมียม

ตัวอย่างต่อไปนี้ใช้ตาราง Orders ของตัวอย่าง Northwind Odata

Screenshot of the file explorer showing an example using the Orders table of the Northwind Odata sample.

ในรูปก่อนหน้า:

  • model.json เป็นกระแสข้อมูลเวอร์ชันล่าสุด
  • model.json.snapshots เป็นกระแสข้อมูลเวอร์ชันก่อนหน้าทั้งหมด ประวัตินี้มีประโยชน์ถ้าคุณต้องการ Mashup เวอร์ชันก่อนหน้า หรือการตั้งค่าแบบเพิ่มหน่วย
  • ชื่อตารางคือโฟลเดอร์ที่มีข้อมูลผลลัพธ์หลังจากรีเฟรชกระแสข้อมูลเสร็จสิ้น

เราเขียนไปยังบัญชีที่เก็บข้อมูลนี้เท่านั้น และไม่ได้ลบข้อมูลในขณะนี้ ดังนั้นแม้หลังจากที่แยกออกแล้ว เราไม่ลบออกจากบัญชี ADLS ดังนั้นไฟล์ทั้งหมดที่ระบุไว้ในรายการก่อนหน้าจะยังคงถูกจัดเก็บไว้

หมายเหตุ

กระแสข้อมูลอนุญาตให้เชื่อมโยงหรืออ้างอิงตารางในกระแสข้อมูลอื่น ๆ ในกระแสข้อมูลดังกล่าว ไฟล์ model.json สามารถอ้างอิงไปยัง model.json อื่นของกระแสข้อมูลอื่นในพื้นที่ทํางานเดียวกันหรืออื่น ๆ

การย้ายไฟล์ระหว่าง/ภายในบัญชีที่เก็บข้อมูล ADLS Gen 2

เมื่อคุณย้ายกระแสข้อมูลจากบัญชีที่เก็บข้อมูล ADLS Gen2 หนึ่งไปยังอีกบัญชีหนึ่ง คุณจําเป็นต้องตรวจสอบให้แน่ใจว่าเส้นทางใน ไฟล์ model.json ได้รับการอัปเดตเพื่อแสดงตําแหน่งใหม่ ทั้งนี้เนื่องจาก ไฟล์ model.json มีเส้นทางไปยังกระแสข้อมูลและเส้นทางไปยังข้อมูล หากคุณไม่อัปเดตเส้นทาง กระแสข้อมูลจะไม่สามารถค้นหาข้อมูลและทําให้เกิดข้อผิดพลาดในสิทธิ์ได้ หากต้องการอัปเดตเส้นทาง คุณสามารถใช้ขั้นตอนต่อไปนี้:

  • เปิดไฟล์ model.json ในตัวแก้ไขข้อความ
  • ค้นหา URL บัญชีเก็บข้อมูลและแทนที่ด้วย URL บัญชีเก็บข้อมูลใหม่
  • บันทึกไฟล์
  • เขียนทับไฟล์ model.json ที่มีอยู่ในบัญชีที่เก็บข้อมูล ADLS Gen2

ความสามารถในการเพิ่มสําหรับการเชื่อมต่อพื้นที่ทํางาน ADLS Gen 2

หากคุณกําลังเชื่อมต่อ ADLS Gen 2 กับ Power BI คุณสามารถดําเนินการนี้ได้ที่ระดับพื้นที่ทํางานหรือผู้เช่า ตรวจสอบให้แน่ใจว่า คุณมีระดับการเข้าถึงที่ถูกต้อง เรียนรู้เพิ่มเติมใน ข้อกําหนดเบื้องต้น

โครงสร้างที่เก็บข้อมูลจะเป็นไปตามรูปแบบ Common Data Model เรียนรู้เพิ่มเติมเกี่ยวกับโครงสร้างที่เก็บข้อมูลและ CDM โดยไปที่โครงสร้างที่เก็บข้อมูลสําหรับกระแสข้อมูลวิเคราะห์คืออะไร และใช้ Common Data Model เพื่อปรับ Azure Data Lake Storage รุ่น2 ให้เหมาะสม

หลังจากกําหนดค่าอย่างถูกต้องแล้ว ข้อมูลและเมตาดาต้าจะอยู่ในตัวควบคุมของคุณ แอปพลิเคชันจํานวนมากตระหนักถึง CDM และข้อมูลสามารถขยายได้โดยใช้ Azure, PowerApps และ PowerAutomate นอกจากนี้คุณยังสามารถใช้ระบบนิเวศของบุคคลที่สามโดยสอดคล้องกับรูปแบบหรือโดยการอ่านข้อมูลดิบ

แยก Azure Data Lake Gen 2 ออกจากพื้นที่ทํางานหรือผู้เช่า

หากต้องการลบการเชื่อมต่อในระดับพื้นที่ทํางาน ก่อนอื่นคุณต้องแน่ใจว่ามีการลบกระแสข้อมูลทั้งหมดในพื้นที่ทํางานแล้ว หลังจากลบกระแสข้อมูลทั้งหมดแล้ว ให้เลือก ยกเลิกการเชื่อมต่อ ในการตั้งค่าพื้นที่ทํางาน เช่นเดียวกันกับผู้เช่า แต่ก่อนอื่นคุณต้องแน่ใจว่าคุณได้ยกเลิกการเชื่อมต่อพื้นที่ทํางานทั้งหมดจากบัญชีที่เก็บข้อมูลผู้เช่าแล้ว ก่อนที่คุณจะสามารถยกเลิกการเชื่อมต่อในระดับผู้เช่าได้

ปิดใช้งาน Azure Data Lake Gen 2

ใน พอร์ทัลผู้ดูแลระบบ ภายใต้ กระแสข้อมูล คุณสามารถปิดใช้งานการเข้าถึงสําหรับผู้ใช้เพื่อใช้คุณลักษณะนี้ และสามารถไม่อนุญาตให้ผู้ดูแลระบบพื้นที่ทํางานนํา Azure Storage ของตนเองมาใช้ได้

แปลงกลับจาก Azure Data Lake Gen 2

หลังจากที่มีการกําหนดค่าที่เก็บกระแสข้อมูลให้ใช้ Azure Data Lake Gen 2 จะไม่สามารถแปลงกลับได้โดยอัตโนมัติ กระบวนการในการกลับไปยังที่เก็บข้อมูลที่มีการจัดการของ Power BI นั้นทําด้วยตัวเอง

เพื่อแปลงกลับการโยกย้ายที่คุณดําเนินการกับ Gen 2 คุณต้องลบกระแสข้อมูลของคุณแล้วสร้างใหม่ในพื้นที่ทํางานเดียวกัน จากนั้นเนื่องจากเราไม่ได้ลบข้อมูลจาก ADLS Gen 2 ไปที่ทรัพยากรเองและล้างข้อมูล การดําเนินการนี้จะเกี่ยวข้องกับขั้นตอนต่อไปนี้

  1. ส่งออกสําเนาของกระแสข้อมูลจาก Power BI หรือคัดลอกไฟล์ model.json ไฟล์ model.json ถูกเก็บไว้ใน ADLS

  2. ลบกระแสข้อมูล

  3. แยก ADLS ออก

  4. สร้างกระแสข้อมูลใหม่โดยใช้การนําเข้า จะต้องลบข้อมูลการรีเฟรชแบบเพิ่มหน่วย (ถ้ามี) ก่อนที่จะนําเข้า การดําเนินการนี้สามารถทําได้โดยการลบพาร์ติชันที่เกี่ยวข้องในไฟล์ model.json

  5. กําหนดค่านโยบายการรีเฟรช/สร้างใหม่แบบเพิ่มหน่วย

เชื่อมต่อไปยังข้อมูลโดยใช้ตัวเชื่อมต่อ ADLS Gen 2

ขอบเขตของเอกสารนี้อธิบายการเชื่อมต่อกระแสข้อมูล ADLS Gen 2 และไม่ใช่ตัวเชื่อมต่อ Power BI ADLS Gen 2 การทํางานกับตัวเชื่อมต่อ ADLS Gen 2 เป็นสถานการณ์ที่แยกต่างหากอาจเพิ่มได้ ตัวเชื่อมต่อ ADLS เพียงแค่ใช้ ADLS เป็นแหล่งข้อมูล ดังนั้นการใช้ Power Query Online เพื่อคิวรีกับข้อมูลนั้นไม่จําเป็นต้องอยู่ในรูปแบบ CDM ซึ่งสามารถเป็นรูปแบบข้อมูลใดก็ตามที่ลูกค้าต้องการ สําหรับข้อมูลเพิ่มเติม ให้ดู Azure Data Lake Storage รุ่น2

บทความต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับกระแสข้อมูลและ Power BI: