AI กับกระแสข้อมูล
ในบทความนี้ เราจะพูดถึงวิธีการที่คุณสามารถใช้ปัญญาประดิษฐ์ (AI) กับกระแสข้อมูล เนื้อหาที่อธิบายไว้ในบทความนี้มีดังต่อไปนี้:
- บริการด้านความรู้ความเข้าใจ
- การเรียนรู้ของเครื่องอัตโนมัติ
- การบูรณาการของ Azure Machine Learning
Cognitive Services ใน Power BI
ด้วย Cognitive Services ใน Power BI คุณสามารถใช้อัลกอริทึมต่างๆ ได้จาก Azure Cognitive Services เพื่อเติมแต่งข้อมูลของคุณในการเตรียมข้อมูลด้วยตนเองสําหรับกระแสข้อมูล
บริการที่ได้รับการรองรับประจำวันนี้ ได้แก่ การวิเคราะห์ความคิดเห็นการแยกวลีหลักการตรวจหาภาษา และ การแท็กรูปภาพ การแปลงข้อมูลจะดำเนินการบนบริการของ Power BI และไม่จำเป็นต้องสมัครใช้งาน Azure Cognitive Services คุณลักษณะนี้ต้องใช้ Power BI Premium
เปิดการใช้งานคุณลักษณะ AI
Cognitive Services ได้รับการรองรับโดยโหนดความจุพรีเมียม EM2, A2 หรือ P1 และสูงกว่านั้น นอกจากนี้ Cognitive Services ยังมาพร้อมกับสิทธิ์การใช้งาน Premium Per User (PPU) อีกด้วย โดยจะใช้ปริมาณงาน AI ที่แยกต่างหากบนความจุเพื่อเรียกใช้ Cognitive Services ก่อนที่จะใช้ Cognitive Services ใน Power BI จำเป็นต้องเปิดการใช้งานปริมาณงาน AI ในการตั้งค่าความจุของพอร์ทัลผู้ดูแลระบบ คุณสามารถเปิดการใช้งานปริมาณงาน AI ในส่วนของปริมาณงาน และกำหนดจำนวนสูงสุดของหน่วยความจำที่คุณต้องการให้ปริมาณงานนี้ใช้ได้ ขีดจำกัดหน่วยความจำที่แนะนำคือ 20% หากเกินขีดจำกัดนี้จะทำให้คิวรีช้าลง

เริ่มต้นใช้งานด้วย Cognitive Services ใน Power BI
การแปลงข้อมูล Cognitive Services เป็นส่วนหนึ่งของ การเตรียมข้อมูลด้วยตนเองสำหรับกระแสข้อมูล เพื่อเติมแต่งข้อมูลของคุณด้วย Cognitive Services โปรดเริ่มต้น โดยแก้ไขกระแสข้อมูล

เลือกปุ่ม ข้อมูลเชิงลึก AI ใน Ribbon ด้านบนของตัวแก้ไข Power Query

ในหน้าต่างป็อปอัพ เลือกฟังก์ชันที่คุณต้องการใช้และข้อมูลที่ต้องการแปลง ในตัวอย่างนี้ ฉันกำลังให้คะแนนความคิดเห็นของคอลัมน์ที่มีข้อความรีวิว

Cultureinfo เป็นข้อมูลป้อนเข้าเพิ่มเติมเพื่อระบุภาษาของข้อความ คอลัมน์นี้ต้องการโค้ด ISO คุณสามารถใช้คอลัมน์เป็นข้อมูลป้อนเข้าสําหรับ Cultureinfo หรือคอลัมน์แบบคงที่ได้ ในตัวอย่างนี้ ภาษาที่ระบุสำหรับทั้งคอลัมน์คือภาษาอังกฤษ (en) หากคุณปล่อยให้คอลัมน์นี้ว่าง Power BI จะตรวจหาภาษาโดยอัตโนมัติก่อนที่จะใช้ฟังก์ชัน จากนั้นเลือก การเรียก

หลังจากการเรียกฟังก์ชัน ระบบจะเพิ่มผลลัพธ์เป็นคอลัมน์ใหม่ลงในตาราง และระบบจะเพิ่มการแปลงข้อมูลเป็นขั้นตอนที่นำไปใช้ในคิวรีด้วยเช่นกัน

หากฟังก์ชันส่งกลับคอลัมน์ผลลัพธ์หลายคอลัมน์ การเรียกฟังก์ชันจะเพิ่มคอลัมน์ใหม่ที่มีแถวของคอลัมน์ผลลัพธ์หลายรายการ
ขยายคอลัมน์เพื่อใช้ตัวเลือกในการเพิ่มอย่างน้อยหนึ่งค่าเป็นคอลัมน์ในข้อมูลของคุณ

ฟังก์ชันที่พร้อมใช้งาน
ส่วนนี้จะอธิบายฟังก์ชันที่พร้อมใช้งานใน Cognitive Services ใน Power BI
ตรวจหาภาษา
ฟังก์ชันตรวจหาภาษาจะประเมินข้อมูลป้อนเข้าที่เป็นข้อความ โดยแต่ละคอลัมน์จะส่งกลับชื่อภาษาและตัวระบุ ISO ฟังก์ชันนี้เป็นประโยชน์ต่อคอลัมน์ข้อมูลที่รวบรวมข้อความที่กำหนดเองซึ่งไม่ทราบภาษา ฟังก์ชันคาดหวังข้อมูลในรูปแบบข้อความเป็นข้อมูลป้อนเข้า
การวิเคราะห์ข้อความสามารถตรวจหาได้มากถึง 120 ภาษา โปรดดู ภาษาที่รองรับ สำหรับข้อมูลเพิ่มเติม
แยกวลีหลัก
ฟังก์ชัน การแยกวลีหลัก จะประเมินข้อความที่ไม่มีโครงสร้าง โดยแต่ละคอลัมน์ข้อความจะส่งกลับรายการของวลีหลัก ฟังก์ชันดังกล่าวจําเป็นต้องมีคอลัมน์ข้อความเป็นข้อมูลป้อนเข้า และยอมรับข้อมูลป้อนเข้าเพิ่มเติมสําหรับ Cultureinfo (โปรดดูส่วน เริ่มต้นใช้งาน ก่อนหน้าในบทความนี้)
การแยกวลีหลักเหมาะสำหรับก้อนข้อความที่ใหญ่กว่า ซึ่งตรงข้ามกับการวิเคราะห์ความคิดเห็นที่เหมาะสำหรับก้อนข้อความที่เล็กกว่า โปรดพิจารณาการปรับโครงสร้างของข้อมูลป้อนเข้าให้สอดคล้องเพื่อให้ได้ผลลัพธ์ที่ดีที่สุดจากการดำเนินการทั้งสองรูปแบบ
ให้คะแนนความคิดเห็น
ฟังก์ชัน ให้คะแนนความคิดเห็น จะประเมินข้อมูลป้อนเข้าที่เป็นข้อความและส่งกลับคะแนนความคิดเห็นสำหรับแต่ละเอกสาร โดยคะแนนจะไล่เรียงจาก 0 (ลบ) ถึง 1 (บวก) ฟังก์ชันนี้เป็นประโยชน์สำหรับการตรวจจับความคิดเห็นที่เป็นบวก และลบในสื่อสังคม รีวิวจากลูกค้า และฟอรั่มการอภิปราย
การวิเคราะห์ข้อความจะใช้อัลกอริทึมการจัดประเภทการเรียนรู้เกี่ยวกับเครื่องเพื่อสร้างคะแนนความคิดเห็นระหว่าง 0 และ 1 คะแนนที่ใกล้กับ 1 แสดงถึงความคิดเห็นบวก ส่วนคะแนนที่ใกล้กับ 0 แสดงถึงความคิดเห็นลบ แบบจำลองจะได้รับการฝึกฝนด้วยเนื้อหาที่เกี่ยวข้องกับความคิดเห็นอย่างครอบคลุมไว้ล่วงหน้า ในปัจจุบัน ยังไม่สามารถให้ข้อมูลการฝึกของคุณเองได้ แบบจำลองจะใช้เทคนิคการผสมผสานระหว่างการวิเคราะห์ข้อความ รวมการประมวลผลข้อความ การวิเคราะห์ชนิดของคำ การวางตำแหน่งคำ และกลุ่มคำที่เกี่ยวข้องกัน โปรดดู แนะนำการวิเคราะห์ข้อความ สำหรับข้อมูลเพิ่มเติมเกี่ยวกับอัลกอริทึม
การวิเคราะห์ความคิดเห็นจะดําเนินการบนคอลัมน์ที่ป้อนเข้าทั้งหมดซึ่งตรงข้ามกับการแยกความคิดเห็นสําหรับตารางเฉพาะในข้อความ ในทางปฏิบัติ จะมีแนวโน้มสำหรับการให้คะแนนความแม่นยำเพื่อปรับปรุงเมื่อเอกสารมีหนึ่งหรือสองประโยคมากกว่าเป็นก้อนข้อความขนาดใหญ่ ในระหว่างขั้นตอนการประเมินปรวิสัย แบบจําลองจะกําหนดว่าคอลัมน์ที่ป้อนเข้าโดยรวมเป็นวัตถุประสงค์หรือมีความคิดเห็น คอลัมน์อินพุตที่ส่วนใหญ่เป็นวัตถุประสงค์จะไม่ดําเนินการกับวลีการตรวจหาความคิดเห็น ส่งผลให้คะแนน .50 ไม่มีการประมวลผลต่อ สําหรับคอลัมน์อินพุตที่ดําเนินการต่อในไปป์ไลน์ ขั้นตอนถัดไปจะสร้างคะแนนที่สูงหรือต่ํากว่า .50 โดยขึ้นอยู่กับระดับระดับความคิดเห็นที่ตรวจพบในคอลัมน์อินพุต
ในปัจจุบัน การวิเคราะห์ความคิดเห็นรองรับภาษาอังกฤษ ภาษาเยอรมัน ภาษาสเปน และภาษาฝรั่งเศส ส่วนภาษาอื่นๆ ยังอยู่ในช่วงตัวอย่าง โปรดดู ภาษาที่รองรับ สำหรับข้อมูลเพิ่มเติม
แท็กรูปภาพ
ฟังก์ชัน แท็กรูปภาพ จะส่งกลับแท็กโดยยึดตามวัตถุ สิ่งมีชีวิต ทิวทัศน์ และการเคลื่อนไหวที่รู้จักมากกว่า 2,000 รายการ เมื่อแท็กไม่ชัดเจนหรือไม่ใช่ความรู้ทั่วไป ผลลัพธ์จะให้ 'ข้อมูล' เพื่ออธิบายความหมายของแท็กในบริบทของการตั้งค่าที่รู้จัก แท็กจะไม่ถูกจัดระเบียบเป็นการจัดหมวดหมู่ และจะไม่มีลำดับชั้นการสืบทอด คอลเลกชันของเนื้อหาแท็กจะสร้างพื้นฐานสำหรับ 'คำอธิบาย' รูปภาพที่แสดงเป็นภาษาที่อ่านได้ของมนุษย์ซึ่งมีรูปแบบเป็นประโยคสมบูรณ์
หลังจากอัปโหลดรูปภาพหรือระบุ URL รูปภาพแล้ว ผลลัพธ์อัลกอริทึมคอมพิวเตอร์วิทัศน์จะแท็กโดยยึดตามวัตถุ สิ่งมีชีวิต และการเคลื่อนไหวที่ระบุในรูปภาพ แท็กไม่จำกัดเฉพาะเรื่องหลักๆ เช่น บุคคลในพื้นหน้า เท่านั้นแต่ยังรวมถึง ฉาก (ในร่มหรือกลางแจ้ง) เครื่องเรือน เครื่องมือ พืช สัตว์ เครื่องประดับ เครื่องมือเบ็ดเตล็ด และอื่นๆ
ฟังก์ชันนี้จําเป็นต้องใช้ URL รูปภาพหรือคอลัมน์ abase-64 เป็นข้อมูลป้อนเข้า ในขณะนี้ การแท็กรูปภาพรองรับภาษาอังกฤษ ภาษาสเปน ภาษาญี่ปุ่น ภาษาโปรตุเกส และภาษาจีนแบบย่อ โปรดดู ภาษาที่รองรับ สำหรับข้อมูลเพิ่มเติม
การเรียนรู้ของเครื่องอัตโนมัติใน Power BI
การเรียนของเครื่องอัตโนมัติ (AutoML) สำหรับกระแสข้อมูลช่วยนักวิเคราะห์ทางธุรกิจในการสอน ตรวจสอบ และเรียกใช้แบบจำลอง Machine Learning (ML) โดยตรงใน Power BI ซึ่งรวมถึงประสบการณ์ง่ายๆ ในการสร้างรูปแบบ ML ใหม่ซึ่งนักวิเคราะห์สามารถใช้กระแสข้อมูลของพวกเขาเพื่อระบุข้อมูลป้อนเข้าสำหรับการฝึกแบบจำลอง บริการจะแยกคุณลักษณะที่เกี่ยวข้องมากที่สุดโดยอัตโนมัติ เลือกอัลกอริทึมและเพลงที่เหมาะสม รวมถึงตรวจสอบแบบจำลอง ML หลังจากที่แบบจำลองได้รับการสอนแล้ว Power BI จะสร้างรายงานประสิทธิภาพที่มีผลลัพธ์ของการตรวจสอบความถูกต้อง จากนั้นแบบจำลองจะถูกเรียกใช้ในข้อมูลใหม่หรืออัปเดตข้อมูลภายใน กระแสข้อมูล

การเรียนรู้เครื่องอัตโนมัติพร้อมใช้งานสำหรับกระแสข้อมูลที่โฮสต์บน Power BI Premium และความจุแบบฝังตัวเท่านั้น
การทำงานกับ AutoML
กระแสข้อมูลนำเสนอการเตรียมข้อมูลด้วยตนเองสำหรับข้อมูลขนาดใหญ่ AutoML จะถูกรวมเข้ากับกระแสข้อมูลและช่วยให้คุณสามารถใช้ประโยชน์จากความพยายามในการเตรียมข้อมูลสำหรับการสร้างแบบจำลองการเรียนรู้ของเครื่องได้โดยตรงภายใน Power BI
AutoML ใน Power BI ช่วยนักวิเคราะห์ข้อมูลเพื่อใช้กระแสข้อมูลในการสร้างโมเดลการเรียนรู้ของเครื่องด้วยประสบการณ์การใช้งานแบบง่ายด้วยทักษะ Power BI เท่านั้น วิทยาศาสตร์ข้อมูลส่วนใหญ่ที่อยู่เบื้องหลังการสร้างแบบจำลอง ML นั้นเป็นไปโดยอัตโนมัติจาก Power BI มีตัวป้องกันเพื่อให้แน่ใจว่าแบบจำลองที่สร้างขึ้นนั้นมีคุณภาพดี และสามารถมองเห็นกระบวนการที่ใช้ในการสร้างแบบจำลอง ML ได้
AutoML สนับสนุนการสร้างแบบจำลอง การทำนายแบบไบนารีการจำแนกประเภท และ การถดถอย สำหรับกระแสข้อมูล แบบจำลองเหล่านี้เป็นประเภทของเทคนิคการเรียนรู้ของเครื่องแบบมีผู้สอน ซึ่งหมายความว่าแบบจำลองได้เรียนรู้จากผลลัพธ์ที่ทราบในการสังเกตการณ์ที่ผ่านมาเพื่อทำนายผลลัพธ์ของการสังเกตการณ์อื่นๆ ชุดข้อมูลอินพุทสําหรับการฝึกแบบจําลอง AutoML คือชุดของแถวที่มี ป้ายชื่อ ที่มีผลลัพธ์ที่ทราบ
AutoML ใน Power BI รวม ML อัตโนมัติจากAzure Machine Learning serviceเพื่อสร้างรูปแบบ ML ของคุณ อย่างไรก็ตามคุณไม่จำเป็นต้องมีการสมัครใช้งาน Azure เพื่อให้ AutoML ใน Power BI กระบวนการของการฝึกและโฮสต์รูปแบบ ML ได้รับการจัดการทั้งหมดโดยบริการของ Power BI
หลังจากแบบจำลอง ML ได้รับการฝึก AutoML ให้สร้างรายงาน Power BI โดยอัตโนมัติที่อธิบายประสิทธิภาพการทำงานของรูปแบบ ML ของคุณ AutoML ให้ความสำคัญกับความสามารถในการอธิบายโดยการเน้นที่ปัจจัยหลักที่มีอิทธิพลในอินพุทของคุณที่มีผลต่อการทำนายที่ส่งคืนจากแบบจำลองของคุณ รายงานยังรวมถึงเมตริกหลักสำหรับแบบจำลองด้วย
หน้าอื่นๆ ของรายงานที่สร้างขึ้นแสดงสรุปทางสถิติของแบบจำลองและรายละเอียดการฝึกอบรม ผลสรุปทางสถิติคือความสนใจของผู้ใช้ที่ต้องการดูหน่วยวัดประสิทธิภาพของแบบจำลองตามมาตรฐานวิทยาศาสตร์ข้อมูล รายละเอียดการฝึกสรุปการเกิดซ้ำทั้งหมดที่มีการเรียกใช้เพื่อสร้างแบบจำลองของคุณด้วยพารามิเตอร์การสร้างโมเดลที่เกี่ยวข้อง นอกจากนี้ยังอธิบายวิธีการป้อนข้อมูลแต่ละครั้งที่ใช้ในการสร้างแบบจำลอง ML
จากนั้นคุณสามารถนำรูปแบบ ML ของคุณไปใช้กับข้อมูลของคุณสำหรับการให้คะแนนได้ เมื่อมีการรีเฟรชกระแสข้อมูล ข้อมูลของคุณจะได้รับการอัปเดตด้วยการทำนายจากแบบจำลอง ML Power BI ยังรวมถึงคำอธิบายเฉพาะสำหรับการทำนายแต่ละรายการที่แบบจำลอง ML สร้างขึ้น
การสร้างแบบจำลองการเรียนรู้ของเครื่อง
ในส่วนนี้จะอธิบายวิธีการสร้างแบบจำลอง AutoML
การเตรียมข้อมูลสำหรับการสร้างรูปแบบ ML
เมื่อต้องการสร้างแบบจำลองการเรียนรู้ของเครื่องใน Power BI คุณต้องสร้างกระแสข้อมูลสำหรับข้อมูลที่ประกอบด้วยข้อมูลผลลัพธ์ในอดีต ซึ่งนำมาใช้สำหรับการสอนแบบจำลอง ML นอกจากนี้คุณควรเพิ่มคอลัมน์จากการคำนวณสำหรับเมตริกธุรกิจใดๆ ที่อาจมีทำนายที่แข็งแกร่งสำหรับผลลัพธ์ที่คุณกำลังพยายามคาดการณ์ สำหรับรายละเอียดเกี่ยวกับการกำหนดค่ากระแสข้อมูลของคุณ โปรดดูที่ กำหนดค่าและใช้กระแสข้อมูล
AutoML มีข้อกำหนดข้อมูลเฉพาะสำหรับการฝึกแบบจำลองการเรียนรู้ของเครื่อง ข้อกำหนดเหล่านี้จะอธิบายไว้ในส่วนด้านล่างตามชนิดแบบจำลองที่เกี่ยวข้อง
การกำหนดค่าอินพุทแบบจำลอง ML
หากต้องการสร้างแบบจําลอง AutoML ให้เลือกไอคอน ML ในคอลัมน์ การดําเนินการ ของตารางกระแสข้อมูล และเลือก เพิ่มแบบจําลองการเรียนรู้ของเครื่อง

มีการเปิดใช้งานประสบการณ์ที่ง่ายดายซึ่งประกอบด้วยตัวช่วยสร้างที่แนะนำคุณในกระบวนการสร้างรูปแบบ ML ตัวช่วยสร้างมีขั้นตอนง่ายๆดังต่อไปนี้
1. เลือกตารางที่มีข้อมูลในอดีตและคอลัมน์ผลลัพธ์ที่คุณต้องการการคาดการณ์
คอลัมน์ผลลัพธ์จะระบุแอตทริบิวต์ป้ายชื่อสําหรับการสอนแบบจําลอง ML ดังแสดงในรูปต่อไปนี้

2. เลือกประเภทแบบจำลอง
เมื่อคุณระบุคอลัมน์ผลลัพธ์ AutoML จะวิเคราะห์ข้อมูลป้ายชื่อเพื่อแนะนําชนิดแบบจําลอง ML ที่เป็นไปได้มากที่สุดที่สามารถรับการฝึกได้ คุณสามารถเลือกประเภทแบบจำลองที่แตกต่างกันดังที่แสดงด้านล่างโดยการคลิกที่ "เลือกแบบจำลองที่แตกต่างกัน"

หมายเหตุ
แบบจำลองบางชนิดอาจไม่ได้รับการสนับสนุนสำหรับข้อมูลที่คุณเลือก และจะถูกปิดใช้งาน ในตัวอย่างข้างต้น การถดถอยถูกปิดใช้งาน เนื่องจากมีการเลือกคอลัมน์ข้อความเป็นคอลัมน์ผลลัพธ์
3. เลือกอินพุทที่คุณต้องการให้แบบจำลองใช้เป็นสัญญาณที่คาดเดาได้
AutoML วิเคราะห์ตัวอย่างของตารางที่เลือกเพื่อแนะนําอินพุทที่สามารถใช้สําหรับการฝึกแบบจําลอง ML ได้ คําอธิบายจะอยู่ถัดจากคอลัมน์ที่ไม่ได้เลือก ถ้าคอลัมน์เฉพาะมีค่าที่แตกต่างกันมากเกินไป หรือมีเพียงหนึ่งค่าเท่านั้น หรือมีความสัมพันธ์ต่ําหรือสูงกับคอลัมน์ผลลัพธ์ เราไม่ขอแนะนําคอลัมน์นี้
อินพุทใดก็ตามที่ขึ้นอยู่กับคอลัมน์ผลลัพธ์ (หรือคอลัมน์ป้ายชื่อ) ไม่ควรใช้สําหรับการฝึกแบบจําลอง ML เนื่องจากจะส่งผลกระทบต่อประสิทธิภาพการทํางาน คอลัมน์ดังกล่าวจะถูกตั้งค่าสถานะว่ามี "ความสัมพันธ์สูงอย่างน่าสงสัยกับคอลัมน์ผลลัพธ์" การใช้คอลัมน์เหล่านี้เป็นข้อมูลการสอนจะทําให้เกิดปัญหาการรั่วไหลของป้ายชื่อ ซึ่งแบบจําลองจะทํางานได้ดีกับการตรวจสอบความถูกต้องหรือการทดสอบข้อมูล แต่ไม่ตรงกับประสิทธิภาพเมื่อใช้ในการให้คะแนน การรั่วไหลของป้ายชื่ออาจเป็นปัญหาที่เกิดขึ้นได้กับแบบจำลอง AutoML เมื่อประสิทธิภาพของแบบจำลองการสอนดีเกินกว่าความเป็นจริง
คำแนะนำเกี่ยวกับคุณลักษณะนี้จะขึ้นอยู่กับตัวอย่างของข้อมูล ดังนั้นคุณควรตรวจสอบอินพุทที่ใช้ คุณมีตัวเลือกในการเปลี่ยนแปลงการเลือกเพื่อรวมเฉพาะคอลัมน์ที่คุณต้องการให้แบบจําลองศึกษา คุณยังสามารถเลือกคอลัมน์ทั้งหมดได้โดยเลือกกล่องกาเครื่องหมายถัดจากชื่อตาราง

4. ตั้งชื่อแบบจำลองและบันทึกการกำหนดค่าของคุณ
ในขั้นตอนสุดท้าย คุณสามารถตั้งชื่อแบบจำลองและเลือกบันทึก และสอนที่เริ่มต้นการสอนแบบจำลอง ML คุณสามารถเลือกที่จะลดเวลาการสอนเพื่อดูผลลัพธ์อย่างรวดเร็ว หรือเพิ่มระยะเวลาที่ใช้ในการสอนเพื่อให้ได้แบบจำลองที่ดีที่สุด

การฝึกแบบจำลอง ML
การฝึกแบบจำลอง AutoML เป็นส่วนหนึ่งของรีเฟรชกระแสข้อมูล ก่อนอื่น AutoML เตรียมข้อมูลของคุณสำหรับการฝึก AutoML จะแยกข้อมูลในอดีต ซึ่งคุณระบุไว้ในชุดข้อมูลการสอนและการทดสอบ ชุดข้อมูลทดสอบคือชุด holdout ที่ใช้สำหรับการตรวจสอบประสิทธิภาพของแบบจำลองหลังจากการฝึก สิ่งเหล่านี้จะถูกรับรู้ว่าเป็น การฝึกและการทดสอบ ตารางในกระแสข้อมูล AutoML ใช้การตรวจสอบความถูกต้องข้ามสำหรับการตรวจสอบแบบจำลอง
ถัดไป แต่ละคอลัมน์ที่ป้อนเข้าจะได้รับการวิเคราะห์และใช้การใส่ค่า ซึ่งแทนที่ค่าที่ขาดหายไปด้วยค่าที่มีการแทนที่ มีการใช้กลยุทธ์การใส่ค่าที่แตกต่างกันสองตัวโดย AutoML สำหรับแอตทริบิวต์อินพุทที่ถือว่าเป็นคุณลักษณะตัวเลข ค่าเฉลี่ยของค่าคอลัมน์จะนำมาใช้สำหรับการแทนค่าข้อมูลที่สูญหาย สำหรับแอตทริบิวต์อินพุทที่ถือว่าเป็นคุณลักษณะจัดกลุ่ม AutoML จะใช้ฐานนิยมของค่าคอลัมน์สำหรับการแทนค่าข้อมูลที่สูญหาย ค่าเฉลี่ยและฐานนิยมของค่าที่ใช้สำหรับการแทนค่าข้อมูลที่สูญหายถูกคำนวณโดยเฟรมเวิร์ก AutoML บนชุดข้อมูลการสอนที่สุ่มย่อย
จากนั้น มีการใช้การสุ่มตัวอย่างและการปรับมาตรฐานกับข้อมูลของคุณตามที่ต้องการ สำหรับแบบจำลองการจำแนกประเภท AutoML จะเรียกใช้ข้อมูลอินพุทผ่านการสุ่มตัวอย่างแบบชั้นภูมิและทำให้คลาสสมดุลเพื่อให้แน่ใจว่าจำนวนแถวจะเท่ากันทั้งหมด
AutoML ใช้การแปลงหลายรายการในแต่ละคอลัมน์อินพุตที่เลือกโดยยึดตามชนิดข้อมูลและคุณสมบัติทางสถิติ AutoML ใช้การแปลงข้อมูลเหล่านี้เพื่อแยกคุณลักษณะสำหรับใช้ในการฝึกแบบจำลอง ML ของคุณ
กระบวนการฝึกสำหรับแบบจำลอง AutoML ประกอบด้วยการทำซ้ำ 50 ครั้งที่มีการวนกลับกับอัลกอริทึมการสร้างโมเดลที่แตกต่างกันและการตั้งค่า hyperparameter เพื่อค้นหาแบบจำลองที่มีประสิทธิภาพที่ดีที่สุด การสอนอาจจบลงก่อนด้วยจำนวนการวนซ้ำที่น้อยลง หาก AutoML สังเกตว่าประสิทธิภาพไม่ได้ดีขึ้น ประสิทธิภาพของแต่ละโมเดลเหล่านี้จะถูกประเมินโดยการตรวจสอบความถูกต้องของชุดข้อมูลทดสอบ holdout ในระหว่างขั้นตอนการฝึกอบรมนี้ AutoML สร้างไปป์ไลน์หลายตัวสำหรับการฝึกอบรมและการตรวจสอบการเกิดซ้ำเหล่านี้ กระบวนการประเมินประสิทธิภาพของแบบจำลองอาจใช้เวลาไม่กี่นาทีไปจนถึงสองสามชั่วโมง หรือจนถึงเวลาการสอนที่กำหนดค่าในตัวช่วยสร้าง ทั้งนี้ขึ้นอยู่กับขนาดของชุดข้อมูลของคุณและทรัพยากรความจุที่พร้อมใช้งาน
ในบางกรณีแบบจำลองขั้นสุดท้ายที่สร้างขึ้นอาจใช้การเรียนรู้ในวงการที่มีการใช้หลายแบบเพื่อให้ประสิทธิภาพการทำงานที่ดีขึ้น
ความสามารถในการอธิบายแบบจำลอง AutoML
หลังจากที่ได้รับการฝึกแบบจำลอง AutoML วิเคราะห์ความสัมพันธ์ระหว่างคุณลักษณะการป้อนข้อมูลและการแสดงผลแบบจำลอง AutoML จะประเมินขนาดของการเปลี่ยนแปลงไปยังการแสดงผลแบบจำลองสำหรับชุดข้อมูลทดสอบ holdout สำหรับคุณลักษณะอินพุทแต่ละตัว ซึ่งเรียกว่าความสำคัญของคุณลักษณะ สิ่งนี้เกิดขึ้นเนื่องจากเป็นส่วนหนึ่งของการรีเฟรชเมื่อการสอนเสร็จสมบูรณ์ ดังนั้นการรีเฟรชของคุณอาจใช้เวลานานกว่าเวลาการสอนที่กำหนดไว้ในตัวช่วยสร้าง

รายงานแบบจำลอง AutoML
AutoML สร้างรายงาน Power BI ที่สรุปประสิทธิภาพการทำงานของแบบจำลองระหว่างการตรวจสอบความถูกต้องพร้อมกับความสำคัญของคุณลักษณะทั่วโลก รายงานนี้สามารถเข้าถึงได้จากแท็บแบบจำลองการเรียนรู้ของเครื่องเมื่อการรีเฟรชกระแสข้อมูลเสร็จสิ้น รายงานสรุปผลลัพธ์จากการใช้แบบจำลอง ML ไปยังข้อมูลทดสอบ holdout และเปรียบเทียบการคาดการณ์ด้วยค่าผลลัพธ์
คุณสามารถตรวจสอบรายงานแบบจำลองเพื่อทำความเข้าใจประสิทธิภาพ นอกจากนี้คุณยังสามารถตรวจสอบว่าปัจจัยหลักที่มีอิทธิพลของแบบจำลองอยู่ใกล้กับกับข้อมูลเชิงลึกทางธุรกิจเกี่ยวกับผลลัพธ์ที่รู้ผลอยู่แล้ว
แผนภูมิและหน่วยวัดที่ใช้เพื่ออธิบายประสิทธิภาพของแบบจำลองในรายงานจะขึ้นอยู่กับชนิดแบบจำลอง แผนภูมิประสิทธิภาพและหน่วยวัดเหล่านี้จะอธิบายไว้ในส่วนต่อไปนี้
หน้าเพิ่มเติมในรายงานอาจอธิบายหน่วยวัดทางสถิติเกี่ยวกับแบบจำลองจากมุมมองวิทยาศาสตร์ข้อมูล ตัวอย่างเช่นรายงานการคาดการณ์ไบนารีจะมีแผนภูมิกำไรและเส้นโค้ง ROC สำหรับแบบจำลอง
รายงานยังรวมถึงหน้ารายละเอียดการสอนที่มีคำอธิบายวิธีการการสอนแบบจำลอง และแผนภูมิที่อธิบายประสิทธิภาพของแบบจำลองในการวนซ้ำแต่ละครั้ง

ส่วนอื่นในหน้านี้จะอธิบายชนิดที่ตรวจพบของคอลัมน์อินพุตและวิธีการแทนค่าข้อมูลที่สูญหายที่ใช้สําหรับการเติมค่าที่หายไป นอกจากนี้ยังมีพารามิเตอร์ที่ใช้โดยแบบจำลองขั้นสุดท้าย

ถ้าแบบจำลองที่สร้างขึ้นใช้การเรียนรู้แบบ Ensemble หน้ารายละเอียดการสอนยังประกอบด้วยแผนภูมิที่แสดงน้ำหนักของแบบจำลองหน่วยประกอบแต่ละชุดใน Ensemble ซึ่งรวมถึงพารามิเตอร์ด้วย

การใช้แบบจำลอง AutoML
ถ้าคุณพอใจกับประสิทธิภาพการทำงานของรูปแบบ ML ที่สร้างขึ้นคุณสามารถนำไปใช้กับข้อมูลใหม่หรืออัปเดตเมื่อมีการรีเฟรช กระแสข้อมูลของคุณ คุณสามารถดำเนินการได้จากรายงานแบบจำลองโดยการเลือกปุ่ม นำไปใช้ ที่มุมขวาบนหรือปุ่ม ใช้แบบจำลอง ML ใต้การดำเนินการในแท็บแบบจำลองการเรียนรู้ของเครื่อง
เมื่อต้องการใช้แบบจําลอง ML คุณต้องระบุชื่อของตารางที่จะใช้และคํานําหน้าสําหรับคอลัมน์ที่จะถูกเพิ่มไปยังตารางนี้สําหรับการแสดงผลแบบจําลอง คำนำหน้าเริ่มต้นสำหรับชื่อคอลัมน์คือชื่อแบบจำลอง ฟังก์ชันการนำไปใช้อาจรวมพารามิเตอร์เพิ่มเติมเฉพาะสำหรับชนิดแบบจำลอง
การใช้แบบจําลอง ML จะสร้างตารางกระแสข้อมูลใหม่สองตารางซึ่งมีการทํานายและคําอธิบายเฉพาะสําหรับแต่ละแถวที่ให้คะแนนในตารางผลลัพธ์ ตัวอย่างเช่น ถ้าคุณนําแบบจําลอง PurchaseIntent ไปใช้กับตาราง OnlineShoppers ผลลัพธ์จะสร้างตาราง PurchaseIntent ที่เต็มไปด้วย OnlineShoppers และ คําอธิบาย PurchaseIntent ที่เต็มไปด้วย OnlineShoppers สําหรับแต่ละแถวในตารางที่สมบูรณ์ คําอธิบาย จะแบ่งย่อยเป็นหลายแถวในตารางคําอธิบายที่สมบูรณ์โดยยึดตามคุณลักษณะอินพุท ExplanationIndex ช่วยแมปแถวจากตารางคําอธิบายที่เสริมสร้างไปยังแถวในตารางที่เสริมข้อมูล

คุณยังสามารถใช้แบบจําลอง Power BI AutoML ใดก็ได้กับตารางในกระแสข้อมูลใด ๆ ในพื้นที่ทํางานเดียวกันโดยใช้ข้อมูลเชิงลึกของ AIในเบราว์เซอร์ฟังก์ชัน PQO ด้วยวิธีนี้คุณสามารถใช้แบบจำลองที่สร้างโดยผู้อื่นในพื้นที่ทำงานเดียวกันโดยไม่จำเป็นต้องเป็นเจ้าของของกระแสข้อมูลที่มีแบบจำลองด้วย Power Query ค้นพบโมเดล Power BI ML ทั้งหมดในพื้นที่ทำงานและแสดงเป็นฟังก์ชัน Power Query แบบไดนามิก คุณจะสามารถเรียกใช้ฟังก์ชันเหล่านั้นโดยการเข้าถึงจาก Ribbon ในตัวแก้ไข Power Query หรือโดยการเรียกฟังก์ชัน M โดยตรง ฟังก์ชันนี้จะได้รับการรองรับเฉพาะกระแสข้อมูล Power BI และ Power Query แบบออนไลน์ในบริการของ Power BI โปรดทราบว่านี่เป็นวิธีที่แตกต่างจากการใช้แบบจำลอง ML ภายในกระแสข้อมูลด้วยตัวช่วยสร้าง AutoML ไม่มีตารางคําอธิบายที่สร้างขึ้นโดยใช้วิธีนี้และเว้นแต่ว่าคุณเป็นเจ้าของกระแสข้อมูล คุณจะไม่สามารถเข้าถึงรายงานการฝึกอบรมของแบบจําลองหรือฝึกแบบจําลองใหม่ ถ้าแบบจําลองต้นทางถูกแก้ไข (เพิ่มหรือลบคอลัมน์ที่ป้อนเข้า) แบบจําลองหรือกระแสข้อมูลต้นทางจะถูกลบออก กระแสข้อมูลที่ขึ้นต่อกันนี้จะหยุดทํางาน

หลังจากคุณใช้แบบจำลองแล้ว AutoML จะทำให้การทำนายของคุณเป็นปัจจุบันเสมอเมื่อใดก็ตามที่มีการรีเฟรชกระแสข้อมูล
หากต้องการใช้ข้อมูลเชิงลึกและการคาดการณ์จากรูปแบบ ML ในรายงาน Power BI คุณสามารถเชื่อมต่อกับตารางผลลัพธ์จากPower BI Desktopโดยใช้ตัวเชื่อมต่อกระแสข้อมูลได้
แบบจำลองการทำนายแบบไบนารี
แบบจำลองการคาดการณ์ไบนารีที่รู้จักกันอย่างเป็นทางการเป็นแบบจำลองการจัดประเภทไบนารีจะใช้เพื่อจัดประเภทชุดข้อมูลลงในสองกลุ่ม ซึ่งใช้ในการทำนายเหตุการณ์ที่อาจมีผลลัพธ์แบบไบนารีได้ ตัวอย่างเช่น โอกาสทางการขายเปลี่ยนไปเป็นการขายจริงหรือไม่ บัญชีผู้ใช้นี้จะออกไปจากระบบหรือไม่ มีการชำระเงินตามใบแจ้งนี้ตรงเวลาหรือไม่ ธุรกรรมนี้เป็นการฉ้อโกงหรือไม่ และอื่น ๆ
ผลลัพธ์ของแบบจำลองการทำนายแบบไบนารีคือคะแนนความน่าจะเป็น ซึ่งระบุความเป็นไปได้ที่จะบรรลุผลลัพธ์เป้าหมาย
แบบจำลองการทำนายแบบไบนารี
การเตรียมปัจจัยที่จำเป็น:
- ต้องมีข้อมูลในอดีตย่างน้อย 20 แถวสำหรับแต่ละคลาสของผลลัพธ์
กระบวนการสร้างสำหรับแบบจำลองการคาดการณ์ไบนารีจะเป็นไปตามขั้นตอนเดียวกันกับแบบจำลองAutoML อื่นๆที่อธิบายไว้ในส่วนที่กำหนดค่าอินพุทแบบจำลอง ML ด้านบน ข้อแตกต่างเพียงอย่างเดียวคือในขั้นตอน “เลือกแบบจำลอง” ซึ่งคุณสามารถเลือกค่าผลลัพธ์เป้าหมายที่คุณสนใจมากที่สุดได้ คุณยังสามารถกำหนดป้ายชื่อที่เรียกง่ายสำหรับผลลัพธ์ที่จะใช้ในรายงานที่สร้างขึ้นโดยอัตโนมัติ ซึ่งจะสรุปผลลัพธ์ของการตรวจสอบแบบจำลอง

รายงานแบบจำลองการทำนายแบบไบนารี
แบบจําลองการคาดการณ์ไบนารีสร้างเป็นผลลัพธ์ความน่าจะเป็นที่แถวจะบรรลุผลลัพธ์เป้าหมาย รายงานมีตัวแบ่งส่วนข้อมูลสำหรับขีดจำกัดความน่าจะเป็นซึ่งมีผลต่อวิธีการที่คะแนนด้านบนและด้านล่างของขีดจำกัดความน่าจะเป็น
รายงานอธิบายประสิทธิภาพการทำงานของแบบจำลองในแง่ของ True Positives, False Positives, True Negatives และ False Negatives True Positive และ True Negative ได้รับการคาดการณ์ผลอย่างถูกต้องสำหรับสองชั้นในข้อมูลผลลัพธ์ False Positives คือแถวที่ทํานายว่าจะมีผลลัพธ์เป้าหมาย แต่ในความเป็นจริงไม่ใช่ ในทางกลับกัน False Negatives คือแถวที่มีผลลัพธ์เป้าหมาย แต่ได้รับการคาดการณ์ว่าไม่มี
หน่วยวัดเช่นความแม่นยำและการเรียกใช้ให้อธิบายผลกระทบของขีดจำกัดน่าจะเป็นที่มาของผลลัพธ์ที่คาดการณ์ไว้ คุณสามารถใช้ตัวแบ่งส่วนข้อมูลของขีดจำกัดความน่าจะเป็นเพื่อเลือกขีดจำกัดที่ทำให้มีความสมดุลระหว่างความแม่นยำและการเรียกคืนได้

รายงานยังมีเครื่องมือการวิเคราะห์ต้นทุนและผลประโยชน์เพื่อช่วยในการระบุส่วนย่อยของประชากรที่ควรจะเป็นเป้าหมายเพื่อให้ได้กำไรสูงสุด ด้วยต้นทุนต่อหน่วยที่กำหนดไว้โดยประมาณจากการกำหนดเป้าหมายและประโยชน์ต่อหน่วยจากการบรรลุผลลัพธ์เป้าหมาย การวิเคราะห์ต้นทุนและผลกำไรจะพยายามเพิ่มผลกำไรสูงสุด คุณสามารถใช้เครื่องมือนี้เพื่อเลือกค่าขีดจำกัดความน่าจะเป็นโดยยึดตามจุดสูงสุดในกราฟเพื่อเพิ่มผลกำไรสูงสุด นอกจากนี้ คุณยังสามารถใช้กราฟเพื่อคำนวณกำไรหรือต้นทุนสำหรับการเลือกค่าขีดจำกัดความน่าจะเป็นของคุณได้อีกด้วย

หน้ารายงานที่แม่นยำของรายงานแบบจำลองมีแผนภูมิกำไรสะสมและเส้นโค้ง ROC สำหรับแบบจำลอง รายงานเหล่านี้คือหน่วยวัดทางสถิติของประสิทธิภาพแบบจำลอง รายงานประกอบด้วยคำอธิบายของแผนภูมิที่แสดง

การนำแบบจำลองการทำนายแบบไบนารีไปใช้
เมื่อต้องการใช้แบบจําลองการคาดการณ์ไบนารีคุณต้องระบุตารางที่มีข้อมูลที่คุณต้องการใช้การคาดการณ์จากรูปแบบ ML พารามิเตอร์อื่นๆรวมถึงคำนำหน้าชื่อคอลัมน์ผลลัพธ์และขีดจำกัดความน่าจะเป็นสำหรับการจัดประเภทผลลัพธ์ที่คาดการณ์ไว้

เมื่อมีการใช้แบบจําลองการคาดการณ์ไบนารี การดําเนินการนี้จะเพิ่มคอลัมน์ผลลัพธ์สี่คอลัมน์ไปยังตารางผลลัพธ์ที่สมบูรณ์ได้แก่ Outcome, PredictionScore, PredictionExplanation และ ExplanationIndex ชื่อคอลัมน์ในตารางมีการระบุคํานําหน้าเมื่อใช้แบบจําลอง
PredictionScore คือเปอร์เซ็นต์ความน่าจะเป็น ซึ่งระบุความเป็นไปได้ที่จะบรรลุผลลัพธ์เป้าหมาย
คอลัมน์ Outcome ประกอบด้วยป้ายชื่อผลลัพธ์ที่ทำนายไว้ เรกคอร์ดที่มีความน่าจะเป็นเกินค่าขีดจำกัดจะได้รับการทำนายว่ามีแนวโน้มที่จะทำให้เกิดผลลัพธ์เป้าหมาย และถูกติดป้ายชื่อว่าเป็นจริง เรกคอร์ดที่อยู่ต่ำกว่าค่าขีดจำกัดจะได้รับการทำนายว่าไม่น่าจะทำให้เกิดผลลัพธ์ และถูกติดป้ายชื่อว่าเป็นเท็จ
คอลัมน์ PredictionExplanationประกอบด้วยคำอธิบายที่มีผลกระทบเฉพาะที่คุณลักษณะป้อนเข้าที่มีใน PredictionScore
แบบจำลองการจัดประเภท
แบบจำลองการจัดประเภทจะใช้ในการแยกประเภทชุดข้อมูลลงในกลุ่มหรือประเภทในหลายรายการ แบบจำลองนี้ใช้เพื่อทำนายเหตุการณ์ที่สามารถมีหนึ่งในผลลัพธ์ที่เป็นไปได้หลายอย่าง ตัวอย่างเช่น ลูกค้ามีแนวโน้มที่จะมีมูลค่าตลอดช่วงชีวิตสูงมาก สูง ปานกลาง หรือต่ำ ความเสี่ยงในการผิดนัดชำระหนี้เป็นสูง ปานกลาง ต่ำ หรือต่ำมาก และอื่นๆ
ผลลัพธ์ของแบบจําลองการจัดประเภทคือคะแนนความน่าจะเป็นซึ่งระบุความเป็นไปได้ว่าแถวจะบรรลุเกณฑ์สําหรับคลาสที่กําหนด
การฝึกแบบจำลองการจัดประเภท
ตารางอินพุตที่มีข้อมูลการฝึกของคุณสําหรับแบบจําลองการจัดประเภทต้องมีคอลัมน์สตริงหรือจํานวนเต็มเป็นคอลัมน์ผลลัพธ์ซึ่งระบุผลลัพธ์ที่ทราบดีแล้วในอดีต
การเตรียมปัจจัยที่จำเป็น:
- ต้องมีข้อมูลในอดีตย่างน้อย 20 แถวสำหรับแต่ละคลาสของผลลัพธ์
กระบวนการสร้างสำหรับแบบจำลองการคาดการณ์จะเป็นไปตามขั้นตอนเดียวกันกับแบบจำลองAutoML อื่นๆที่อธิบายไว้ในส่วนที่กำหนดค่าอินพุทแบบจำลอง ML ด้านบน
รายงานผลลัพธ์แบบจำลองการจัดประเภท
รายงานแบบจําลองการจัดประเภทได้รับการผลิตโดยใช้แบบจําลอง ML กับข้อมูลทดสอบ holdout และเปรียบเทียบคลาสที่ทํานายสําหรับแถวที่มีคลาสที่รู้จักจริง
รายงานแบบจําลองมีแผนภูมิที่มีการแบ่งย่อยของแถวที่มีการจัดประเภทอย่างถูกต้องและไม่ถูกต้องสําหรับแต่ละคลาสที่รู้จัก

การดําเนินการดูรายละเอียดแนวลึกที่เฉพาะเจาะจงของคลาสเพิ่มเติมช่วยให้สามารถวิเคราะห์วิธีการกระจายการทํานายสําหรับคลาสที่รู้จัก ซึ่งแสดงคลาสอื่นที่มีแถวของคลาสที่รู้จักนั้นมีแนวโน้มที่จะจัดประเภทผิด
คำอธิบายแบบจำลองในรายงานซึ่งรวมไปถึงการคาดการณ์ระดับสูงสำหรับแต่ละคลาส
รายงานแบบจำลองการจัดประเภทยังรวมถึงหน้ารายละเอียดการฝึกอบรมที่คล้ายกับหน้าสำหรับชนิดแบบจำลองอื่นๆตามที่อธิบายไว้ในส่วนรายงานแบบจำลอง AutoMLก่อนหน้าในบทความนี้
การนำแบบจำลองการจัดประเภทไปใช้
เมื่อต้องการใช้แบบจําลองการจัดประเภท ML คุณต้องระบุตารางที่มีข้อมูลป้อนเข้าและคํานําหน้าชื่อคอลัมน์ผลลัพธ์
เมื่อมีการใช้แบบจําลองการจัดประเภท การดําเนินการนี้จะเพิ่มคอลัมน์ผลลัพธ์ห้าคอลัมน์ไปยังตารางผลลัพธ์ที่อุดมไปด้วย: ClassificationScore, ClassificationResult, ClassificationExplanation, ClassProbabilities และ ExplanationIndex ชื่อคอลัมน์ในตารางมีการระบุคํานําหน้าเมื่อใช้แบบจําลอง
คอลัมน์ ClassProbabilities ประกอบด้วยรายการคะแนนความน่าจะเป็นสําหรับแถวสําหรับแต่ละคลาสที่เป็นไปได้
ClassificationScore คือเปอร์เซ็นต์ความน่าจะเป็น ซึ่งระบุความเป็นไปได้ว่าแถวจะบรรลุเกณฑ์สําหรับคลาสที่กําหนด
คอลัมน์ ClassificationResult ประกอบด้วยคลาสที่คาดการณ์ไว้มากที่สุดสําหรับแถว
คอลัมน์ ClassificationExplanation ประกอบด้วยคำอธิบายที่มีผลกระทบเฉพาะที่คุณลักษณะอินพุทมีใน ClassificationScore
แบบจำลองการถดถอย
แบบจำลองการถดถอยจะใช้ในการทำนายค่าตัวเลข ตัวอย่างเช่น รายได้มีแนวโน้มที่จะมาจากข้อตกลงการขาย มูลค่าตลอดอายุการใช้งานของบัญชี ยอดเงินของใบแจ้งหนี้ที่น่าจะได้รับชำระ วันที่ที่อาจมีการชำระใบแจ้งหนี้ และอื่นๆ
ผลลัพธ์ของแบบจำลองการถดถอยคือค่าที่คาดการณ์ไว้
การฝึกแบบจำลองการถดถอย
ตารางอินพุตที่มีข้อมูลการฝึกสําหรับแบบจําลองการถดถอยต้องมีคอลัมน์ตัวเลขเป็นคอลัมน์ผลลัพธ์ซึ่งระบุค่าผลลัพธ์ที่ทราบแล้ว
การเตรียมปัจจัยที่จำเป็น:
- ต้องมีอย่างน้อย100 แถวของข้อมูลในอดีตสำหรับแบบจำลองการถดถอย
กระบวนการสร้างสำหรับแบบจำลองการการถดถอยจะเป็นไปตามขั้นตอนเดียวกันกับแบบจำลองAutoML อื่นๆที่อธิบายไว้ในส่วนที่กำหนดค่าอินพุทแบบจำลอง ML ด้านบน
รายงานแบบจำลองการถดถอย
เช่นเดียวกับรายงานแบบจำลอง AutoML อื่นๆรายงานการถดถอยจะขึ้นอยู่กับผลลัพธ์จากการนำแบบจำลองไปใช้กับข้อมูลทดสอบ holdout
รายงานแบบจำลองประกอบด้วยแผนภูมิที่เปรียบเทียบค่าที่ทำนายกับค่าจริง ในแผนภูมินี้ระยะห่างจากเส้นทแยงมุมแสดงข้อผิดพลาดในการคาดการณ์
แผนภูมิข้อผิดพลาดที่เหลือแสดงการกระจายของเปอร์เซ็นต์ของข้อผิดพลาดเฉลี่ยสำหรับค่าที่แตกต่างกันในชุดข้อมูลการทดสอบ holdout แกนแนวนอนแสดงถึงค่าที่แท้จริงของกลุ่มที่มีขนาดของฟองที่แสดงความถี่หรือจำนวนของค่าในช่วงนั้น แกนแนวตั้งคือข้อผิดพลาดที่เหลือโดยเฉลี่ย

รายงานแบบจำลองการถดถอยยังรวมถึงหน้ารายละเอียดการฝึกรายงานสำหรับชนิดแบบจำลองอื่นๆตามที่อธิบายไว้ในส่วนรายงานแบบจำลอง AutoMLด้านบน
การใช้แบบจำลองการถดถอย
หากต้องการใช้แบบจําลองการถดถอย ML คุณต้องระบุตารางที่มีข้อมูลป้อนเข้าและคํานําหน้าชื่อคอลัมน์ผลลัพธ์

เมื่อมีการใช้แบบจําลองการถดถอย การดําเนินการนี้จะเพิ่มคอลัมน์ผลลัพธ์สามคอลัมน์ลงในตารางผลลัพธ์ที่สมบูรณ์ได้แก่ RegressionResult, RegressionExplanation และ ExplanationIndex ชื่อคอลัมน์ในตารางมีการระบุคํานําหน้าเมื่อใช้แบบจําลอง
คอลัมน์ RegressionResult ประกอบด้วยค่าที่คาดการณ์ไว้สําหรับแถวที่ยึดตามคอลัมน์อินพุต คอลัมน์ RegressionExplanation ประกอบด้วยคำอธิบายที่มีผลกระทบเฉพาะที่คุณลักษณะอินพุทมีอยู่ใน RegressionResult
การรวม Azure Machine Learning ใน Power BI
องค์กรมากมายใช้แบบจำลอง Machine Learning เพื่อข้อมูลเชิงลึกและการคาดการณ์เกี่ยวกับธุรกิจของตนเองที่ดีกว่า ความสามารถในการแสดงผลด้วยภาพจากแบบจำลองเหล่านี้ในรายงานและแดชบอร์ดรวมถึงการวิเคราะห์อื่นๆ ของคุณสามารถช่วยเผยแพร่ข้อมูลเชิงลึกเหล่านี้ให้แก่ผู้ใช้ทางธุรกิจที่ต้องการมากที่สุดได้ ขณะนี้ Power BI ช่วยให้การรวมข้อมูลเชิงลึกจากแบบจำลองที่โฮสต์บน Azure Machine Learning ได้อย่างง่ายดายโดยใช้ลักษณะการชี้และคลิกโดยตรง
หากต้องการใช้ความสามารถนี้ นักวิทยาศาสตร์ข้อมูลสามารถให้สิทธิ์เข้าถึงแบบจำลอง Azure ML ไปยังนักวิเคราะห์ BI โดยใช้พอร์ทัล Azure ได้อย่างง่ายดาย จากนั้น ณ จุดเริ่มต้นของแต่ละเซสชัน Power Query จะค้นพบแบบจำลอง Azure MLทั้งหมดที่ผู้ใช้ได้เข้าถึง และแสดงเป็นฟังก์ชัน Power Query แบบไดนามิก จากนั้นผู้ใช้จะสามารถเรียกใช้ฟังก์ชันเหล่านั้นโดยการเข้าถึงจาก Ribbon ในตัวแก้ไข Power Query หรือโดยการเรียกฟังก์ชัน M โดยตรง นอกจากนี้ Power BI ยังรวมคำขอการเข้าถึงโดยอัตโนมัติเมื่อเรียกแบบจำลอง Azure ML สำหรับชุดของแถวเพื่อบรรลุประสิทธิภาพการทำงานที่ดีกว่า
ฟังก์ชันนี้จะได้รับการรองรับเฉพาะกระแสข้อมูล Power BI และ Power Query แบบออนไลน์ในบริการของ Power BI
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับกระแสข้อมูล โปรดดู ข้อมูลเบื้องต้นเกี่ยวกับกระแสข้อมูลและการเตรียมข้อมูลด้วยตนเอง
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Azure Machine Learning โปรดดู:
- ภาพรวม: Azure Machine Learning คืออะไร
- เริ่มต้นใช้งานด่วนและบทช่วยสอนสำหรับ Azure Machine Learning: เอกสารประกอบ Azure Machine Learning
การให้สิทธิ์เข้าถึงแบบจำลอง Azure ML แก่ผู้ใช้ Power BI
หากต้องการเข้าถึงแบบจําลอง Azure ML จาก Power BI ผู้ใช้ต้องมีการสมัครใช้งาน Azure และพื้นที่ทํางานMachine Learningที่มีการเข้าถึงแบบ อ่าน
ขั้นตอนในบทความนี้จะอธิบายวิธีให้สิทธิ์ใช้งานแก่ผู้ใช้ Power BI ในการเข้าถึงแบบจำลองที่โฮสต์บนบริการ Azure ML เพื่อให้ผู้ใช้สามารถเข้าถึงแบบจำลองนี้เป็นฟังก์ชัน Power Query โปรดดู จัดการการเข้าถึง RBAC และพอร์ทัล Azure สำหรับรายละเอียดอื่นๆ
ลงชื่อเข้าใช้ไปยัง พอร์ทัล Azure
ไปที่หน้า การสมัครใช้งาน คุณสามารถค้นหาหน้า การสมัครใช้งาน ผ่านรายการ บริการทั้งหมด ในเมนูบานหน้าต่างนำทางของพอร์ทัล Azure
เลือกการสมัครใช้งานของคุณ
เลือก ควบคุมการเข้าถึง (IAM) แล้วเลือกปุ่ม เพิ่ม
เลือกบทบาทเป็น ผู้อ่าน เลือกผู้ใช้ Power BI ที่คุณต้องการให้สิทธิ์เข้าถึงแบบจำลอง Azure ML
เลือก บันทึก
ทําซ้ําขั้นตอนที่สามถึงหกเพื่อให้สิทธิ์การเข้าถึงแบบ ผู้อ่าน แก่ผู้ใช้สําหรับพื้นที่ทํางานMachine Learningเฉพาะที่โฮสต์แบบจําลอง
การค้นพบ Schema สำหรับแบบจำลอง Machine Learning
นักวิทยาศาสตร์ข้อมูลใช้ Python เป็นหลักเพื่อพัฒนาหรือแม้กระทั่งปรับใช้ แบบจำลองการเรียนรู้ของเครื่องของพวกเขาสำหรับ Machine Learning นักวิทยาศาสตร์ข้อมูลต้องสร้างไฟล์ Schema อย่างชัดเจนโดยใช้ Python
ไฟล์ Schema นี้ต้องอยู่ในบริการเว็บที่ปรับใช้สำหรับแบบจำลอง Machine Learning หากต้องการสร้าง Schema สำหรับบริการเว็บโดยอัตโนมัติ คุณต้องใส่ตัวอย่างของอินพุท/เอาท์พุทในสคริปต์รายการสำหรับแบบจำลองที่ปรับใช้ โปรดดูที่หัวข้อย่อยเกี่ยวกับการสร้าง Schema ของ Swagger แบบอัตโนมัติ (ไม่บังคับ) ในแบบจำลองการปรับใช้ด้วยเอกสารบริการ Azure Machine Learning ลิงก์มีสคริปต์รายการตัวอย่างด้วยคำสั่งสำหรับการสร้าง Schema
โดยเฉพาะ ฟังก์ชัน @input_schema และ @output_schema ในสคริปต์รายการอ้างอิงรูปแบบตัวอย่างอินพุทและเอาท์พุทในตัวแปร input_sample และ output_sample และใช้ตัวอย่างเหล่านี้เพื่อสร้างข้อกําหนด OpenAPI (Swagger) สําหรับบริการเว็บในระหว่างการปรับใช้
คำแนะนำเหล่านี้สำหรับการสร้าง Schema โดยการอัปเดตสคริปต์รายการจะต้องนำไปใช้กับแบบจำลองที่สร้างขึ้นโดยใช้การทดสอบการเรียนรู้ของเครื่องอัตโนมัติโดยใช้ Azure Machine Learning SDK
หมายเหตุ
แบบจำลองที่สร้างขึ้นโดยใช้อินเทอร์เฟสการแสดงผลด้วยภาพของ Azure Machine Learning ปัจจุบันไม่รองรับการสร้าง Schema แต่จะรองรับในรุ่นต่อ ๆ มา
การเรียกแบบจำลอง Azure ML ใน Power BI
คุณสามารถเรียกแบบจำลอง Azure ML ใดๆ ที่คุณได้รับสิทธิ์เข้าถึงได้ โดยตรงจากตัวแก้ไข Power Query ในกระแสข้อมูลของคุณ หากต้องการเข้าถึงแบบจําลอง Azure ML ให้เลือกปุ่ม แก้ไข สําหรับตารางที่คุณต้องการเสริมด้วยข้อมูลเชิงลึกจากแบบจําลอง Azure ML ของคุณ ดังที่แสดงในรูปภาพต่อไปนี้
การเลือกปุ่ม แก้ไข จะเปิดตัวแก้ไข Power Queryสําหรับตารางในกระแสข้อมูลของคุณ
เลือกปุ่ม ข้อมูลเชิงลึกของ AI ในริบบอน จากนั้นเลือกโฟลเดอร์ แบบจำลอง Azure Machine Learning จากเมนูบานหน้าต่างนำทาง แบบจำลอง Azure ML ทั้งหมดที่คุณสามารถเข้าถึงได้จะแสดงที่นี่เป็นฟังก์ชัน Power Query นอกจากนี้ พารามิเตอร์ที่ป้อนเข้าสำหรับแบบจำลอง Azure ML จะแมปเป็นพารามิเตอร์ของฟังก์ชัน Power Query ที่สอดคล้องกันโดยอัตโนมัติ
หากต้องการเรียกใช้แบบจําลอง Azure ML คุณสามารถระบุคอลัมน์ของตารางที่เลือกใดๆ ก็ได้เป็นข้อมูลป้อนเข้าจากดรอปดาวน์ นอกจากนี้คุณยังสามารถระบุค่าคงที่เพื่อใช้เป็นข้อมูลป้อนเข้าได้ โดยสลับไอคอนคอลัมน์ไปทางซ้ายของกล่องโต้ตอบที่ป้อนเข้า
เลือก การเรียก เพื่อดูตัวอย่างผลลัพธ์ของแบบจําลอง Azure ML เป็นคอลัมน์ใหม่ในตาราง นอกจากนี้คุณจะเห็นการเรียกแบบจำลองเป็นขั้นตอนที่นำไปใช้สำหรับคิวรี
หากแบบจําลองส่งกลับพารามิเตอร์ผลลัพธ์หลายรายการ พารามิเตอร์เหล่านั้นจะถูกจัดกลุ่มเข้าด้วยกันเป็นแถวในคอลัมน์ผลลัพธ์ คุณสามารถขยายคอลัมน์เพื่อสร้างแต่ละพารามิเตอร์ผลลัพธ์ในคอลัมน์แยกต่างหากได้
เมื่อคุณบันทึกกระแสข้อมูลของคุณแล้ว ระบบจะเรียกแบบจําลองโดยอัตโนมัติเมื่อมีการรีเฟรชกระแสข้อมูลสําหรับแถวใหม่หรือแถวที่ได้รับการอัปเดตใด ๆ ในตาราง
ข้อควรพิจารณาและข้อจำกัด
- ข้อมูลเชิงลึกของ AI (Cognitive Services และแบบจําลอง Azure ML) ไม่ได้รับการสนับสนุนบนเครื่องที่มีการตั้งค่าการรับรองความถูกต้องของพร็อกซี
- แบบจําลอง AzureML ไม่ได้รับการสนับสนุนสําหรับผู้ใช้ที่เป็นผู้เยี่ยมชม
- มีปัญหาที่ทราบแล้วบางประการเกี่ยวกับการใช้เกตเวย์กับ AutoML และ Cognitive Services หากคุณต้องการใช้เกตเวย์ เราขอแนะนําให้สร้างกระแสข้อมูลที่นําเข้าข้อมูลที่จําเป็นผ่านเกตเวย์ก่อน จากนั้นสร้างกระแสข้อมูลอื่นที่อ้างอิงกระแสข้อมูลแรกเพื่อสร้างหรือใช้แบบจําลองเหล่านี้และฟังก์ชัน AI
ขั้นตอนถัดไป
บทความนี้จะให้ภาพรวมของ Machine Learning อัตโนมัติสำหรับกระแสข้อมูลในบริการ Power BI บทความต่อไปนี้อาจมีประโยชน์เช่นกัน
- บทช่วยสอน: สร้างแบบจำลองการเรียนรู้ของเครื่องใน Power BI
- บทช่วยสอน: การใช้ Cognitive Services ใน Power BI
- บทช่วยสอน: ใช้แบบจำลองการเรียนรู้ของเครื่อง Azure ใน Power BI
บทความต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับกระแสข้อมูลและ Power BI:








