Så här gör du: Publicera dina måttdata till Metrics Advisor
Använd den här artikeln om du vill veta mer om hur du Metrics Advisor.
Krav och konfiguration för datascheman
Azure Metrics Advisor är en tjänst för avvikelseidentifiering, diagnostik och analys i tidsserier. Som en AI-driven tjänst använder den dina data för att träna den modell som används. Tjänsten accepterar tabeller med aggregerade data med följande kolumner:
- Mått (krävs): Ett mått är en grundläggande eller enhetsspecifik term och ett kvantifierbart värde för måttet. Det innebär en eller flera kolumner som innehåller numeriska värden.
- Tidsstämpel (valfritt): Noll eller en kolumn, med typen
DateTimeellerString. När den här kolumnen inte anges anges tidsstämpeln som starttid för varje inmatningsperiod. Formatera tidsstämpeln på följande sätt:yyyy-MM-ddTHH:mm:ssZ. - Dimension (valfritt): En dimension är ett eller flera kategoriska värden. Kombinationen av dessa värden identifierar en viss univariate-tidsserie (till exempel land, språk och klient). Dimensionskolumnerna kan vara av valfri datatyp. Var försiktig när du arbetar med stora mängder kolumner och värden för att förhindra att för många dimensioner bearbetas.
Om du använder datakällor som Azure Data Lake Storage eller Azure Blob Storage kan du aggregera dina data så att de överensstämmer med ditt förväntade måttschema. Det beror på att dessa datakällor använder en fil som måttindata.
Om du använder datakällor som Azure SQL eller Azure Data Explorer kan du använda aggregeringsfunktioner för att aggregera data i det förväntade schemat. Det beror på att dessa datakällor stöder körning av en fråga för att hämta måttdata från källor.
Om du inte är säker på några av villkoren kan du läsa ordlistan.
Undvik att läsa in partiella data
Partiella data orsakas av inkonsekvenser mellan data som lagras Metrics Advisor och datakällan. Detta kan inträffa när datakällan uppdateras när Metrics Advisor har slutfört data. Metrics Advisor hämtar endast data från en viss datakälla en gång.
Om ett mått till exempel har Metrics Advisor övervakning. Metrics Advisor hämtar måttdata vid tidsstämpel A och utför avvikelseidentifiering på den. Men om måttdata för den specifika tidsstämpeln A har uppdaterats efter att data har matats in. Nytt datavärde hämtas inte.
Du kan försöka återfylla historiska data (beskrivs senare) för att minimera inkonsekvenser, men detta utlöser inte nya avvikelseaviseringar om aviseringar för dessa tidpunkter redan har utlösts. Den här processen kan lägga till ytterligare arbetsbelastningar i systemet och är inte automatisk.
För att undvika inläsning av partiella data rekommenderar vi två metoder:
Generera data i en transaktion:
Se till att måttvärdena för alla dimensionskombinationer vid samma tidsstämpel lagras till datakällan i en transaktion. I exemplet ovan väntar du tills data från alla datakällor är klara och läser in dem i Metrics Advisor i en transaktion. Metrics Advisor kan avssöka dataflödet regelbundet tills data har hämtats (eller delvis) har hämtats.
Fördröj datainmatningen genom att ange ett korrekt värde för parametern för förskjutning av inmatningstid:
Ange förskjutningsparametern för inmatningstid för ditt dataflöde så att inmatningen fördröjs tills data är helt förberedda. Detta kan vara användbart för vissa datakällor som inte stöder transaktioner, till exempel Azure Table Storage. Mer information finns i avancerade inställningar.
Börja med att lägga till ett dataflöde
När du har loggat in Metrics Advisor-portalen och valt din arbetsyta klickar du på Kom igång. Klicka sedan på Lägg till dataflöde på den vänstra menyn på arbetsytans huvudsida.
Lägga till anslutningsinställningar
1. Grundläggande inställningar
Nu ska du ange en uppsättning parametrar för att ansluta din tidsseriedatakälla.
- Källtyp: Den typ av datakälla där dina tidsseriedata lagras.
- Kornighet: Intervallet mellan på varandra följande datapunkter i dina tidsseriedata. För Metrics Advisor stöd för: Varje år, Varje månad, Varje vecka, Varje dag, Varje timme och Anpassad. Det lägsta intervallet som anpassningsalternativet stöder är 300 sekunder.
- Sekunder: Antalet sekunder när granularityName är inställt på Anpassa.
- Mata in data sedan (UTC): Starttiden för baslinjen för datainmatning.
startOffsetInSecondsanvänds ofta för att lägga till en offset för att hjälpa till med datakonsekvens.
2. Ange anslutningssträng
Därefter måste du ange anslutningsinformationen för datakällan. Mer information om de andra fälten och hur du ansluter olika typer av datakällor finns i How-to: Anslut different data sources.
3. Ange fråga för en enskild tidsstämpel
Mer information om olika typer av datakällor finns i Så här gör du: Anslut olika datakällor.
Läsa in data
När anslutningssträngen och frågesträngen har matats in väljer du Läs in data. I den här Metrics Advisor kontrollerar du anslutningen och behörigheten för att läsa in data, kontrollerar nödvändiga parametrar ( och ) som måste användas i frågan och kontrollerar kolumnnamnet från @IntervalStart @IntervalEnd datakällan.
Om det finns ett fel i det här steget:
- Kontrollera först om anslutningssträngen är giltig.
- Kontrollera sedan om det finns tillräckliga behörigheter och att inmatningsarbetarens IP-adress har beviljats åtkomst.
- Kontrollera sedan om nödvändiga parametrar ( @IntervalStart och ) används i din @IntervalEnd fråga.
Schemakonfiguration
När dataschemat har lästs in väljer du lämpliga fält.
Om tidsstämpeln för en datapunkt utelämnas använder Metrics Advisor tidsstämpeln när datapunkten matas in i stället. För varje dataflöde kan du ange högst en kolumn som en tidsstämpel. Om du får ett meddelande om att en kolumn inte kan anges som en tidsstämpel kontrollerar du din fråga eller datakälla och om det finns flera tidsstämplar i frågeresultatet – inte bara i förhandsgranskningsdata. När du utför datainmatning kan Metrics Advisor bara använda ett segment (till exempel en dag, en timme – enligt kornigheten) av tidsseriedata från den angivna källan varje gång.
| Urval | Beskrivning | Kommentarer |
|---|---|---|
| Visningsnamn | Namn som ska visas på arbetsytan i stället för det ursprungliga kolumnnamnet. | Valfritt. |
| Timestamp | Tidsstämpeln för en datapunkt. Om detta utelämnas Metrics Advisor du tidsstämpeln när datapunkten matas in i stället. För varje dataflöde kan du ange högst en kolumn som tidsstämpel. | Valfritt. Bör anges med högst en kolumn. Om du får en kolumn som inte kan anges som tidsstämpelfel kontrollerar du om det finns dubbletter av tidsstämplar i din fråga eller datakälla. |
| Mått | De numeriska värdena i dataflödet. För varje dataflöde kan du ange flera mått, men minst en kolumn ska väljas som mått. | Bör anges med minst en kolumn. |
| Dimension | Kategoriska värden. En kombination av olika värden identifierar en viss tidsserie med en dimension, till exempel land, språk, klientorganisation. Du kan välja noll eller flera kolumner som dimensioner. Obs! Var försiktig när du väljer en kolumn som inte är en sträng som en dimension. | Valfritt. |
| Ignorera | Ignorera den markerade kolumnen. | Valfritt. För datakällor som stöder användning av en fråga för att hämta data finns det inget "Ignorera"-alternativ. |
Om du vill ignorera kolumner rekommenderar vi att du uppdaterar din fråga eller datakälla för att undanta dessa kolumner. Du kan också ignorera kolumner med hjälp av Ignorera kolumner och sedan Ignorera för de specifika kolumnerna. Om en kolumn ska vara en dimension och av misstag anges som Ignorerad kan Metrics Advisor till att partiella data matas in. Anta till exempel att data från din fråga är som nedan:
| Rad-ID | Timestamp | Land | Språk | Inkomst |
|---|---|---|---|---|
| 1 | 2019/11/10 | Kina | ZH-CN | 10000 |
| 2 | 2019/11/10 | Kina | EN-US | 1000 |
| 3 | 2019/11/10 | USA | ZH-CN | 12000 |
| 4 | 2019/11/11 | USA | EN-US | 23000 |
| ... | ... | ... | ... | ... |
Om Land är en dimension och Språk har angetts som Ignorerad får den första och andra raden samma dimensioner för en tidsstämpel. Metrics Advisor godtyckligt ett värde från de två raderna. Metrics Advisor aggregerar inte raderna i det här fallet.
När du har konfigurerat schemat väljer du Verifiera schema. I den här Metrics Advisor följande kontroller:
- Om tidsstämpeln för efterfrågade data hamnar i ett enda intervall.
- Om det finns dubblettvärden som returneras för samma dimensionskombination inom ett måttintervall.
Inställningar för automatisk sammanslagning
Viktigt
Om du vill aktivera rotorsaksanalys och andra diagnostikfunktioner måste inställningarna för automatisk sammanslagning konfigureras. När den har aktiverats går det inte att ändra inställningarna för automatisk sammanslagning.
Metrics Advisor kan automatiskt utföra aggregering (till exempel SUM, MAX, MIN) på varje dimension under inmatningen och skapar sedan en hierarki som ska användas i rotfallsanalys och andra diagnostikfunktioner.
Beakta följande scenarier:
"Jag behöver inte inkludera sammanslagningsanalysen för mina data."
Du behöver inte använda den Metrics Advisor sammanslagningen.
"Mina data har redan återställts och dimensionsvärdet representeras av: NULL eller tom (standard), endast NULL, andra."
Det här Metrics Advisor innebär att Metrics Advisor inte behöver samla in data eftersom raderna redan summeras. Om du till exempel bara väljer NULL visas den andra dataraden i exemplet nedan som en aggregering av alla länder och språket EN-US; Den fjärde dataraden som har ett tomt värde för Land visas dock som en vanlig rad som kan tyda på ofullständiga data.
Land Språk Inkomst Kina ZH-CN 10000 (NULL) EN-US 999999 USA EN-US 12000 EN-US 5000 "Jag Metrics Advisor samla mina data genom att beräkna Sum/Max/Min/Avg/Count och representera dem med {some string}."
Vissa datakällor, till exempel Cosmos DB eller Azure Blob Storage stöder inte vissa beräkningar som gruppera efter eller kub. Metrics Advisor ger sammanslagningsalternativet att automatiskt generera en datakub under inmatningen. Det här alternativet innebär Metrics Advisor måste beräkna sammanslagningen med hjälp av den algoritm som du har valt och använda den angivna strängen för att representera sammanslagningen i Metrics Advisor. Detta ändrar inte några data i datakällan. Anta till exempel att du har en uppsättning tidsserier som står för Försäljningsmått med dimensionen (Land, Region). För en viss tidsstämpel kan den se ut så här:
Country Region Sales Kanada Alberta 100 Kanada British Columbia 500 USA Montana 100 När du har aktivera automatisk sammanslagning med summa Metrics Advisor du dimensionskombinationerna och summerar måtten under datainmatningen. Resultatet kan bli:
Country Region Sales Kanada Alberta 100 NULL Alberta 100 Kanada British Columbia 500 NULL British Columbia 500 USA Montana 100 NULL Montana 100 NULL NULL 700 Kanada NULL 600 USA NULL 100 (Country=Canada, Region=NULL, Sales=600)innebär att summan av Försäljning i Kanada (alla regioner) är 600.Följande är omvandlingen i SQL språk.
SELECT dimension_1, dimension_2, ... dimension_n, sum (metrics_1) AS metrics_1, sum (metrics_2) AS metrics_2, ... sum (metrics_n) AS metrics_n FROM each_timestamp_data GROUP BY CUBE (dimension_1, dimension_2, ..., dimension_n);Tänk på följande innan du använder funktionen Automatisk sammanslagning:
- Om du vill använda SUM för att aggregera dina data kontrollerar du att dina mått är additiva i varje dimension. Här följer några exempel på icke-additiva mått:
- Bråkbaserade mått. Detta inkluderar förhållandet, procent osv. Du bör till exempel inte lägga till den relativa frekvensen för varje delstat för att beräknaarbetsfrekvensen i hela landet.
- Överlappa i dimension. Du bör till exempel inte lägga till antalet personer i varje sport för att beräkna antalet personer som gillar sport, eftersom det finns en överlappning mellan dem, en person kan gilla flera sporter.
- För att säkerställa hälsan för hela systemet är kubens storlek begränsad. För närvarande är gränsen 1 000 000. Om dina data överskrider den gränsen misslyckas inmatningen för den tidsstämpeln.
- Om du vill använda SUM för att aggregera dina data kontrollerar du att dina mått är additiva i varje dimension. Här följer några exempel på icke-additiva mått:
Avancerade inställningar
Det finns flera avancerade inställningar för att aktivera data som matas in på ett anpassat sätt, till exempel att ange inmatningsförskjutning eller samtidighet. Mer information finns i avsnittet avancerade inställningar i artikeln om hantering av dataflöde.
Ange ett namn för dataflödet och kontrollera inmatningsförloppet
Ge dataflödet ett anpassat namn som visas på din arbetsyta. Klicka sedan på Skicka. På informationssidan för datafeeden kan du använda förloppsfältet för inmatning för att visa statusinformation.
Så här kontrollerar du information om datainmatningsfel:
- Klicka på Visa information.
- Klicka på Status och välj sedan Misslyckades eller Fel.
- Hovra över en misslyckad inmatning och visa informationsmeddelandet som visas.
En misslyckad status anger att datakällans inmatning kommer att göras igen senare. Statusen Fel Metrics Advisor anger att det inte går att göra ett nytt försök för datakällan. Om du vill läsa in data igen måste du utlösa en återfyllning/återinläsning manuellt.
Du kan också läsa in förloppet för en inmatning igen genom att klicka på Uppdatera förlopp. När datainmatningen är klar kan du klicka på mått och kontrollera resultatet av avvikelseidentifiering.