Så här gör du: Publicera dina måttdata till Metrics Advisor

Använd den här artikeln om du vill veta mer om hur du Metrics Advisor.

Krav och konfiguration för datascheman

Azure Metrics Advisor är en tjänst för avvikelseidentifiering, diagnostik och analys i tidsserier. Som en AI-driven tjänst använder den dina data för att träna den modell som används. Tjänsten accepterar tabeller med aggregerade data med följande kolumner:

  • Mått (krävs): Ett mått är en grundläggande eller enhetsspecifik term och ett kvantifierbart värde för måttet. Det innebär en eller flera kolumner som innehåller numeriska värden.
  • Tidsstämpel (valfritt): Noll eller en kolumn, med typen DateTime eller String . När den här kolumnen inte anges anges tidsstämpeln som starttid för varje inmatningsperiod. Formatera tidsstämpeln på följande sätt: yyyy-MM-ddTHH:mm:ssZ .
  • Dimension (valfritt): En dimension är ett eller flera kategoriska värden. Kombinationen av dessa värden identifierar en viss univariate-tidsserie (till exempel land, språk och klient). Dimensionskolumnerna kan vara av valfri datatyp. Var försiktig när du arbetar med stora mängder kolumner och värden för att förhindra att för många dimensioner bearbetas.

Om du använder datakällor som Azure Data Lake Storage eller Azure Blob Storage kan du aggregera dina data så att de överensstämmer med ditt förväntade måttschema. Det beror på att dessa datakällor använder en fil som måttindata.

Om du använder datakällor som Azure SQL eller Azure Data Explorer kan du använda aggregeringsfunktioner för att aggregera data i det förväntade schemat. Det beror på att dessa datakällor stöder körning av en fråga för att hämta måttdata från källor.

Om du inte är säker på några av villkoren kan du läsa ordlistan.

Undvik att läsa in partiella data

Partiella data orsakas av inkonsekvenser mellan data som lagras Metrics Advisor och datakällan. Detta kan inträffa när datakällan uppdateras när Metrics Advisor har slutfört data. Metrics Advisor hämtar endast data från en viss datakälla en gång.

Om ett mått till exempel har Metrics Advisor övervakning. Metrics Advisor hämtar måttdata vid tidsstämpel A och utför avvikelseidentifiering på den. Men om måttdata för den specifika tidsstämpeln A har uppdaterats efter att data har matats in. Nytt datavärde hämtas inte.

Du kan försöka återfylla historiska data (beskrivs senare) för att minimera inkonsekvenser, men detta utlöser inte nya avvikelseaviseringar om aviseringar för dessa tidpunkter redan har utlösts. Den här processen kan lägga till ytterligare arbetsbelastningar i systemet och är inte automatisk.

För att undvika inläsning av partiella data rekommenderar vi två metoder:

  • Generera data i en transaktion:

    Se till att måttvärdena för alla dimensionskombinationer vid samma tidsstämpel lagras till datakällan i en transaktion. I exemplet ovan väntar du tills data från alla datakällor är klara och läser in dem i Metrics Advisor i en transaktion. Metrics Advisor kan avssöka dataflödet regelbundet tills data har hämtats (eller delvis) har hämtats.

  • Fördröj datainmatningen genom att ange ett korrekt värde för parametern för förskjutning av inmatningstid:

    Ange förskjutningsparametern för inmatningstid för ditt dataflöde så att inmatningen fördröjs tills data är helt förberedda. Detta kan vara användbart för vissa datakällor som inte stöder transaktioner, till exempel Azure Table Storage. Mer information finns i avancerade inställningar.

Börja med att lägga till ett dataflöde

När du har loggat in Metrics Advisor-portalen och valt din arbetsyta klickar du på Kom igång. Klicka sedan på Lägg till dataflöde på den vänstra menyn på arbetsytans huvudsida.

Lägga till anslutningsinställningar

1. Grundläggande inställningar

Nu ska du ange en uppsättning parametrar för att ansluta din tidsseriedatakälla.

  • Källtyp: Den typ av datakälla där dina tidsseriedata lagras.
  • Kornighet: Intervallet mellan på varandra följande datapunkter i dina tidsseriedata. För Metrics Advisor stöd för: Varje år, Varje månad, Varje vecka, Varje dag, Varje timme och Anpassad. Det lägsta intervallet som anpassningsalternativet stöder är 300 sekunder.
    • Sekunder: Antalet sekunder när granularityName är inställt på Anpassa.
  • Mata in data sedan (UTC): Starttiden för baslinjen för datainmatning. startOffsetInSeconds används ofta för att lägga till en offset för att hjälpa till med datakonsekvens.

2. Ange anslutningssträng

Därefter måste du ange anslutningsinformationen för datakällan. Mer information om de andra fälten och hur du ansluter olika typer av datakällor finns i How-to: Anslut different data sources.

3. Ange fråga för en enskild tidsstämpel

Mer information om olika typer av datakällor finns i Så här gör du: Anslut olika datakällor.

Läsa in data

När anslutningssträngen och frågesträngen har matats in väljer du Läs in data. I den här Metrics Advisor kontrollerar du anslutningen och behörigheten för att läsa in data, kontrollerar nödvändiga parametrar ( och ) som måste användas i frågan och kontrollerar kolumnnamnet från @IntervalStart @IntervalEnd datakällan.

Om det finns ett fel i det här steget:

  1. Kontrollera först om anslutningssträngen är giltig.
  2. Kontrollera sedan om det finns tillräckliga behörigheter och att inmatningsarbetarens IP-adress har beviljats åtkomst.
  3. Kontrollera sedan om nödvändiga parametrar ( @IntervalStart och ) används i din @IntervalEnd fråga.

Schemakonfiguration

När dataschemat har lästs in väljer du lämpliga fält.

Om tidsstämpeln för en datapunkt utelämnas använder Metrics Advisor tidsstämpeln när datapunkten matas in i stället. För varje dataflöde kan du ange högst en kolumn som en tidsstämpel. Om du får ett meddelande om att en kolumn inte kan anges som en tidsstämpel kontrollerar du din fråga eller datakälla och om det finns flera tidsstämplar i frågeresultatet – inte bara i förhandsgranskningsdata. När du utför datainmatning kan Metrics Advisor bara använda ett segment (till exempel en dag, en timme – enligt kornigheten) av tidsseriedata från den angivna källan varje gång.

Urval Beskrivning Kommentarer
Visningsnamn Namn som ska visas på arbetsytan i stället för det ursprungliga kolumnnamnet. Valfritt.
Timestamp Tidsstämpeln för en datapunkt. Om detta utelämnas Metrics Advisor du tidsstämpeln när datapunkten matas in i stället. För varje dataflöde kan du ange högst en kolumn som tidsstämpel. Valfritt. Bör anges med högst en kolumn. Om du får en kolumn som inte kan anges som tidsstämpelfel kontrollerar du om det finns dubbletter av tidsstämplar i din fråga eller datakälla.
Mått De numeriska värdena i dataflödet. För varje dataflöde kan du ange flera mått, men minst en kolumn ska väljas som mått. Bör anges med minst en kolumn.
Dimension Kategoriska värden. En kombination av olika värden identifierar en viss tidsserie med en dimension, till exempel land, språk, klientorganisation. Du kan välja noll eller flera kolumner som dimensioner. Obs! Var försiktig när du väljer en kolumn som inte är en sträng som en dimension. Valfritt.
Ignorera Ignorera den markerade kolumnen. Valfritt. För datakällor som stöder användning av en fråga för att hämta data finns det inget "Ignorera"-alternativ.

Om du vill ignorera kolumner rekommenderar vi att du uppdaterar din fråga eller datakälla för att undanta dessa kolumner. Du kan också ignorera kolumner med hjälp av Ignorera kolumner och sedan Ignorera för de specifika kolumnerna. Om en kolumn ska vara en dimension och av misstag anges som Ignorerad kan Metrics Advisor till att partiella data matas in. Anta till exempel att data från din fråga är som nedan:

Rad-ID Timestamp Land Språk Inkomst
1 2019/11/10 Kina ZH-CN 10000
2 2019/11/10 Kina EN-US 1000
3 2019/11/10 USA ZH-CN 12000
4 2019/11/11 USA EN-US 23000
... ... ... ... ...

Om Land är en dimension och Språk har angetts som Ignorerad får den första och andra raden samma dimensioner för en tidsstämpel. Metrics Advisor godtyckligt ett värde från de två raderna. Metrics Advisor aggregerar inte raderna i det här fallet.

När du har konfigurerat schemat väljer du Verifiera schema. I den här Metrics Advisor följande kontroller:

  • Om tidsstämpeln för efterfrågade data hamnar i ett enda intervall.
  • Om det finns dubblettvärden som returneras för samma dimensionskombination inom ett måttintervall.

Inställningar för automatisk sammanslagning

Viktigt

Om du vill aktivera rotorsaksanalys och andra diagnostikfunktioner måste inställningarna för automatisk sammanslagning konfigureras. När den har aktiverats går det inte att ändra inställningarna för automatisk sammanslagning.

Metrics Advisor kan automatiskt utföra aggregering (till exempel SUM, MAX, MIN) på varje dimension under inmatningen och skapar sedan en hierarki som ska användas i rotfallsanalys och andra diagnostikfunktioner.

Beakta följande scenarier:

  • "Jag behöver inte inkludera sammanslagningsanalysen för mina data."

    Du behöver inte använda den Metrics Advisor sammanslagningen.

  • "Mina data har redan återställts och dimensionsvärdet representeras av: NULL eller tom (standard), endast NULL, andra."

    Det här Metrics Advisor innebär att Metrics Advisor inte behöver samla in data eftersom raderna redan summeras. Om du till exempel bara väljer NULL visas den andra dataraden i exemplet nedan som en aggregering av alla länder och språket EN-US; Den fjärde dataraden som har ett tomt värde för Land visas dock som en vanlig rad som kan tyda på ofullständiga data.

    Land Språk Inkomst
    Kina ZH-CN 10000
    (NULL) EN-US 999999
    USA EN-US 12000
    EN-US 5000
  • "Jag Metrics Advisor samla mina data genom att beräkna Sum/Max/Min/Avg/Count och representera dem med {some string}."

    Vissa datakällor, till exempel Cosmos DB eller Azure Blob Storage stöder inte vissa beräkningar som gruppera efter eller kub. Metrics Advisor ger sammanslagningsalternativet att automatiskt generera en datakub under inmatningen. Det här alternativet innebär Metrics Advisor måste beräkna sammanslagningen med hjälp av den algoritm som du har valt och använda den angivna strängen för att representera sammanslagningen i Metrics Advisor. Detta ändrar inte några data i datakällan. Anta till exempel att du har en uppsättning tidsserier som står för Försäljningsmått med dimensionen (Land, Region). För en viss tidsstämpel kan den se ut så här:

    Country Region Sales
    Kanada Alberta 100
    Kanada British Columbia 500
    USA Montana 100

    När du har aktivera automatisk sammanslagning med summa Metrics Advisor du dimensionskombinationerna och summerar måtten under datainmatningen. Resultatet kan bli:

    Country Region Sales
    Kanada Alberta 100
    NULL Alberta 100
    Kanada British Columbia 500
    NULL British Columbia 500
    USA Montana 100
    NULL Montana 100
    NULL NULL 700
    Kanada NULL 600
    USA NULL 100

    (Country=Canada, Region=NULL, Sales=600) innebär att summan av Försäljning i Kanada (alla regioner) är 600.

    Följande är omvandlingen i SQL språk.

    SELECT
        dimension_1,
        dimension_2,
        ...
        dimension_n,
        sum (metrics_1) AS metrics_1,
        sum (metrics_2) AS metrics_2,
        ...
        sum (metrics_n) AS metrics_n
    FROM
        each_timestamp_data
    GROUP BY
        CUBE (dimension_1, dimension_2, ..., dimension_n);
    

    Tänk på följande innan du använder funktionen Automatisk sammanslagning:

    • Om du vill använda SUM för att aggregera dina data kontrollerar du att dina mått är additiva i varje dimension. Här följer några exempel på icke-additiva mått:
      • Bråkbaserade mått. Detta inkluderar förhållandet, procent osv. Du bör till exempel inte lägga till den relativa frekvensen för varje delstat för att beräknaarbetsfrekvensen i hela landet.
      • Överlappa i dimension. Du bör till exempel inte lägga till antalet personer i varje sport för att beräkna antalet personer som gillar sport, eftersom det finns en överlappning mellan dem, en person kan gilla flera sporter.
    • För att säkerställa hälsan för hela systemet är kubens storlek begränsad. För närvarande är gränsen 1 000 000. Om dina data överskrider den gränsen misslyckas inmatningen för den tidsstämpeln.

Avancerade inställningar

Det finns flera avancerade inställningar för att aktivera data som matas in på ett anpassat sätt, till exempel att ange inmatningsförskjutning eller samtidighet. Mer information finns i avsnittet avancerade inställningar i artikeln om hantering av dataflöde.

Ange ett namn för dataflödet och kontrollera inmatningsförloppet

Ge dataflödet ett anpassat namn som visas på din arbetsyta. Klicka sedan på Skicka. På informationssidan för datafeeden kan du använda förloppsfältet för inmatning för att visa statusinformation.

Förloppsfält för inmatning

Så här kontrollerar du information om datainmatningsfel:

  1. Klicka på Visa information.
  2. Klicka på Status och välj sedan Misslyckades eller Fel.
  3. Hovra över en misslyckad inmatning och visa informationsmeddelandet som visas.

Kontrollera misslyckad inmatning

En misslyckad status anger att datakällans inmatning kommer att göras igen senare. Statusen Fel Metrics Advisor anger att det inte går att göra ett nytt försök för datakällan. Om du vill läsa in data igen måste du utlösa en återfyllning/återinläsning manuellt.

Du kan också läsa in förloppet för en inmatning igen genom att klicka på Uppdatera förlopp. När datainmatningen är klar kan du klicka på mått och kontrollera resultatet av avvikelseidentifiering.

Nästa steg