Skapa datadrivna principer och påverka beslutsfattandet

Maskininlärningsmodeller är kraftfulla när det gäller att identifiera mönster i data och göra förutsägelser. Men de ger föga stöd för att uppskatta hur det verkliga resultatet förändras i närvaro av ett ingripande.

Utövare har blivit alltmer fokuserade på att använda historiska data för att informera sina framtida beslut och affärsinterventioner. Hur skulle till exempel intäkterna påverkas om ett företag följde en ny prisstrategi? Skulle en ny medicin förbättra en patients tillstånd, allt annat lika?

Komponenten för kausal slutsatsdragning i instrumentpanelen för ansvarsfull AI löser dessa frågor genom att uppskatta effekten av en funktion på ett utfall av intresse i genomsnitt, i en population eller en kohort och på en enskild nivå. Det hjälper också till att konstruera lovande interventioner genom att simulera funktionssvar på olika interventioner och skapa regler för att avgöra vilka populationskohorter som skulle dra nytta av ett ingripande. Tillsammans gör dessa funktioner det möjligt för beslutsfattare att tillämpa nya policyer och driva verkliga förändringar.

Funktionerna i den här komponenten kommer från EconML-paketet . Den beräknar heterogena behandlingseffekter från observationsdata via dubbel maskininlärningsteknik .

Använd orsakssamband när du behöver:

  • Identifiera de funktioner som har den mest direkta effekten på ditt intresseresultat.
  • Bestäm vilken övergripande behandlingspolicy som ska tillämpas för att maximera den verkliga effekten på ett intresseutfall.
  • Förstå hur individer med vissa funktionsvärden skulle reagera på en viss behandlingsprincip.

Hur genereras kausala slutsatsdragningsinsikter?

Kommentar

Endast historiska data krävs för att generera kausala insikter. De kausala effekter som beräknas baserat på behandlingsfunktionerna är enbart en dataegenskap. Därför är en tränad modell valfri när du beräknar kausala effekter.

Dubbel maskininlärning är en metod för att uppskatta heterogena behandlingseffekter när alla potentiella confounders/kontroller (faktorer som samtidigt hade en direkt effekt på behandlingsbeslutet i insamlade data och det observerade resultatet) observeras, men något av följande problem finns:

  • Det finns för många för att klassiska statistiska metoder ska vara tillämpliga. De är alltså högdimensionella.
  • Deras effekt på behandlingen och resultatet kan inte modelleras på ett tillfredsställande sätt med parametriska funktioner. De är alltså inte parametriska.

Du kan använda maskininlärningstekniker för att lösa båda problemen. Ett exempel finns i Chernozhukov2016.

Dubbel maskininlärning minskar problemet genom att först beräkna två förutsägande uppgifter:

  • Förutsäga resultatet från kontrollerna
  • Förutsäga behandlingen från kontrollerna

Sedan kombinerar metoden dessa två förutsägelsemodeller i en uppskattning i slutfasen för att skapa en modell av den heterogena behandlingseffekten. Med den här metoden kan godtyckliga maskininlärningsalgoritmer användas för de två förutsägande uppgifterna samtidigt som många gynnsamma statistiska egenskaper som är relaterade till den slutliga modellen bibehålls. Dessa egenskaper omfattar små genomsnittliga kvadratfel, asymptotisk normalitet och konstruktion av konfidensintervall.

Vilka andra verktyg tillhandahåller Microsoft för kausal slutsatsdragning?

  • Project Azua tillhandahåller ett nytt ramverk som fokuserar på slutpunkt till slutpunkt-orsakssamband.

    Azuas DECI-teknik (deep end-to-end causal inference) är en enda modell som samtidigt kan göra kausal identifiering och kausal slutsatsdragning. Användaren tillhandahåller data och modellen kan mata ut kausala relationer mellan alla variabler.

    Den här metoden kan i sig ge insikter om data. Det möjliggör beräkning av mått som individuell behandlingseffekt (ITE), genomsnittlig behandlingseffekt (ATE) och villkorlig genomsnittlig behandlingseffekt (CATE). Du kan sedan använda dessa beräkningar för att fatta optimala beslut.

    Ramverket är skalbart för stora data, både när det gäller antalet variabler och antalet datapunkter. Den kan också hantera saknade dataposter med blandade statistiska typer.

  • EconML driver serverdelen av instrumentpanelen för ansvarsfull AI-instrumentpanelens komponent för kausal slutsatsdragning. Det är ett Python-paket som använder maskininlärningstekniker för att uppskatta individualiserade kausala svar från observationsdata eller experimentella data.

    Serien med skattningsmetoder i EconML representerar de senaste framstegen inom kausal maskininlärning. Genom att införliva enskilda maskininlärningssteg i tolkningsbara kausala modeller förbättrar dessa metoder tillförlitligheten för förutsägelser om vad som händer och gör kausal analys snabbare och enklare för en bred uppsättning användare.

  • DoWhy är ett Python-bibliotek som syftar till att skapa kausalt tänkande och analys. DoWhy tillhandahåller ett principbaserat fyrastegsgränssnitt för kausal slutsatsdragning som fokuserar på att uttryckligen modellera kausala antaganden och validera dem så mycket som möjligt.

    Den viktigaste funktionen i DoWhy är dess toppmoderna referens-API som automatiskt kan testa kausala antaganden för alla skattningsmetoder. Det gör slutsatsdragningen mer robust och tillgänglig för icke-experter.

    DoWhy stöder uppskattning av den genomsnittliga kausala effekten för bakdörrar, ytterdörrar, instrumentvariabler och andra identifieringsmetoder. Det stöder också uppskattning av CATE genom en integrering med EconML-biblioteket.

Nästa steg