Share via


Az adathalmazok ismertetése

A gépi tanulási modellek "tanulnak" a betanítási adatokban rögzített korábbi döntésekből és műveletekből. Ennek eredményeképpen a valós forgatókönyvekben való teljesítményüket nagy mértékben befolyásolják a betanított adatok. Ha egy adathalmazban a funkcióeloszlás elferdül, a modell helytelenül előrejelezheti az alulreprezentált csoporthoz tartozó adatpontokat, vagy nem megfelelő metrikák mentén optimalizálhatja azokat.

Míg például egy modell egy AI-rendszert tanít be a lakásárak előrejelzésére, a betanítási készlet az újabb házak 75 százalékát tette ki, amelyeknél alacsonyabbak voltak a medián árak. Ennek eredményeképpen sokkal kevésbé volt pontos a drágább történelmi házak sikeres azonosításában. A javítás az volt, hogy régebbi és drága házakat ad hozzá a betanítási adatokhoz, és bővítse a funkciókat, hogy betekintést nyerjen az előzményértékekbe. Ez az adatnagyobbítás javította az eredményeket.

A Felelős AI-irányítópult adatelemzési összetevője segít megjeleníteni az adathalmazokat az előrejelzett és tényleges eredmények, hibacsoportok és adott funkciók alapján. Segít azonosítani a túlreprezentálással és az alulreprezentációval kapcsolatos problémákat, valamint azt, hogy az adatok hogyan vannak fürtözve az adathalmazban. Az adatvizualizációk összesített diagramokból vagy egyéni adatpontokból állnak.

Mikor érdemes adatelemzést használni?

Adatelemzést akkor használjon, ha a következőkre van szüksége:

  • Az adathalmaz statisztikáinak megismeréséhez válasszon ki különböző szűrőket, hogy az adatokat különböző dimenziókba (más néven kohorszokba) szeletelje.
  • Az adathalmaz különböző kohorszok és szolgáltatáscsoportok közötti elosztásának megismerése.
  • Állapítsa meg, hogy a méltányossággal, a hibaelemzéssel és az okozatisággal kapcsolatos (más irányítópult-összetevőkből származó) megállapítások az adathalmaz eloszlásából származnak-e.
  • Döntse el, hogy mely területeken gyűjtsön több adatot a reprezentációs problémákból, a címkezajból, a funkciózajból, a címke torzításából és hasonló tényezőkből eredő hibák elhárításához.

Következő lépések