Új regressziós modellek felfedezése

Befejeződött

A 2. leckében egy egyenes vonalat illesztettünk az adatpontokhoz. A regresszió azonban sokféle kapcsolathoz illeszkedhet, beleértve a több tényezővel rendelkezőket, valamint azokat, amelyekben az egyik tényező fontossága a másiktól függ.

Kísérletezés modellekkel

A regressziós modelleket gyakran azért választják, mert kis adatmintákkal dolgoznak, robusztusak, könnyen értelmezhetők, és sokféle létezik.

A lineáris regresszió a regresszió legegyszerűbb formája, a használt funkciók számának korlátozása nélkül. A lineáris regresszió számos formában jelenik meg, amelyeket gyakran a használt funkciók száma és a megfelelő görbe alakja nevez el.

A döntési fák lépésről lépésre közelítik meg a változók előrejelzését. Ha a kerékpárpéldára gondolunk, a döntési fa lehet az első olyan felosztási példa, amely a tavasz/nyár és az ősz/tél folyamán van, és a hét napja alapján készít előrejelzést. A tavaszi/nyári-hétfői kerékpárkölcsönzési díj napi 100, míg az őszi/téli-hétfői bérleti díj napi 20 lehet.

Az együttes algoritmusok nem csak egy döntési fát, hanem nagy számú fát is létrehoznak, így összetettebb adatokra vonatkozó jobb előrejelzéseket tesz lehetővé. Az együttes algoritmusokat, például a Random Forestet, erős előrejelzési képességeik miatt széles körben használják a gépi tanulásban és az adatelemzésben.

Az adattudósok gyakran kísérleteznek különböző modellek használatával. A következő gyakorlatban különböző típusú modellekkel kísérletezünk, hogy összehasonlítsuk, hogyan teljesítenek ugyanazon az adatokon.