Tartalomalapú javaslati rendszer létrehozása

Azure Databricks
Azure Machine Learning

Megoldási ötletek

Ez a cikk egy megoldási ötlet. Ha azt szeretné, hogy további információkkal bővítsük a tartalmat, például a lehetséges használati eseteket, alternatív szolgáltatásokat, megvalósítási szempontokat vagy díjszabási útmutatást, a GitHub visszajelzésével tudassa velünk.

Javaslatok számos vállalat számára kulcsfontosságú bevételt jelentenek, és különböző iparágakban használják, például a kiskereskedelemben, a hírekben és a médiában. Az ügyféltevékenységre vonatkozó nagy mennyiségű adat rendelkezésre állásával gépi tanulással rendkívül releváns javaslatokat adhat.

Felépítés

Architectural diagram that shows training, evaluation, and development of a machine learning model for content-based personalization that uses Azure Databricks.

Töltse le az architektúra PowerPoint-fájlját.

Adatfolyam

  1. Tárolja. Az Azure Data Lake Storage nagy mennyiségű adatot tárol a felhasználók és a fogyasztók viselkedéséről.

  2. Olvasni. Az Azure Databricks csatlakozik az Azure Data Lake Storage-hoz, és onnan olvas. A Databricksbe való betöltés lehetővé teszi az előfeldolgozást és a betanítást a modell regisztrálásához.

  3. Előfeldolgozás. Az adatok előfeldolgozása megtisztítja, átalakítja és előkészíti az adatokat a javaslati rendszermodellbe való betápláláshoz.

  4. Vonat. A betanításnak két lépése van: a funkciófejlesztés és a modell betanítása. A modell betanítása során az Azure Databricks az előre feldolgozott adatkészletet használja a legjobb javaslatmodell betanítására és viselkedésének magyarázatára.

  5. Postprocess. Az utófeldolgozás magában foglalja a modell kiértékelését és kiválasztását annak alapján, hogy melyik modell teljesít a legjobban.

  6. Deploy. Az Azure Databricks fenntartja a modellt. A Batch által felügyelt végpontok üzembe helyezik a modellt az előtérbeli megjelenítésnek való kitettség érdekében. A modell üzembe helyezésekor az új adatok új végpontokon keresztül érhetők el. A batch és a közel valós idejű javaslatok támogatottak.

  7. Írni. A felhasználói felületek, például a webalkalmazások, felhasználhatják a tárolt modell eredményeit. Az eredmények az Azure Synapse-ban vannak megírva és rögzítve. A modell kötegelt következtetésként fut, és az eredményeket a megfelelő adattárban tárolja.

Összetevők

Ez az architektúra a következő összetevőket használja:

  • Az Azure Data Lake Storage olyan tárolási képességek készlete, amelyek a big data-analitikához kapcsolódnak, és amelyek a fájlrendszer szemantikáját, a fájlszintű biztonságot és a skálázást biztosítják.

  • Az Azure Databricks egy felügyelt Apache Spark-fürt modellbetanításhoz és -értékeléshez.

  • Az Azure Synapse Analytics egy gyors, rugalmas és megbízható felhőbeli adattárház, amellyel rugalmasan és egymástól függetlenül skálázhatja, kiszámíthatja és tárolhatja a nagy mértékben párhuzamos feldolgozási architektúrát.

Forgatókönyv részletei

A cikkben ismertetett megközelítés egy tartalomalapú javaslati rendszer kiépítésére összpontosít. A javaslati rendszerek létrehozásának ajánlott eljárásairól további információt a GitHub ajánlóinak dokumentációjában és példáiban talál.

Ez a példaforgatókönyv bemutatja, hogyan automatizálhatja a gépi tanulást a tartalomalapú személyre szabás automatizálásához az ügyfelek számára. A megoldás az Azure Databricks használatával tanít be egy modellt, amely előrejelzi annak valószínűségét, hogy a felhasználó érdeklődni fog egy elem iránt. A kötegelt felügyelt végpontok előrejelzési szolgáltatásként telepítik a modellt. Ezzel a szolgáltatással személyre szabott javaslatokat hozhat létre az elemek rangsorolásával azon tartalom alapján, amely iránt a felhasználó valószínűleg érdeklődik.

Lehetséges használati esetek

Ez a megoldás ideális a kiskereskedelem számára. A következő használati esetekre vonatkozik:

  • Tartalomjavaslatok webhelyekhez és mobilalkalmazásokhoz
  • Termékjavaslatok e-kereskedelmi webhelyekhez
  • Megjelenített hirdetésjavaslatok webhelyekhez

Javaslati rendszerek típusai

A javaslati rendszereknek három fő típusa van:

  • Együttműködésen alapuló szűrés. Az együttműködésen alapuló szűrés azonosítja az ügyfelek viselkedésének hasonló mintáit, és olyan elemeket javasol, amelyekkel más hasonló ügyfelek is kapcsolatba léptek. Az együttműködésen alapuló szűrés előnye az adatok egyszerű létrehozása – a felhasználók adatokat hoznak létre, miközben az elemek és termékek listáját használják. Ezenkívül az ügyfelek felfedezhetik azokat az új elemeket és termékeket, amelyek nem a korábbi interakciókból válogatottak. Az együttműködésen alapuló szűrés hátránya azonban a hidegindítási probléma: mivel a felhasználók és az új ajánlatok közötti interakciók szűkösek, az újonnan hozzáadott elemeket nem egy olyan algoritmus javasolja, amely teljes mértékben az ügyfelek interakcióitól függ.

  • Tartalomalapú. A tartalomalapú javaslat az elemekre vonatkozó információkat használja az ügyfelek beállításainak megismeréséhez, és olyan elemeket javasol, amelyek tulajdonságokat osztanak meg azokkal az elemekkel, amelyekkel az ügyfél korábban kommunikált. A tartalomalapú javaslati rendszereket nem akadályozza a hidegindítási probléma, és alkalmazkodni tud az új elemek bevezetéséhez. A javaslatok azonban az ügyfél által használt eredeti elem funkcióira korlátozódnak.

  • Hibrid metódus. A javaslati rendszerek létrehozásának másik megközelítése a tartalomalapú és az együttműködésen alapuló szűrés ötvözése. Ez a rendszer a felhasználói értékelések és az elemekre vonatkozó információk alapján javasolja az elemeket. A hibrid megközelítés az együttműködésen alapuló szűrés és a tartalomalapú javaslat előnyeivel is rendelkezik.

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerző:

Egyéb közreműködő:

  • Andrew Ajaluwa | Programmenedzser
  • Gary Moore | Programozó/író

A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.

További lépések