Two-Class Bayes-punt machine

Hiermee maakt u een binair classificatie model voor een Bayes-punt machine

Categorie: model/classificatie machine learning/initialiseren

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

Module overzicht

In dit artikel wordt beschreven hoe u de Bayes-machine module met twee klassen gebruikt in azure machine learning Studio (klassiek) om een niet-getraind binair classificatie model te maken.

Het algoritme in deze module maakt gebruik van een Bayesiaanse benadering van lineaire classificatie, de zogenaamde ' Bayes-punt machine '. Dit algoritme heeft een efficiënte benadering van het theoretisch optimale Bayesiaanse gemiddelde van lineaire classificaties (in termen van de prestaties van de generalisatie) door één ' gemiddelde ' classificatie te kiezen, het Bayes-punt. Omdat de Bayes-punt machine een Bayesiaanse-classificatie model is, is het niet gevoelig voor de aanpassing van de trainings gegevens.

Zie voor meer informatie Chris loper in het micro Soft Machine Learning-Blog: InterProbabilistice-dering van onzekerheid.

Two-Class Bayes-punt machine configureren

  1. Voeg in Azure Machine Learning Studio (klassiek) de Bayes-machine module met twee klassen toe aan uw experiment. U kunt de module vinden onder machine learning, model initialiseren, classificatie.

  2. Voor het aantal trainings herhalingentypt u een getal om op te geven hoe vaak het algoritme voor het door geven van berichten wordt herhaald over de trainings gegevens. Normaal gesp roken moet het aantal iteraties worden ingesteld op een waarde in het bereik 5 – 100.

    Hoe hoger het aantal trainingens herhalingen, des te nauw keuriger de voor spellingen; de training gaat echter trager.

    Voor de meeste gegevens sets is de standaard instelling van 30 trainings herhalingen voldoende voor de algoritme om nauw keurige voor spellingen te maken. Soms kunnen nauw keurige voor spellingen worden gemaakt met behulp van minder iteraties. Voor gegevens sets met zeer gecorreleerde functies kunt u profiteren van meer trainings herhalingen.

  3. Selecteer de optie, Voeg biastoe als u een constante functie of bias wilt toevoegen aan elke instantie in training en voor spellingen.

    Met inbegrip van een bias is vereist wanneer de gegevens nog geen constante functie bevatten.

  4. Selecteer de optie, Geef onbekende waarden in categorische-functiesop om een groep te maken voor onbekende waarden.

    Als u deze optie uitschakelt, kan het model alleen de waarden accepteren die deel uitmaken van de trainings gegevens.

    Als u deze optie selecteert en onbekende waarden toestaat, kan het model minder nauw keurig zijn voor bekende waarden, maar dit kan betere voor spellingen bieden voor nieuwe (onbekende) waarden.

  5. Voeg een exemplaar van de module Train model en uw trainings gegevens toe.

  6. Koppel de trainings gegevens en de uitvoer van de Bayes-machine module met twee klassen aan de Train model -module en kies de kolom Label.

  7. Voer het experiment uit.

Resultaten

Nadat de training is voltooid, klikt u met de rechter muisknop op de uitvoer van de module Train model om de resultaten weer te geven:

  • Selecteer visualiserenom een samen vatting van de para meters van het model weer te geven, samen met het onderdeel gewichten dat is geleerd van training.

  • Als u het model voor later gebruik wilt opslaan, klikt u met de rechter muisknop op de uitvoer van het trein modelen selecteert u Opslaan als getraind model.

  • Als u voor spellingen wilt doen, gebruikt u het getrainde model als invoer voor de module score model .

    Het niet-trained model kan ook worden door gegeven aan kruislings valideren model voor kruis validatie op basis van een gegevensset met een label.

Voorbeelden

Als u wilt zien hoe de Two-Class Bayes-punt machine in machine learning wordt gebruikt, raadpleegt u deze voorbeeld experimenten in de Azure AI Gallery:

Technische opmerkingen

Deze sectie bevat implementatie details en veelgestelde vragen over dit algoritme.

Details van het oorspronkelijke onderzoek en de onderliggend theorie zijn beschikbaar in dit artikel (PDF): Bayes Point-machines, Herbert, Graepe en Campbell

Deze implementatie verbetert echter op verschillende manieren het oorspronkelijke algoritme:

Deze verbeteringen maken het Bayes-punt machine-classificatie model robuuster en eenvoudiger te gebruiken en u kunt de tijdrovende stap van het afstemmen van de para meters overs Laan.

Module parameters

Naam Bereik Type Standaard Beschrijving
Aantal opleidings herhalingen >= 1 Geheel getal 30 Het aantal iteraties opgeven dat moet worden gebruikt bij het trainen
Afwijking toevoegen Alle Boolean-waarde True Geef aan of er een constante functie of bias moet worden toegevoegd aan elk exemplaar
Onbekende waarden toestaan in categorische-functies Alle Boolean-waarde True Indien true, wordt er een extra niveau gemaakt voor elke kolom categorische. Alle niveaus in de test-gegevensset die niet beschikbaar zijn in de trainings gegevensset, worden toegewezen aan dit extra niveau.

Uitvoer

Naam Type Beschrijving
Niet-traind model ILearner-interface Een niet-getraind binair classificatie model

Zie ook

Classificatie a-Z module lijst