Share via


Quickstart: Bouwen, publiceren en vertalen met aangepaste modellen

Translator is een cloudgebaseerde service voor neurale machinevertaling die deel uitmaakt van de Azure AI-servicesfamilie van REST API die kan worden gebruikt met elk besturingssysteem. Translator zorgt ervoor dat veel Microsoft-producten en -services die door duizenden bedrijven over de hele wereld worden gebruikt, taalvertalingen en andere taalgerelateerde bewerkingen uitvoeren. In deze quickstart leert u hoe u aangepaste oplossingen bouwt voor uw toepassingen in alle ondersteunde talen.

Vereisten

Als u de Custom Translator-portal wilt gebruiken, hebt u de volgende resources nodig:

  • Een Microsoft-account.

  • Azure-abonnement: Krijg een gratis abonnement

  • Zodra u een Azure-abonnement hebt, maakt u een Translator-resource in Azure Portal om uw sleutel en eindpunt op te halen. Nadat de app is geïmplementeerd, selecteert u Ga naar resource.

    • U hebt de sleutel en het eindpunt van de resource nodig om uw toepassing te verbinden met de Translator-service. Plak uw sleutel en eindpunt verderop in de code verderop in de quickstart. U vindt deze waarden op de pagina Azure Portal Sleutels en eindpunt:

      Schermopname: Azure Portal pagina sleutels en eindpunt.

Zie Een Translator-resource maken voor meer informatie.

Custom Translator-portal

Zodra u aan de bovenstaande vereisten voldoet, meldt u zich aan bij de Custom Translator-portal om werkruimten te maken, projecten te bouwen, bestanden te uploaden, modellen te trainen en uw aangepaste oplossing te publiceren.

U kunt een overzicht van vertaling en aangepaste vertaling lezen, enkele tips leren en een aan de slag-video watch in de technische blog van Azure AI.

Procesoverzicht

  1. Een werkruimte maken. Een werkruimte is een werkruimte voor het opstellen en bouwen van uw aangepaste vertaalsysteem. Een werkruimte kan meerdere projecten, modellen en documenten bevatten. Al het werk dat u in Custom Translator doet, wordt uitgevoerd in een specifieke werkruimte.

  2. Een project maken. Een project is een wrapper voor modellen, documenten en tests. Elk project bevat alle documenten die met het juiste taalpaar naar die werkruimte zijn geüpload. Als u bijvoorbeeld zowel een Engels-naar-Spaans-project als een Spaans-naar-Engels-project hebt, worden dezelfde documenten in beide projecten opgenomen.

  3. Parallelle documenten uploaden. Parallelle documenten zijn paren van documenten waarbij de ene (doel) de vertaling is van de andere (bron). Het ene document in het paar bevat zinnen in de brontaal en het andere document bevat zinnen die in de doeltaal zijn vertaald. Het maakt niet uit welke taal is gemarkeerd als 'bron' en welke taal is gemarkeerd als 'doel'. Een parallel document kan worden gebruikt om een vertaalsysteem in beide richtingen te trainen.

  4. Uw model trainen. Een model is het systeem dat vertaalt voor een specifiek taalpaar. Het resultaat van een geslaagde training is een model. Wanneer u een model traint, zijn drie documenttypen die elkaar wederzijds uitsluiten vereist: training, afstemming en testen. Als er alleen trainingsgegevens worden opgegeven bij het in de wachtrij plaatsen van een training, verzamelt Custom Translator automatisch afstemmings- en testgegevens. Er wordt een willekeurige subset van zinnen uit uw trainingsdocumenten gebruikt en deze zinnen worden uitgesloten van de trainingsgegevens zelf. Een parallelle zin van 10.000 is de minimale vereiste om een model te trainen.

  5. Test (menselijke evaluatie) uw model. De testset wordt gebruikt om de BLEU-score te berekenen. Deze score geeft de kwaliteit van uw vertaalsysteem aan.

  6. Uw getrainde model publiceren (implementeren). Uw aangepaste model wordt beschikbaar gesteld voor runtime-vertaalaanvragen.

  7. Tekst vertalen. Gebruik de cloudgebaseerde, veilige, krachtige en uiterst schaalbare Microsoft Translator Text API V3 om vertaalaanvragen te maken.

Een werkruimte maken

  1. Nadat u zich hebt aangemeld bij Custom Translator, wordt u gevraagd om toestemming om uw profiel te lezen van de Microsoft identity platform om uw gebruikerstoegangstoken en vernieuwingstoken aan te vragen. Beide tokens zijn nodig voor verificatie en om ervoor te zorgen dat u niet wordt afgemeld tijdens uw livesessie of tijdens het trainen van uw modellen.
    Selecteer Ja.

    Schermopname van het maken van een werkruimte.

  2. Selecteer Mijn werkruimten.

  3. Selecteer Een nieuwe werkruimte maken.

  4. Typ Contoso MT-modellen als Werkruimtenaam en selecteer Volgende.

  5. Selecteer 'Globaal' voor Resourceregio selecteren in de vervolgkeuzelijst.

  6. Kopieer/plak uw Translator Services-sleutel.

  7. Selecteer Next.

  8. Selecteer Gereed.

    Notitie

    De regio moet overeenkomen met de regio die is geselecteerd tijdens het maken van de resource. U kunt KEY 1 of KEY 2 gebruiken.

    Schermopname van de resourcesleutel.

    Schermopname van het maken van een werkruimte.

Een project maken

Zodra de werkruimte is gemaakt, gaat u naar de pagina Projecten .

U maakt een Engels-naar-Duits-project om een aangepast model te trainen met alleen een trainingsdocumenttype .

  1. Selecteer Project maken.

  2. Typ Engels-naar-Duits als Projectnaam.

  3. Selecteer Engels (en) als Brontaal in de vervolgkeuzelijst.

  4. Selecteer Duits (de) als Doeltaal in de vervolgkeuzelijst.

  5. Selecteer Algemeen voor Domein in de vervolgkeuzelijst.

  6. Selecteer Project maken.

    Schermopname van het maken van een project.

Documenten uploaden

Als u een aangepast model wilt maken, moet u alle documenttypen of een combinatie van trainings-, afstemmings-, test- en woordenlijstdocumenttypen uploaden.

In deze quickstart uploadt u trainingsdocumenten voor aanpassing.

Notitie

Voor deze quickstart kunt u onze voorbeeldgegevensset voor trainings-, woordgroeps- en zinswoordenlijsten gebruiken, voorbeeldgegevenssets van klanten van Engels-naar-Duits. Voor productie is het echter beter om uw eigen trainingsgegevensset te uploaden.

  1. Selecteer De naam van het Engels-naar-Duits-project .

  2. Selecteer Documenten beheren in het linkernavigatiemenu.

  3. Selecteer Documentenset toevoegen.

  4. Schakel het selectievakje Trainingsset in en selecteer Volgende.

  5. Laat parallelle documenten ingeschakeld en typ sample-English-German.

  6. Selecteer onder het bestand Bron (Engels - NL)de optie Door bestanden bladeren en selecteer sample-English-German-Training-en.txt.

  7. Selecteer onder Doelbestand (Duits - EN)de optie Door bestanden bladeren en selecteer sample-English-German-Training-de.txt.

  8. Selecteer Uploaden

    Notitie

    U kunt de gegevensset voorbeeldtermen en zinwoordenlijsten uploaden. U hoeft deze stap nog te voltooien.

    Schermopname van het uploaden van documenten.

Uw model trainen

Nu bent u klaar om uw Engels-naar-Duits-model te trainen.

  1. Selecteer Model trainen in het linkernavigatiemenu.

  2. Typ en-de met voorbeeldgegevens voor Modelnaam.

  3. Houd Volledige training gecontroleerd.

  4. Controleer onder Documenten selecterenvoorbeeld-Engels-Duits en controleer de trainingskosten die zijn gekoppeld aan het geselecteerde aantal zinnen.

  5. Selecteer Nu trainen.

  6. Selecteer Trainen om te bevestigen.

    Notitie

    Met meldingen wordt de modeltraining weergegeven die wordt uitgevoerd, bijvoorbeeld de gegevensstatus verzenden . Het trainingsmodel duurt enkele uren, afhankelijk van het aantal geselecteerde zinnen.

    Schermopname van het maken van een model.

  7. Nadat de modeltraining is geslaagd, selecteert u Modeldetails in het linkernavigatiemenu.

  8. Selecteer de modelnaam en-de met voorbeeldgegevens. Bekijk de datum/tijd van de training, de totale trainingstijd, het aantal zinnen dat is gebruikt voor training, afstemming, testen en woordenlijst. Controleer of het systeem de test- en afstemmingssets heeft gegenereerd. U gebruikt de Category ID om vertaalaanvragen te doen.

  9. Evalueer de bleu-score van het model. De testset BLEU-score is de score van het aangepaste model en Baseline BLEU is het vooraf getrainde basislijnmodel dat wordt gebruikt voor aanpassing. Een hogere BLEU-score betekent een hogere vertaalkwaliteit met behulp van het aangepaste model.

    Notitie

    Als u traint met onze gedeelde voorbeeldgegevenssets voor klanten, is de BLEU-score anders dan de afbeelding.

    Schermopname van modeldetails.

Uw model testen

Zodra de training is voltooid, controleert u de vertaalde zinnen van de testset.

  1. Selecteer Model testen in het linkernavigatiemenu.
  2. Selecteer 'en-de met voorbeeldgegevens'
  3. Menselijke evaluatie van vertaling van nieuw model (aangepast model) en basislijnmodel (onze vooraf getrainde basislijn die wordt gebruikt voor aanpassing) op basis van verwijzing (doelvertaling uit de testset)

Uw model publiceren

Als u uw model publiceert, is het beschikbaar voor gebruik met de Translator-API. Een project kan een of meer succesvol getrainde modellen hebben. U kunt slechts één model per project publiceren. U kunt echter een model publiceren naar een of meer regio's, afhankelijk van uw behoeften. Zie Translator-prijzen voor meer informatie.

  1. Selecteer Model publiceren in het linkernavigatiemenu.

  2. Selecteer en-de met voorbeeldgegevens en selecteer Publiceren.

  3. Controleer de gewenste regio(s).

  4. Selecteer Publiceren. De status moet worden gewijzigd van Implementeren naarGeïmplementeerd.

    Schermopname van het implementeren van een getraind model.

Tekst vertalen

  1. Ontwikkelaars moeten de gebruiken bij het Category ID maken van vertaalaanvragen met Microsoft Translator Text-API V3. Meer informatie over de Translator Text-API vindt u op de webpagina API-referentie.

  2. Zakelijke gebruikers kunnen onze gratis DocumentTranslator-app voor Windows downloaden en installeren.

Volgende stappen