Delen via


Taalondersteuning voor aangepaste tekstanalyse voor de status

Gebruik dit artikel voor meer informatie over de talen die momenteel worden ondersteund door Gepersonaliseerde gezondheids-Tekstanalyse.

Meertalige optie

Met Gepersonaliseerde gezondheids-Tekstanalyse kunt u een model in één taal trainen en dit gebruiken om entiteiten te extraheren uit documenten in andere talen. Met deze functie hoeft u geen afzonderlijke projecten voor elke taal te bouwen en in plaats daarvan uw gegevenssets te combineren in één project, zodat u uw projecten eenvoudig kunt schalen naar meerdere talen. U kunt uw project volledig trainen met Engelse documenten en er query's op uitvoeren: Frans, Duits, Italiaans en andere. U kunt de meertalige optie inschakelen als onderdeel van het proces voor het maken van een project of later via de projectinstellingen.

U hoeft niet voor elke taal hetzelfde aantal documenten toe te voegen. U moet het grootste deel van uw project in één taal bouwen en slechts enkele documenten toevoegen in talen waarvan u merkt dat ze niet goed presteren. Als u een project maakt dat voornamelijk in het Engels is en het gaat testen in het Frans, Duits en Spaans, ziet u mogelijk dat Duits niet zo goed presteert als de andere twee talen. In dat geval kunt u overwegen om 5% van uw oorspronkelijke Engelse documenten in het Duits toe te voegen, een nieuw model te trainen en opnieuw in het Duits te testen. Op de pagina voor gegevenslabels in Language Studio kunt u de taal selecteren van het document dat u toevoegt. Als het goed is, ziet u betere resultaten voor Duitse query's. Hoe meer gelabelde documenten u toevoegt, hoe groter de kans dat de resultaten worden verbeterd. Wanneer u gegevens in een andere taal toevoegt, moet u niet verwachten dat dit een negatieve invloed heeft op andere talen.

Hebreeuws wordt niet ondersteund in meertalige projecten. Als de primaire taal van het project Hebreeuws is, kunt u geen trainingsgegevens in andere talen toevoegen of een query uitvoeren op het model met andere talen. Als de primaire taal van het project niet Hebreeuws is, kunt u ook geen trainingsgegevens toevoegen in het Hebreeuws of een query uitvoeren op het model in het Hebreeuws.

Taalondersteuning

Aangepaste Text Analytics voor status ondersteunt .txt bestanden in de volgende talen:

Taal Taalcode
Engels en
Frans fr
Duits de
Spaans es
Italiaans it
Portugees (Portugal) pt-pt
Hebreeuws he

Volgende stappen