Cognitieve vaardigheid tekstomzetting

De vaardigheid Tekstvertaling evalueert tekst en retourneert voor elke record de tekst die naar de opgegeven doeltaal is vertaald. Deze vaardigheid maakt gebruik van de Vertalen Text-API v3.0 die beschikbaar is in Azure AI-services.

Deze mogelijkheid is handig als u verwacht dat uw documenten mogelijk niet allemaal in één taal staan. In dat geval kunt u de tekst normaliseren in één taal voordat u de zoekfunctie indexeert door deze te vertalen. Het is ook handig voor lokalisatiegebruiksvoorbeelden, waarbij u mogelijk kopieën wilt hebben van dezelfde tekst die beschikbaar is in meerdere talen.

De Vertalen Text-API v3.0 is een niet-regionale Azure AI-service, wat betekent dat uw gegevens niet gegarandeerd in dezelfde regio blijven als uw Azure AI Search-resource of gekoppelde Azure AI-servicesresource.

Notitie

Deze vaardigheid is gebonden aan Azure AI-services en vereist een factureerbare resource voor transacties die groter zijn dan 20 documenten per indexeerfunctie per dag. Voor de uitvoering van ingebouwde vaardigheden worden kosten in rekening gebracht voor de bestaande betalen per gebruik-prijs van Azure AI-services.

Wanneer u deze vaardigheid gebruikt, worden alle documenten in de bron verwerkt en gefactureerd voor vertaling, zelfs als de bron- en doeltalen hetzelfde zijn. Dit gedrag is handig voor ondersteuning in meerdere talen binnen hetzelfde document, maar dit kan leiden tot onnodige verwerking. Als u onverwachte factureringskosten wilt voorkomen voor documenten die geen verwerking nodig hebben, verplaatst u deze uit de gegevensbroncontainer voordat u de vaardigheid uitvoert.

@odata.type

Microsoft.Skills.Text.TranslationSkill

Gegevenslimieten

De maximale grootte van een record moet 50.000 tekens zijn, zoals gemeten door String.Length. Als u uw gegevens wilt opsplitsen voordat u deze naar de vaardigheid tekstvertaling verzendt, kunt u overwegen de vaardigheid Tekst splitsen te gebruiken. Als u een vaardigheid voor tekstsplitsing gebruikt, stelt u de paginalengte in op 5000 voor de beste prestaties.

Vaardigheidsparameters

Parameters zijn hoofdlettergevoelig.

Invoerwaarden Beschrijving
defaultToLanguageCode (Vereist) De taalcode waarnaar documenten moeten worden vertaald voor documenten die niet expliciet de 'naar'-taal opgeven.
Zie de volledige lijst met ondersteunde talen.
defaultFromLanguageCode (Optioneel) De taalcode waaruit documenten moeten worden vertaald voor documenten die niet expliciet de 'van'-taal opgeven. Als de defaultFromLanguageCode niet is opgegeven, wordt de automatische taaldetectie van de Vertalen Text-API gebruikt om de taal 'van' te bepalen.
Zie de volledige lijst met ondersteunde talen.
suggestedFrom (Optioneel) De taalcode voor het vertalen van documenten van indien fromLanguageCode of defaultFromLanguageCode niet opgegeven, en de automatische taaldetectie is mislukt. Als de suggestedFrom-taal niet is opgegeven, wordt Engels (en) gebruikt als de suggestedFrom-taal.
Zie de volledige lijst met ondersteunde talen.

Invoer van vaardigheden

Invoernaam Beschrijving
sms verzenden De te vertalen tekst.
toLanguageCode Een tekenreeks die de taal aangeeft waarin de tekst moet worden vertaald. Als deze invoer niet is opgegeven, wordt de defaultToLanguageCode gebruikt om de tekst te vertalen.
Zie de volledige lijst met ondersteunde talen.
fromLanguageCode Een tekenreeks die de huidige taal van de tekst aangeeft. Als deze parameter niet is opgegeven, wordt de defaultFromLanguageCode (of automatische taaldetectie als de defaultFromLanguageCode niet is opgegeven) gebruikt om de tekst te vertalen.
Zie de volledige lijst met ondersteunde talen.

Uitvoer van vaardigheden

Uitvoernaam Beschrijving
vertaalde tekst Het tekenreeksresultaat van de tekstomzetting van de vertaaldeFromLanguageCode naar de vertaaldeToLanguageCode.
translatedToLanguageCode Een tekenreeks die de taalcode aangeeft waarin de tekst is vertaald. Handig als u vertaalt naar meerdere talen en wilt kunnen bijhouden welke tekst welke taal is.
translatedFromLanguageCode Een tekenreeks die de taalcode aangeeft waaruit de tekst is vertaald. Handig als u hebt gekozen voor de optie voor automatische taaldetectie, omdat deze uitvoer u het resultaat van die detectie geeft.

Voorbeelddefinitie

 {
    "@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
    "defaultToLanguageCode": "fr",
    "suggestedFrom": "en",
    "context": "/document",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      }
    ],
    "outputs": [
      {
        "name": "translatedText",
        "targetName": "translatedText"
      },
      {
        "name": "translatedFromLanguageCode",
        "targetName": "translatedFromLanguageCode"
      },
      {
        "name": "translatedToLanguageCode",
        "targetName": "translatedToLanguageCode"
      }
    ]
  }

Voorbeeldinvoer

{
  "values": [
    {
      "recordId": "1",
      "data":
        {
          "text": "We hold these truths to be self-evident, that all men are created equal."
        }
    },
    {
      "recordId": "2",
      "data":
        {
          "text": "Estamos muy felices de estar con ustedes."
        }
    }
  ]
}

Voorbeelduitvoer

{
  "values": [
    {
      "recordId": "1",
      "data":
        {
          "translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
          "translatedFromLanguageCode": "en",
          "translatedToLanguageCode": "fr"
        }
    },
    {
      "recordId": "2",
      "data":
        {
          "translatedText": "Nous sommes très heureux d'être avec vous.",
          "translatedFromLanguageCode": "es",
          "translatedToLanguageCode": "fr"
        }
    }
  ]
}

Fouten en waarschuwingen

Als u een niet-ondersteunde taalcode opgeeft voor de taal 'naar' of 'van', wordt er een fout gegenereerd en wordt tekst niet vertaald. Als uw tekst leeg is, wordt er een waarschuwing gegenereerd. Als uw tekst groter is dan 50.000 tekens, worden alleen de eerste 50.000 tekens vertaald en wordt er een waarschuwing weergegeven.

Zie ook