Udostępnij za pośrednictwem


Umiejętność poznawcza tłumaczenia tekstu

Umiejętność tłumaczenia tekstu ocenia tekst, a dla każdego rekordu zwraca tekst przetłumaczony na określony język docelowy. Ta umiejętność korzysta z interfejsu API tłumaczenia tekstu w usłudze Translator w wersji 3.0 dostępnej w usługach azure AI.

Ta funkcja jest przydatna, jeśli spodziewasz się, że dokumenty mogą nie znajdować się w jednym języku, w takim przypadku można znormalizować tekst do jednego języka przed indeksowaniem wyszukiwania, tłumacząc go. Jest to również przydatne w przypadku przypadków użycia lokalizacji, w których może być konieczne posiadanie kopii tego samego tekstu dostępnego w wielu językach.

Interfejs API tłumaczenia tekstu w usłudze Translator w wersji 3.0 to nie regionalna usługa Azure AI, co oznacza, że dane nie mają gwarancji, że pozostaną w tym samym regionie co usługa Azure AI Search lub dołączony zasób usług Azure AI.

Uwaga

Ta umiejętność jest powiązana z usługami azure AI i wymaga rozliczanego zasobu dla transakcji, które przekraczają 20 dokumentów na indeksator dziennie. Wykonanie wbudowanych umiejętności jest naliczane za istniejące usługi Azure AI z płatnością zgodnie z rzeczywistym użyciem.

W przypadku korzystania z tej umiejętności wszystkie dokumenty w źródle są przetwarzane i rozliczane za tłumaczenie, nawet jeśli języki źródłowe i docelowe są takie same. To zachowanie jest przydatne w przypadku obsługi wielu języków w tym samym dokumencie, ale może to spowodować niepotrzebne przetwarzanie. Aby uniknąć nieoczekiwanych opłat za rozliczenia z dokumentów, które nie wymagają przetwarzania, przed uruchomieniem umiejętności przenieś je z kontenera źródła danych.

@odata.type

Microsoft.Skills.Text.TranslationSkill

Limity danych

Maksymalny rozmiar rekordu powinien wynosić 50 000 znaków mierzonych przez String.Lengthwartość . Jeśli musisz podzielić dane przed wysłaniem ich do umiejętności tłumaczenia tekstu, rozważ użycie umiejętności dzielenia tekstu. Jeśli używasz umiejętności dzielenia tekstu, ustaw długość strony na 5000, aby uzyskać najlepszą wydajność.

Parametry umiejętności

W parametrach jest rozróżniana wielkość liter.

Dane wejściowe opis
defaultToLanguageCode (Wymagane) Kod języka do tłumaczenia dokumentów na dokumenty, które nie określają jawnie języka "do".
Zobacz pełną listę obsługiwanych języków.
defaultFromLanguageCode (Opcjonalnie) Kod języka do tłumaczenia dokumentów z dokumentów, które nie określają jawnie języka "from". Jeśli nie określono wartości domyślnejFromLanguageCode, automatyczne wykrywanie języka dostarczone przez interfejs API tłumaczenia tekstu w usłudze Translator będzie używane do określania języka "from".
Zobacz pełną listę obsługiwanych języków.
suggestedFrom (Opcjonalnie) Kod języka służący do tłumaczenia dokumentów z lokalizacji lub fromLanguageCodedefaultFromLanguageCode nieokreślonej, a automatyczne wykrywanie języka kończy się niepowodzeniem. Jeśli sugerowany językFrom nie zostanie określony, język angielski (en) będzie używany jako sugerowany językFrom.
Zobacz pełną listę obsługiwanych języków.

Dane wejściowe umiejętności

Nazwa danych wejściowych opis
text Tekst do tłumaczenia.
toLanguageCode Ciąg wskazujący język, na który ma zostać przetłumaczony tekst. Jeśli te dane wejściowe nie zostaną określone, wartość domyślnaToLanguageCode zostanie użyta do tłumaczenia tekstu.
Zobacz pełną listę obsługiwanych języków.
fromLanguageCode Ciąg wskazujący bieżący język tekstu. Jeśli ten parametr nie zostanie określony, zostanie użyty domyślnyFromLanguageCode (lub automatyczne wykrywanie języka, jeśli nie podano wartości domyślnejFromLanguageCode).
Zobacz pełną listę obsługiwanych języków.

Dane wyjściowe umiejętności

Nazwa danych wyjściowych opis
translatedText Wynik ciągu tłumaczenia tekstu z translatedFromLanguageCode do translatedToLanguageCode.
translatedToLanguageCode Ciąg wskazujący kod języka, na który został przetłumaczony tekst. Przydatne, jeśli tłumaczysz na wiele języków i chcesz mieć możliwość śledzenia tego, który język jest językiem.
translatedFromLanguageCode Ciąg wskazujący kod języka, z którego przetłumaczono tekst. Przydatne, jeśli została wybrana opcja automatycznego wykrywania języka, ponieważ te dane wyjściowe dają wynik tego wykrywania.

Przykładowa definicja

 {
    "@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
    "defaultToLanguageCode": "fr",
    "suggestedFrom": "en",
    "context": "/document",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      }
    ],
    "outputs": [
      {
        "name": "translatedText",
        "targetName": "translatedText"
      },
      {
        "name": "translatedFromLanguageCode",
        "targetName": "translatedFromLanguageCode"
      },
      {
        "name": "translatedToLanguageCode",
        "targetName": "translatedToLanguageCode"
      }
    ]
  }

Przykładowe dane wejściowe

{
  "values": [
    {
      "recordId": "1",
      "data":
        {
          "text": "We hold these truths to be self-evident, that all men are created equal."
        }
    },
    {
      "recordId": "2",
      "data":
        {
          "text": "Estamos muy felices de estar con ustedes."
        }
    }
  ]
}

Przykładowe dane wyjściowe

{
  "values": [
    {
      "recordId": "1",
      "data":
        {
          "translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
          "translatedFromLanguageCode": "en",
          "translatedToLanguageCode": "fr"
        }
    },
    {
      "recordId": "2",
      "data":
        {
          "translatedText": "Nous sommes très heureux d'être avec vous.",
          "translatedFromLanguageCode": "es",
          "translatedToLanguageCode": "fr"
        }
    }
  ]
}

Błędy i ostrzeżenia

Jeśli podasz nieobsługiwany kod języka dla języka "do" lub "from", zostanie wygenerowany błąd i tekst nie zostanie przetłumaczony. Jeśli tekst jest pusty, zostanie wygenerowane ostrzeżenie. Jeśli tekst jest większy niż 50 000 znaków, zostaną przetłumaczone tylko pierwsze 50 000 znaków, a zostanie wyświetlone ostrzeżenie.

Zobacz też