Общие сведения о распознавании языка, переводе и транслитерации

Завершено

Давайте рассмотрим возможности azure AI Переводчик. Эти возможности включают:

Распознавание языка

Функцию обнаружения REST API можно использовать для обнаружения языка, на котором записывается текст.

Например, можно отправить следующий текст в конечную точку https://api.cognitive.microsofttranslator.com/detect?api-version=3.0 с помощью curl.

Вот текст, который мы хотим перевести:

{ 'Text' : 'こんにちは' }

Вот вызов с помощью curl к конечной точке для обнаружения языка текста:

curl -X POST "https://api.cognitive.microsofttranslator.com/detect?api-version=3.0" -H "Ocp-Apim-Subscription-Region: <your-service-region>" -H "Ocp-Apim-Subscription-Key: <your-key>" -H "Content-Type: application/json" -d "[{ 'Text' : 'こんにちは' }]

Ответ на этот запрос выглядит следующим образом, указывая, что текст написан на японском языке:

[
  {
    "language": "ja",
    "score": 1.0,
    "isTranslationSupported": true,
    "isTransliterationSupported": true
    
    
   }
]

Перевод текста

Чтобы перевести текст с одного языка на другой, используйте функцию перевода; укажите один из параметров для указания исходного языка и одного или нескольких параметров, чтобы указать языки, в которые требуется перевести текст.

Например, можно отправить тот же запрос JSON, который использовался ранее для определения языка, указав параметр from со значением ja (японский) и два параметра to со значениями en (английский) и fr (французский). Для этого необходимо вызвать следующее:

curl -X POST "https://api.cognitive.microsofttranslator.com/translate?api-version=3.0&from=ja&to=fr&to=en" -H "Ocp-Apim-Subscription-Key: <your-key>" -H "Ocp-Apim-Subscription-Region: <your-service-region>" -H "Content-Type: application/json; charset=UTF-8" -d "[{ 'Text' : 'こんにちは' }]"

Вы получите следующий результат:

[
  {"translations": 
    [
      {"text": "Hello", "to": "en"},   
      {"text": "Bonjour", "to": "fr"}
    ]
  }
]

Транслитерация

Японский текст написан с помощью набора знаков хирагана. Поэтому вместо того, чтобы переводить этот текст на другой язык, может потребоваться преобразовать его в другой набор знаков, например, для отображения текста с помощью латинского алфавита (как в текстах на английском языке).

Для этого можно отправить японский текст в функцию Transliterate с параметром Jpan fromScript и параметром toScript Latn:

curl -X POST "https://api.cognitive.microsofttranslator.com/transliterate?api-version=3.0&fromScript=Jpan&toScript=Latn" -H "Ocp-Apim-Subscription-Key: <your-key>" -H "Ocp-Apim-Subscription-Region: <your-service-region>" -H "Content-Type: application/json" -d "[{ 'Text' : 'こんにちは' }]"

Ответ даст следующий результат:

[
    {
        "script": "Latn",
        "text": "Kon'nichiwa"
    }
]