Общие сведения о распознавании языка, переводе и транслитерации
Давайте рассмотрим возможности azure AI Переводчик. Эти возможности включают:
Распознавание языка
Функцию обнаружения REST API можно использовать для обнаружения языка, на котором записывается текст.
Например, можно отправить следующий текст в конечную точку https://api.cognitive.microsofttranslator.com/detect?api-version=3.0
с помощью curl.
Вот текст, который мы хотим перевести:
{ 'Text' : 'こんにちは' }
Вот вызов с помощью curl к конечной точке для обнаружения языка текста:
curl -X POST "https://api.cognitive.microsofttranslator.com/detect?api-version=3.0" -H "Ocp-Apim-Subscription-Region: <your-service-region>" -H "Ocp-Apim-Subscription-Key: <your-key>" -H "Content-Type: application/json" -d "[{ 'Text' : 'こんにちは' }]
Ответ на этот запрос выглядит следующим образом, указывая, что текст написан на японском языке:
[
{
"language": "ja",
"score": 1.0,
"isTranslationSupported": true,
"isTransliterationSupported": true
}
]
Перевод текста
Чтобы перевести текст с одного языка на другой, используйте функцию перевода; укажите один из параметров для указания исходного языка и одного или нескольких параметров, чтобы указать языки, в которые требуется перевести текст.
Например, можно отправить тот же запрос JSON, который использовался ранее для определения языка, указав параметр from со значением ja (японский) и два параметра to со значениями en (английский) и fr (французский). Для этого необходимо вызвать следующее:
curl -X POST "https://api.cognitive.microsofttranslator.com/translate?api-version=3.0&from=ja&to=fr&to=en" -H "Ocp-Apim-Subscription-Key: <your-key>" -H "Ocp-Apim-Subscription-Region: <your-service-region>" -H "Content-Type: application/json; charset=UTF-8" -d "[{ 'Text' : 'こんにちは' }]"
Вы получите следующий результат:
[
{"translations":
[
{"text": "Hello", "to": "en"},
{"text": "Bonjour", "to": "fr"}
]
}
]
Транслитерация
Японский текст написан с помощью набора знаков хирагана. Поэтому вместо того, чтобы переводить этот текст на другой язык, может потребоваться преобразовать его в другой набор знаков, например, для отображения текста с помощью латинского алфавита (как в текстах на английском языке).
Для этого можно отправить японский текст в функцию Transliterate с параметром Jpan fromScript и параметром toScript Latn:
curl -X POST "https://api.cognitive.microsofttranslator.com/transliterate?api-version=3.0&fromScript=Jpan&toScript=Latn" -H "Ocp-Apim-Subscription-Key: <your-key>" -H "Ocp-Apim-Subscription-Region: <your-service-region>" -H "Content-Type: application/json" -d "[{ 'Text' : 'こんにちは' }]"
Ответ даст следующий результат:
[
{
"script": "Latn",
"text": "Kon'nichiwa"
}
]