Nyelvfelismerési kognitív képesség
A Nyelvfelismerési képesség észleli a bemeneti szöveg nyelvét, és egyetlen nyelvi kódot jelent a kérelemben beküldött minden dokumentumhoz. A nyelvi kód az elemzés erősségét jelző pontszámmal van párosítva. Ez a képesség az Azure AI Nyelvben biztosított gépi tanulási modelleket használja.
Ez a képesség különösen akkor hasznos, ha a szöveg nyelvét más készségek (például hangulatelemzési vagy szövegfelosztási készség) bemeneteként kell megadnia.
A nyelvészlelés támogatott nyelveinek megtekintése. Ha a tartalom nem támogatott nyelven van kifejezve, a válasz a következő (Unknown)
: .
Megjegyzés:
Ez a képesség az Azure AI-szolgáltatásokhoz van kötve, és számlázható erőforrást igényel olyan tranzakciókhoz, amelyek indexelőnként naponta 20 dokumentumot meghaladóak. A beépített készségek végrehajtásáért a meglévő Azure AI-szolgáltatások használatalapú fizetéses díját számítjuk fel.
@odata.type
Microsoft.Skills.Text.LanguageDetectionSkill
Adatkorlátok
A rekord maximális méretének 50 000 karakternek kell lennie a mért érték szerint String.Length
. Ha fel kell szakítania az adatokat, mielőtt a nyelvfelismerési képességnek küldené, használhatja a Szöveg felosztása készséget.
Képességparaméterek
A paraméterek megkülönböztetik a kis- és nagybetűket.
Inputs | Leírás |
---|---|
defaultCountryHint |
(Nem kötelező) Az ISO 3166-1 alfa-2 kétbetűs országkód a nyelvészlelési modellre mutató tippként használható, ha nem tudja egyértelműsíteni a nyelvet. A paramétert defaultCountryHint olyan dokumentumokkal használja, amelyek nem adják meg explicit módon a countryHint bemenetet. |
modelVersion |
(Nem kötelező) Megadja a modell nyelvfelismerés hívásához használandó verzióját. Ha nincs megadva, alapértelmezés szerint a legújabb elérhető. Javasoljuk, hogy csak akkor adja meg ezt az értéket, ha szükséges. |
Készségbemenetek
A paraméterek megkülönböztetik a kis- és nagybetűket.
Inputs | Leírás |
---|---|
text |
Az elemezni kívánt szöveg. |
countryHint |
Egy ISO 3166-1 alfa-2 kétbetűs országkód, amely a nyelvészlelési modellre mutató tippként szolgál, ha nem tudja egyértelműsíteni a nyelvet. |
Képességkimenetek
Kimeneti név | Leírás |
---|---|
languageCode |
Az azonosított nyelv ISO 6391 nyelvi kódja. Például: "en". |
languageName |
A nyelv neve. Például: "Angol". |
score |
0 és 1 közötti érték. A nyelv helyes azonosításának valószínűsége. A pontszám 1-nél alacsonyabb lehet, ha a mondat vegyes nyelveket is tartalmazhat. |
Mintadefiníció
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"inputs": [
{
"name": "text",
"source": "/document/text"
},
{
"name": "countryHint",
"source": "/document/countryHint"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "myLanguageCode"
},
{
"name": "languageName",
"targetName": "myLanguageName"
},
{
"name": "score",
"targetName": "myLanguageScore"
}
]
}
Példabemenet
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
},
{
"recordId": "3",
"data":
{
"text": "impossible",
"countryHint": "fr"
}
}
]
Példakimenet
{
"values": [
{
"recordId": "1",
"data":
{
"languageCode": "en",
"languageName": "English",
"score": 1,
}
},
{
"recordId": "2",
"data":
{
"languageCode": "es",
"languageName": "Spanish",
"score": 1,
}
},
{
"recordId": "3",
"data":
{
"languageCode": "fr",
"languageName": "French",
"score": 1,
}
}
]
}