مهارة اكتشاف اللغة المعرفية
تكتشف مهارة اكتشاف اللغة لغة نص الإدخال وتبلغ عن رمز لغة واحد لكل مستند يتم تقديمه بناء على الطلب. يتم إقران رمز اللغة بدرجة تشير إلى قوة التحليل. تستخدم هذه المهارة نماذج التعلم الآلي المتوفرة في Azure Cognitive Services for Language.
هذه الإمكانية مفيدة بشكل خاص عندما تحتاج إلى توفير لغة النص كمدخلات لمهارات أخرى (على سبيل المثال، مهارة تحليل المشاعر أو مهارة تقسيم النص).
راجع اللغات المعتمدة للكشف عن اللغة. إذا كان لديك محتوى تم التعبير عنه بلغة غير مدعومة، فستكون الاستجابة هي (Unknown).
ملاحظة
ترتبط هذه المهارة بالخدمات المعرفية وتتطلب موردا قابلا للفوترة للمعاملات التي تتجاوز 20 مستندا لكل مفهرس يوميا. يتم فرض رسوم على تنفيذ المهارات المضمنة بسعر الخدمات المعرفية الحالي للدفع أولا بأول.
@odata.type
Microsoft.Skills.Text.LanguageDetectionSkill
حدود البيانات
يجب أن يكون الحد الأقصى لحجم السجل 50000 حرف كما تم قياسه بواسطة String.Length. إذا كنت بحاجة إلى تقسيم بياناتك قبل إرسالها إلى مهارة اكتشاف اللغة، فيمكنك استخدام مهارة تقسيم النص.
معلمات المهارة
المعلمات حساسة لحالة الأحرف.
| الإدخالات | الوصف |
|---|---|
defaultCountryHint |
(اختياري) يمكن توفير رمز بلد ISO 3166-1 alpha-2 المكون من حرفين لاستخدامه كتلميح إلى نموذج اكتشاف اللغة إذا لم يتمكن من توضيح اللغة. على وجه التحديد، يتم استخدام المعلمة مع المستندات التي لا تحدد الإدخال defaultCountryHintcountryHint صراحة. |
modelVersion |
(اختياري) يحدد إصدار النموذج المطلوب استخدامه عند استدعاء اكتشاف اللغة. سيتم تعيينه افتراضيا إلى أحدث ما هو متاح عند عدم تحديده. نوصيك بعدم تحديد هذه القيمة إلا إذا كان ذلك ضروريا. |
مدخلات المهارات
المعلمات حساسة لحالة الأحرف.
| الإدخالات | الوصف |
|---|---|
text |
النص المراد تحليله. |
countryHint |
رمز بلد ISO 3166-1 alpha-2 مكون من حرفين لاستخدامه كتلميح إلى نموذج اكتشاف اللغة إذا لم يتمكن من توضيح اللغة. |
مخرجات المهارات
| اسم الإخراج | الوصف |
|---|---|
languageCode |
رمز لغة ISO 6391 للغة المحددة. على سبيل المثال ، "en". |
languageName |
اسم اللغة. على سبيل المثال "الإنجليزية". |
score |
قيمة بين 0 و 1. احتمال تحديد اللغة بشكل صحيح. قد تكون النتيجة أقل من 1 إذا كانت الجملة تحتوي على لغات مختلطة. |
نموذج تعريف
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"inputs": [
{
"name": "text",
"source": "/document/text"
},
{
"name": "countryHint",
"source": "/document/countryHint"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "myLanguageCode"
},
{
"name": "languageName",
"targetName": "myLanguageName"
},
{
"name": "score",
"targetName": "myLanguageScore"
}
]
}
عينة الإدخال
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
},
{
"recordId": "3",
"data":
{
"text": "impossible",
"countryHint": "fr"
}
}
]
عينة الإخراج
{
"values": [
{
"recordId": "1",
"data":
{
"languageCode": "en",
"languageName": "English",
"score": 1,
}
},
{
"recordId": "2",
"data":
{
"languageCode": "es",
"languageName": "Spanish",
"score": 1,
}
},
{
"recordId": "3",
"data":
{
"languageCode": "fr",
"languageName": "French",
"score": 1,
}
}
]
}