Metin denetleme kavramlarını öğrenin
Metin içeriğini çözümlemek için Content Moderator metin denetleme modellerini kullanın.
İlkelerinize ve eşiklere göre içeriği engelleyebilir, onaylayabilir veya gözden geçirebilirsiniz (bkz. incelemeler, iş akışları ve işlere , insan incelemelerini ayarlama hakkında bilgi edinin). İş ortakları, çalışanlar ve tüketiciler tarafından metin içeriği üreten ortamların insan yönetimini artırmak için metin denetleme modellerini kullanın. Bu kapsama sohbet odaları, tartışma panoları, sohbet botları, e-ticaret katalogları ve belgeler dahildir.
Hizmet yanıtı aşağıdaki bilgileri içerir:
- Küfür: çeşitli dillerde yerleşik küfürlü terimleri yerleşik listesiyle terim tabanlı eşleştirme
- Sınıflandırma: üç kategoriye makine yardımlı sınıflandırma
- Kişisel veriler
- Otomatik düzeltilen metin
- Özgün metin
- Dil
Küfür
API, desteklenen dillerinherhangi birinde herhangi bir küfürlü terimi algılarsa, bu terimler yanıta dahil edilir. Yanıt, özgün metindeki konumunu () da içerir Index . ListIdAşağıdaki örnek JSON, varsa özel terim listelerinde bulunan terimleri ifade eder.
"Terms": [
{
"Index": 118,
"OriginalIndex": 118,
"ListId": 0,
"Term": "crap"
}
Not
Dil parametresi için, eng makine yardımlı Sınıflandırma yanıtını (Önizleme özelliği) görmek üzere boş bırakın veya boş bırakın. Bu özellik yalnızca İngilizce 'yi destekler.
Küfür terimleri algılama için, bu makalede listelenen desteklenen dillerin ISO 639-3 kodunu kullanın veya boş bırakın.
Sınıflandırma
Content Moderator makine yardımlı metin sınıflandırma özelliği yalnızca İngilizce'yi destekler ve istenmeyebilecek içerikleri algılamaya yardımcı olur. Bayrak eklenmiş içerik, bağlama bağlı olarak uygun şekilde değerlendirilemeyebilir. Her kategorinin oluşma olasılığını artırırken, bir insan incelemesi önermeyebilir. Özelliği, olası rahatsız edici, negatif veya Discriminatory dilini belirlemek için eğitilen bir model kullanır. Bu, gözden geçirilmek üzere Slang, kısaltılmış sözcükler, rahatsız edici ve bilerek yanlış yazılmış sözcükler içerir.
JSON ayıklamada aşağıdaki ayıklama örnek bir çıktı gösterir:
"Classification": {
"ReviewRecommended": true,
"Category1": {
"Score": 1.5113095059859916E-06
},
"Category2": {
"Score": 0.12747249007225037
},
"Category3": {
"Score": 0.98799997568130493
}
}
Açıklama
Category1belirli durumlarda cinsel açık veya yetişkin olarak değerlendirilen dilin potansiyel olma durumunu ifade eder.Category2, belirli durumlarda cinsel veya kötü bir şekilde düşünülmeyen dilin potansiyel olma durumunu gösterir.Category3belirli durumlarda rahatsız edici olarak değerlendirilen dilin potansiyel olma durumunu ifade eder.Score0 ile 1 arasındadır. Puan arttıkça, modelin daha yüksek olması kategorinin uygulanabilir olabileceğini tahmin edilir. Bu özellik el ile kodlanmış sonuçlar yerine istatistiksel bir model kullanır. Her kategorinin gereksinimlerinize göre nasıl hizalanacağını öğrenmek için kendi içeriklerinizi test etmenizi öneririz.ReviewRecommended, iç puan eşiklerine bağlı olarak doğru ya da yanlış şeklindedir. Müşteriler, bu değerin kullanılıp kullanılmayacağını ya da içerik ilkelerine bağlı olarak özel eşiklere karar vermesini değerlendirmelidir.
Kişisel veriler
Kişisel veriler özelliği, bu bilgilerin olası varlığını algılar:
- E-posta adresi
- ABD posta adresi
- IP Adresi
- ABD telefon numarası
Aşağıdaki örnekte bir örnek yanıt gösterilmektedir:
"pii":{
"email":[
{
"detected":"abcdef@abcd.com",
"sub_type":"Regular",
"text":"abcdef@abcd.com",
"index":32
}
],
"ssn":[
],
"ipa":[
{
"sub_type":"IPV4",
"text":"255.255.255.255",
"index":72
}
],
"phone":[
{
"country_code":"US",
"text":"6657789887",
"index":56
}
],
"address":[
{
"text":"1 Microsoft Way, Redmond, WA 98052",
"index":89
}
]
}
Otomatik Düzeltme
Giriş metninin ("Qu! CK," "f0x" ve "lzay" bilerek) olduğunu varsayalım:
Qu! CK kahverengi f0x, lzay köpek üzerine atlar.
Otomatik düzeltme için sorun yaparsanız, yanıt metnin düzeltilmiş sürümünü içerir:
Hızlı kahverengi Fox, geç köpek üzerine atlar.
Özel terim listelerinizi oluşturma ve yönetme
Varsayılan, koşulların genel listesi çoğu durumda harika olduğundan, iş gereksinimlerinize özgü koşullara göre ekran yapmak isteyebilirsiniz. Örneğin, kullanıcılar tarafından gönderilen tüm rekabetçi marka adlarını filtrelemek isteyebilirsiniz.
Not
En çok 5 terim listeniz olabilir ve her listedeki terimlerin sayısı 10.000'i aşmamalıdır.
Aşağıdaki örnek eşleşen liste KIMLIĞINI gösterir:
"Terms": [
{
"Index": 118,
"OriginalIndex": 118,
"ListId": 231.
"Term": "crap"
}
Content Moderator, özel terim listelerini yönetmeye yönelik işlemler içeren bir terim listesi API 'si sağlar. LISTE API konsolu ' nu başlatın ve REST API kod örneklerini kullanın. ayrıca Visual Studio ve C# hakkında bilginiz varsa, .net hızlı başlangıç terimini da inceleyin.
Sonraki adımlar
Metin denetleme API konsoluIle API 'leri test edin. Ayrıca, insan incelemelerini ayarlamayı öğrenmek için incelemeleri, iş akışlarını ve işleri inceleyin.