Dil algılamayı kullanma

Dil Algılama özelliği metni değerlendirebilir ve belgenin yazıldığı dili gösteren bir dil tanımlayıcısı döndürebilir.

Dil algılama, dilin bilinmediği rastgele metinleri toplayan içerik depoları için kullanışlıdır. Giriş belgesinde hangi dilin kullanıldığını belirlemek için bu analizin sonuçlarını ayrıştırabilirsiniz. Yanıt ayrıca modelin güvenilirliğini yansıtan 0 ile 1 arasında bir puan döndürür.

Dil Algılama özelliği çok çeşitli dilleri, varyantları, diyalektleri ve bazı bölgesel veya kültürel dilleri algılayabilir.

Dağıtım seçenekleri

Dil algılamayı kullanmak için analiz için yapılandırılmamış ham metin gönderir ve api çıkışını uygulamanızda işlersiniz. Analiz, verilerinizde kullanılan modelde ek özelleştirme yapılmadan olduğu gibi gerçekleştirilir. Dil algılamayı kullanmanın iki yolu vardır:

Geliştirme seçeneği Description
Language Studio Language Studio, Azure hesabı olmadan metin örnekleriyle varlık bağlamayı ve kaydolduğunuz sırada kendi verilerinizi denemenize olanak tanıyan web tabanlı bir platformdur. Daha fazla bilgi için bkz. Language Studio web sitesi veya language studio hızlı başlangıcı.
REST API veya İstemci kitaplığı (Azure SDK) REST API'yi veya çeşitli dillerde kullanılabilen istemci kitaplığını kullanarak dil algılamayı uygulamalarınızla tümleştirin. Daha fazla bilgi için bkz. Dil algılama hızlı başlangıcı.
Docker kapsayıcısı Bu özelliği şirket içinde dağıtmak için kullanılabilir Docker kapsayıcısını kullanın. Bu docker kapsayıcıları uyumluluk, güvenlik veya diğer operasyonel nedenlerle hizmeti verilerinize yaklaştırmanızı sağlar.

Verilerin nasıl işleneceğini belirleme (isteğe bağlı)

Dil algılama modelini belirtme

Varsayılan olarak, dil algılama özelliği metninizde en son kullanılabilir yapay zeka modelini kullanır. API isteklerinizi belirli bir model sürümünü kullanacak şekilde de yapılandırabilirsiniz.

Giriş dilleri

Değerlendirilecek belgeleri gönderdiğinizde, dil algılama metnin desteklenen dillerden birinde yazılıp yazılmadığını belirlemeye çalışır.

Daha az kullanılan bir dilde ifade edilen içeriğiniz varsa, bir kod döndürip döndürmediğini görmek için Dil Algılama özelliğini deneyebilirsiniz. Algılanamıyor diller için yanıt: unknown.

Veri gönderme

İpucu

Dil algılama için Bir Docker kapsayıcısıkullanabilirsiniz, böylece şirket içi API'yi kullanabilirsiniz.

İstek alındığında analiz gerçekleştirilir. Dil algılama özelliğinin zaman uyumlu olarak kullanılması durum bilgisi yoktur. Hesabınızda hiçbir veri depolanmaz ve sonuçlar yanıtta hemen döndürülür.

Bu özelliği zaman uyumsuz olarak kullanırken API sonuçları, isteğin alındığı zamandan itibaren 24 saat boyunca kullanılabilir ve yanıtta belirtilir. Bu süreden sonra sonuçlar temizlenir ve artık alma için kullanılamaz.

Dil algılama sonuçlarını alma

Dil algılamadan sonuç aldığınızda, sonuçları bir uygulamaya akışla aktarabilir veya çıkışı yerel sistemdeki bir dosyaya kaydedebilirsiniz.

Dil algılama, gönderdiğiniz her belge için iso 639-1 adı, insan tarafından okunabilir bir ad ve güvenilirlik puanıyla birlikte bir baskın dil döndürür. Pozitif 1 puanı, analizin mümkün olan en yüksek güvenilirlik düzeyini gösterir.

Belirsiz içerik

Bazı durumlarda, girişe göre dilleri kesinleştirmek zor olabilir. iso 3166-1 alfa-2 ülke/bölge kodu belirtmek için parametresini kullanabilirsinizcountryHint. Varsayılan olarak API, varsayılan ülke ipucu olarak "ABD" kullanır. Bu davranışı kaldırmak için, bu değeri boş dize countryHint = "" olarak ayarlayarak bu parametreyi sıfırlayabilirsiniz.

Örneğin, "iletişim" hem İngilizce hem de Fransızca için ortaktır ve sınırlı bağlamla verilirse yanıt "ABD" ülke/bölge ipucunu temel alır. Metnin kökeninin Fransa’dan geldiği biliniyorsa bu bir ipucu olarak verilebilir.

Giriş

{
    "documents": [
        {
            "id": "1",
            "text": "communication"
        },
        {
            "id": "2",
            "text": "communication",
            "countryHint": "fr"
        }
    ]
}

Dil algılama modelinin artık daha iyi bir karar vermek için ek bağlamı vardır:

Çıkış

{
    "documents":[
        {
            "detectedLanguage":{
                "confidenceScore":0.62,
                "iso6391Name":"en",
                "name":"English"
            },
            "id":"1",
            "warnings":[
                
            ]
        },
        {
            "detectedLanguage":{
                "confidenceScore":1.0,
                "iso6391Name":"fr",
                "name":"French"
            },
            "id":"2",
            "warnings":[
                
            ]
        }
    ],
    "errors":[
        
    ],
    "modelVersion":"2022-10-01"
}

Çözümleyici girişi ayrıştıramıyorsa döndürür (Unknown). Örnek olarak yalnızca sayılardan oluşan bir metin dizesi gönderebilirsiniz.

{
    "documents": [
        {
            "id": "1",
            "detectedLanguage": {
                "name": "(Unknown)",
                "iso6391Name": "(Unknown)",
                "confidenceScore": 0.0
            },
            "warnings": []
        }
    ],
    "errors": [],
    "modelVersion": "2021-01-05"
}

Karma dil içeriği

Aynı belgedeki karma dil içeriği, içeriği en büyük temsile sahip ancak pozitif derecelendirmesi daha düşük olan dili döndürür. Derecelendirme, değerlendirmenin marjinal gücünü yansıtır. Aşağıdaki örnekte giriş, İngilizce, İspanyolca ve Fransızca dillerinin birleşimidir. Çözümleyici, hakim dili belirlemek için her bir kesimdeki karakterleri sayar.

Giriş

{
    "documents": [
        {
            "id": "1",
            "text": "Hello, I would like to take a class at your University. ¿Se ofrecen clases en español? Es mi primera lengua y más fácil para escribir. Que diriez-vous des cours en français?"
        }
    ]
}

Çıkış

Sonuçta elde edilen çıkış, daha zayıf bir güvenilirlik düzeyi gösteren 1,0'dan az puana sahip baskın dilden oluşur.

{
    "documents": [
        {
            "id": "1",
            "detectedLanguage": {
                "name": "Spanish",
                "iso6391Name": "es",
                "confidenceScore": 0.88
            },
            "warnings": []
        }
    ],
    "errors": [],
    "modelVersion": "2021-01-05"
}

Hizmet ve veri sınırları

Dakika ve saniye başına gönderebileceğiniz isteklerin boyutu ve sayısı hakkında bilgi için hizmet sınırları makalesine bakın.

Ayrıca bkz.