Dilleri Algılama
Önemli
Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.
1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.
- Makine öğrenmesi projelerini ML Studio'dan (klasik) Azure Machine Learning.
- Daha fazla bilgi Azure Machine Learning.
ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.
Giriş dosyasındaki her satırın dilini algılar
Kategori: Metin Analizi
Not
Uygulama: Machine Learning Studio (yalnızca klasik)
Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.
Modüle Genel Bakış
Bu makalede, metin girişini analiz etmek ve girişte yer alan her kayıtla ilişkili dili tanımlamak için Machine Learning Studio'daki (klasik) Dilleri Algıla modülünün nasıl kullanımı açıklanmıştır.
Dil algılama algoritması birçok farklı dili tanımlayabilir. Analiz etmek için dize sütununu ve algılanabilir toplam dil sayısını belirtmeniz gerekir. Algoritma, her metin satırı analiz eder ve her dil için bir olasılık puanı atar. İlk sonuç sütunundaki dil, en yüksek puanı alan dildir.
Dilleri Algıla'yi yapılandırma
Analiz etmek istediğiniz metni içeren veri kümesini Machine Learning Studio'da (klasik) bir denemeye ekleyin. Analiz için metin içeren sütun, dize veri türü olmalıdır.
Datset'in bir etiket sütunu içermesi gerekir; dil algılama algoritması yalnızca desteklenen dillerin dil özellikleri üzerinde çalışır.
Yeni verileri içeri aktarıyorsanız, verilerinizin UTF-8 biçiminde kaydedildiklerini emin olun. Diğer Unicode biçimleri desteklenmiyor.
Denemenize Dilleri Algıla modülünü ekleyin ve dil algılama için veri kümesine metin ekleyin.
Metin sütunu için analiz etmek istediğiniz sütunu seçin.
Algılanabilir dil sayısı üst sınırı için, algılanabilir en fazla dil sayısını belirtin.
Dil sayısına üst sınır ayarlama performansı geliştirebilir.
Denemeyi çalıştırın.
Sonuçlar
Dilleri Algıla modülü , her satır için bir dil tanımlayıcısı ve puan verir.
Örneğin, aşağıdaki tabloda test verileriyle ilgili bir örnek analiz yer alır.
İlk iki sütun col1 ve dil etiketi , giriş veri kümesinden geçirilen sütunlardır. Bu örnekte, giriş veri kümesi modülü test etmek için tasarlanma nedeniyle beklenen dil zaten biliniyordu ve etiket sütununda sağlanmıştır.
Kalan sütunlar, Dilleri Algıla modülü tarafından oluşturulur. Eşdeğer olası dil eşleşmeleri varsa, her biri için bir puanla birlikte birkaç dil listelenmiş olabilir. Bu durumda modül, her satır için yalnızca bir dil ve bu dilin olasılık puanıyla birlikte tahminde bulunur.
Modül yeterince yüksek puana sahip herhangi bir dili algılayamezse 0 puanıyla (Bilinmiyor) sonucu elde edersiniz. Ancak, API güncelleştirildiğinde modül tarafından desteklenen diller zaman içinde değişebilir.
Süt1 | Dil etiketi | Col1 Dili | Col1 Iso6391 Dili | Col1 Iso6391 Dil Puanı |
---|---|---|---|---|
Bu, personelin ve iyi hizmetin olduğu harika bir oteldi | İngilizce | İngilizce | en | 100 |
Es war ein wunderbares Hotel mit freundlichem Personal und guter service | Almanca | Almanca | de | 100 |
C'est un büyüteç hétel avec un personnel sympathique et un service de qualité | Fransızca | Fransızca | Fr | 100 |
Det var et dejligt hotel med et venligt personale og hizmet | Danca | Danca | Nl | 100 |
Va ser un magnskafic hotel amb un personal amable i bon servei | Katalanca | Katalanca | Ca | 92.30769348 |
とても素敵なホテルで、スタッフは親切で、サービスもよかった | Japonca | (Bilinmiyor) | 0 | |
qu mebpa'mey naQ friendly QaQ chavmoH je | Klingon | Fransızca | Fr | 77.5 |
Örnekler
Bir denemede Dilleri Algıla modülünün nasıl kullanıldıklarının örnekleri için bkz . Azure Yapay Zeka Galerisi:
- Film Başlıklarını Dile Göre Filtrele: Film adlarında kullanılan dili algılar ve ardından dil tanımlayıcısını kullanarak veri kümesini İngilizce filmlerle İngilizce olmayan filmlere böler.
Teknik notlar
Algılanabilecek diller hakkında genel bir fikir için bkz. Bing Çevirmen.
Şu anda gelişmiş metin analizi için Machine Learning çok daha fazla dil algılanır. Dile özgü işleme gerektiren diğer modüllere gönderdiğiniz sonuçları filtrelemek için Dilleri Algıla sonuçlarını kullanmanizi öneririz.
Temel alınan dil hizmetleri, Metin Analizi hizmet Azure Bilişsel Hizmetler.
Beklenen girişler
Ad | Tür | Description |
---|---|---|
Veri kümesi | Veri Tablosu | Giriş |
Modül parametreleri
Ad | Tür | Aralık | İsteğe Bağlı | Varsayılan | Description |
---|---|---|---|---|---|
Algılanacak dil sayısıyla üst sınır | Tamsayı | [1; 184] | Gerekli | 1 | Tespit edilecek dil sayısına üst sınır. |
Metin sütunu | ColumnSelection | Gerekli | Metin sütununun adı veya tek tabanlı dizini. |
Çıkışlar
Ad | Tür | Description |
---|---|---|
Sonuç veri kümesi | Veri tablosu | Sonuç |
Özel durumlar
Özel durum | Description |
---|---|
Hata 0003 | Bir veya daha fazla giriş null veya boş olduğunda özel durum oluşur. |
Hata 0010 | Giriş veri kümelerinde eşleşmesi gereken ancak olmayan sütun adları varsa özel durum oluşur. |
Hata 0016 | Modüle geçirilen giriş veri kümelerinin uyumlu sütun türleri olması, ancak bunu olmaması durumunda özel durum oluşur. |
Hata 0008 | Parametre Aralık içinde değilse özel durum oluşur. |
Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.
apı özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.