Dilleri Algılama

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Giriş dosyasındaki her satırın dilini algılar

Kategori: Metin Analizi

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Modüle Genel Bakış

Bu makalede, metin girişini analiz etmek ve girişte yer alan her kayıtla ilişkili dili tanımlamak için Machine Learning Studio'daki (klasik) Dilleri Algıla modülünün nasıl kullanımı açıklanmıştır.

Dil algılama algoritması birçok farklı dili tanımlayabilir. Analiz etmek için dize sütununu ve algılanabilir toplam dil sayısını belirtmeniz gerekir. Algoritma, her metin satırı analiz eder ve her dil için bir olasılık puanı atar. İlk sonuç sütunundaki dil, en yüksek puanı alan dildir.

Dilleri Algıla'yi yapılandırma

  1. Analiz etmek istediğiniz metni içeren veri kümesini Machine Learning Studio'da (klasik) bir denemeye ekleyin. Analiz için metin içeren sütun, dize veri türü olmalıdır.

    Datset'in bir etiket sütunu içermesi gerekir; dil algılama algoritması yalnızca desteklenen dillerin dil özellikleri üzerinde çalışır.

    Yeni verileri içeri aktarıyorsanız, verilerinizin UTF-8 biçiminde kaydedildiklerini emin olun. Diğer Unicode biçimleri desteklenmiyor.

  2. Denemenize Dilleri Algıla modülünü ekleyin ve dil algılama için veri kümesine metin ekleyin.

  3. Metin sütunu için analiz etmek istediğiniz sütunu seçin.

  4. Algılanabilir dil sayısı üst sınırı için, algılanabilir en fazla dil sayısını belirtin.

    Dil sayısına üst sınır ayarlama performansı geliştirebilir.

  5. Denemeyi çalıştırın.

Sonuçlar

Dilleri Algıla modülü , her satır için bir dil tanımlayıcısı ve puan verir.

Örneğin, aşağıdaki tabloda test verileriyle ilgili bir örnek analiz yer alır.

  • İlk iki sütun col1 ve dil etiketi , giriş veri kümesinden geçirilen sütunlardır. Bu örnekte, giriş veri kümesi modülü test etmek için tasarlanma nedeniyle beklenen dil zaten biliniyordu ve etiket sütununda sağlanmıştır.

  • Kalan sütunlar, Dilleri Algıla modülü tarafından oluşturulur. Eşdeğer olası dil eşleşmeleri varsa, her biri için bir puanla birlikte birkaç dil listelenmiş olabilir. Bu durumda modül, her satır için yalnızca bir dil ve bu dilin olasılık puanıyla birlikte tahminde bulunur.

    Modül yeterince yüksek puana sahip herhangi bir dili algılayamezse 0 puanıyla (Bilinmiyor) sonucu elde edersiniz. Ancak, API güncelleştirildiğinde modül tarafından desteklenen diller zaman içinde değişebilir.

Süt1 Dil etiketi Col1 Dili Col1 Iso6391 Dili Col1 Iso6391 Dil Puanı
Bu, personelin ve iyi hizmetin olduğu harika bir oteldi İngilizce İngilizce en 100
Es war ein wunderbares Hotel mit freundlichem Personal und guter service Almanca Almanca de 100
C'est un büyüteç hétel avec un personnel sympathique et un service de qualité Fransızca Fransızca Fr 100
Det var et dejligt hotel med et venligt personale og hizmet Danca Danca Nl 100
Va ser un magnskafic hotel amb un personal amable i bon servei Katalanca Katalanca Ca 92.30769348
とても素敵なホテルで、スタッフは親切で、サービスもよかった Japonca (Bilinmiyor) 0
qu mebpa'mey naQ friendly QaQ chavmoH je Klingon Fransızca Fr 77.5

Örnekler

Bir denemede Dilleri Algıla modülünün nasıl kullanıldıklarının örnekleri için bkz . Azure Yapay Zeka Galerisi:

  • Film Başlıklarını Dile Göre Filtrele: Film adlarında kullanılan dili algılar ve ardından dil tanımlayıcısını kullanarak veri kümesini İngilizce filmlerle İngilizce olmayan filmlere böler.

Teknik notlar

Algılanabilecek diller hakkında genel bir fikir için bkz. Bing Çevirmen.

Şu anda gelişmiş metin analizi için Machine Learning çok daha fazla dil algılanır. Dile özgü işleme gerektiren diğer modüllere gönderdiğiniz sonuçları filtrelemek için Dilleri Algıla sonuçlarını kullanmanizi öneririz.

Temel alınan dil hizmetleri, Metin Analizi hizmet Azure Bilişsel Hizmetler.

Beklenen girişler

Ad Tür Description
Veri kümesi Veri Tablosu Giriş

Modül parametreleri

Ad Tür Aralık İsteğe Bağlı Varsayılan Description
Algılanacak dil sayısıyla üst sınır Tamsayı [1; 184] Gerekli 1 Tespit edilecek dil sayısına üst sınır.
Metin sütunu ColumnSelection Gerekli Metin sütununun adı veya tek tabanlı dizini.

Çıkışlar

Ad Tür Description
Sonuç veri kümesi Veri tablosu Sonuç

Özel durumlar

Özel durum Description
Hata 0003 Bir veya daha fazla giriş null veya boş olduğunda özel durum oluşur.
Hata 0010 Giriş veri kümelerinde eşleşmesi gereken ancak olmayan sütun adları varsa özel durum oluşur.
Hata 0016 Modüle geçirilen giriş veri kümelerinin uyumlu sütun türleri olması, ancak bunu olmaması durumunda özel durum oluşur.
Hata 0008 Parametre Aralık içinde değilse özel durum oluşur.

Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.

apı özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.

Ayrıca bkz.

Metin Analizi
A-Z modül listesi