İşleme teknolojisi, Azure doğal dil seçmeChoosing a natural language processing technology in Azure

Serbest biçimli metin işleme arama desteklemek amacıyla genellikle metnin paragraflar içeren belgeleri karşı gerçekleştirilir, ancak diğer yaklaşım analizi, konu algılama gibi doğal dil işlemeyi (NLP) görevleri gerçekleştirmek için de kullanılır, dil algılama, anahtar ifade ayıklama ve belge kategori.Free-form text processing is performed against documents containing paragraphs of text, typically for the purpose of supporting search, but is also used to perform other natural language processing (NLP) tasks such as sentiment analysis, topic detection, language detection, key phrase extraction, and document categorization. Bu makalede, NLP görevleri desteklemek üzere işlem teknoloji seçimleri odaklanır.This article focuses on the technology choices that act in support of the NLP tasks.

NLP hizmet seçerken seçenekleri nelerdir?What are your options when choosing an NLP service?

Azure'da, doğal dil işlemeyi (NLP) özelliklerini aşağıdaki hizmetleri sağlar:In Azure, the following services provide natural language processing (NLP) capabilities:

Temel seçim ölçütlerineKey selection criteria

Seçimleri daraltmak için bu soruyu yanıtlayarak başlatın:To narrow the choices, start by answering these questions:

  • Önceden oluşturulmuş modelleri kullanmak istiyorsunuz?Do you want to use prebuilt models? Yanıt Evet ise, Microsoft Bilişsel hizmetler tarafından sunulan API'lerini kullanarak göz önünde bulundurun.If yes, consider using the APIs offered by Microsoft Cognitive Services.

  • Büyük bir gövde metni veri karşı özel modellerinin eğitilmesi gerekir mi?Do you need to train custom models against a large corpus of text data? Yanıt Evet ise, Azure HDInsight Spark MLlib ve Spark NLP ile kullanarak göz önünde bulundurun.If yes, consider using Azure HDInsight with Spark MLlib and Spark NLP.

  • Simgeleştirme, dallanma, başsözcüğe ve terimi sıklığı/ters belge sıklığı (TF/IDF) gibi alt düzey NLP özelliklerine ihtiyacınız var?Do you need low-level NLP capabilities like tokenization, stemming, lemmatization, and term frequency/inverse document frequency (TF/IDF)? Yanıt Evet ise, Azure HDInsight Spark MLlib ve Spark NLP ile kullanarak göz önünde bulundurun.If yes, consider using Azure HDInsight with Spark MLlib and Spark NLP.

  • Varlık ve amacını kimliği, konu algılama, yazım denetimi ve yaklaşım analizi gibi basit, üst düzey NLP özelliklerine ihtiyacınız var?Do you need simple, high-level NLP capabilities like entity and intent identification, topic detection, spell check, or sentiment analysis? Yanıt Evet ise, Microsoft Bilişsel hizmetler tarafından sunulan API'lerini kullanarak göz önünde bulundurun.If yes, consider using the APIs offered by Microsoft Cognitive Services.

Özellik MatrisiCapability matrix

Aşağıdaki tablolarda, Özellikler'deki temel farklılıklar özetlenmektedir.The following tables summarize the key differences in capabilities.

Genel özellikleriGeneral capabilities

Azure HDInsightAzure HDInsight Microsoft Bilişsel HizmetleriMicrosoft Cognitive Services
Modelleri kullanan hizmet olarak sunar.Provides pretrained models as a service HayırNo EvetYes
REST APIREST API EvetYes EvetYes
ProgramlanabilirlikProgrammability Python, Scala, JavaPython, Scala, Java C#, Java, Node.js, Python, PHP, RubyC#, Java, Node.js, Python, PHP, Ruby
Destek işleme, büyük veri kümeleri ve büyük belgeleriSupport processing of big data sets and large documents EvetYes HayırNo

Alt düzey doğal dil işleme özellikleriLow-level natural language processing capabilities

Azure HDInsightAzure HDInsight Microsoft Bilişsel HizmetleriMicrosoft Cognitive Services
Belirteç OluşturucuTokenizer Evet (Spark NLP)Yes (Spark NLP) Evet (dil analizi API'si)Yes (Linguistic Analysis API)
AyırıcıStemmer Evet (Spark NLP)Yes (Spark NLP) HayırNo
LemmatizerLemmatizer Evet (Spark NLP)Yes (Spark NLP) HayırNo
Konuşma etiketleme bir parçasıPart of speech tagging Evet (Spark NLP)Yes (Spark NLP) Evet (dil analizi API'si)Yes (Linguistic Analysis API)
Terim sıklığı/ters-belge sıklığı (TF/IDF)Term frequency/inverse-document frequency (TF/IDF) Evet (Spark MLlib)Yes (Spark MLlib) HayırNo
Dize benzerlik—uzaklık hesaplama DüzenleString similarity—edit distance calculation Evet (Spark MLlib)Yes (Spark MLlib) HayırNo
N-gram hesaplamaN-gram calculation Evet (Spark MLlib)Yes (Spark MLlib) HayırNo
Word kaldırma DurdurStop word removal Evet (Spark MLlib)Yes (Spark MLlib) HayırNo

Üst düzey doğal dil işleme özellikleriHigh-level natural language processing capabilities

Azure HDInsightAzure HDInsight Microsoft Bilişsel HizmetleriMicrosoft Cognitive Services
Varlık/hedefi tanımlama ve ayıklamaEntity/intent identification & extraction HayırNo Evet (Language Understanding Intelligent Service (LUIS) API'si)Yes (Language Understanding Intelligent Service (LUIS) API)
Konu algılamaTopic detection Evet (Spark NLP)Yes (Spark NLP) Evet (metin analizi API'si)Yes (Text Analytics API)
Yazım denetimiSpell checking Evet (Spark NLP)Yes (Spark NLP) Evet (Bing yazım denetimi API'si)Yes (Bing Spell Check API)
Yaklaşım analiziSentiment analysis Evet (Spark NLP)Yes (Spark NLP) Evet (metin analizi API'si)Yes (Text Analytics API)
Dil algılamaLanguage detection HayırNo Evet (metin analizi API'si)Yes (Text Analytics API)
İngilizce yanı sıra birden çok dili desteklerSupports multiple languages besides English HayırNo Evet (API göre değişiklik gösterir)Yes (varies by API)

Ayrıca bkz.See also

Doğal dil işlemeNatural language processing