Çözümleyici adlarıAnalyzer Names

Önemli

Dilbilimsel Analiz önizleme sürümü 9 Ağustos 2018 tarihinde kullanımdan kaldırılmıştır.The Linguistic Analysis preview was decommissioned on August 9, 2018. Metin işleme ve analiz için Azure Machine Learning metin analizi modüllerini kullanmanızı öneririz.We recommend using Azure Machine Learning text analytics modules for text processing and analysis.

Her iki esneklik Çözümleyicileri ve bir ad ne anlama geldiğini anlamak duyarlık izin vermek için biraz karmaşık bir adlandırma yapısına Çözümleyicileri için kullanırız.We use a somewhat complicated naming structure for analyzers to allow both flexibility on analyzers and precision in understanding what a name means. Çözümleyici adları dört bölümden oluşur: kimlik, bir tür, bir belirtimi ve bir uygulama.Analyzer names consist of four parts: an ID, a Kind, a Specification, and an Implementation. Her bileşenin rol aşağıda tanımlanmıştır.The role of each component is defined below.

KimlikID

İlk olarak, bir çözümleyici benzersiz bir kimlik vardır; bir GUID.First, an analyzer has a unique ID; a GUID. Bu Guıd'lar, nispeten ender olarak değiştirmeniz gerekir, ancak belirli bir çözümleyici benzersiz şekilde tanımlamak için tek yoludur.These GUIDs should change relatively rarely, but are the only way to uniquely describe a particular analyzer.

türKind

Ardından, her Çözümleyicisi olduğu bir tür.Next, each analyzer is a kind. Bu analiz türünü döndürdü ve bu analizin temsil etmek için kullanılan veri yapısını benzersiz şekilde tanımlamalıdır çok geniş koşullarını tanımlar.This defines in very broad terms the type of analysis returned, and should uniquely define the data structure used to represent that analysis. Şu anda üç farklı tür vardır:Currently, there are three distinct kinds:

BelirtimiSpecification

Belirli bir tür içinde belirli bir olguya nasıl çözümlenmelidir farklı uzmanlar ancak katılmıyorum.Within a given kind, however, different experts might disagree on how a particular phenomenon should be analyzed. Programlama dillerden farklı olarak, bu nasıl yapılmalıdır hiçbir NET ve tam tanımı yok.Unlike programming languages, there's no clear and exact definition of how this should be done.

Örneğin, "Bunlar gitmedi." İngilizce cümlede belirteçleri bulmaya çalıştığınız düşünün.For instance, imagine we were trying to find the tokens in the English sentence "They didn't go." Özellikle, dize, "siz" göz önünde bulundurun.In particular, consider the string "didn't". Olası bir yorumu olduğundan bu iki belirteçlere bölünmesi: "yaptığını" ve "not".One possible interpretation is that this should be split into two tokens: "did" and "not". Ardından alternatif cümlenin "bunlar değil gitti" belirteçleri aynı kümesi gerekir.Then the alternative sentence "They did not go" would have the same set of tokens. Bu belirteçleri "yaptığını" ve "Me" olarak ayrılmalıdır söyleyin başka bir olasılıktır.Another possibility is to say that it should be split into the tokens "did" and "n't". İkinci belirtecin normalde bir sözcük değerlendirilmeyecektir, ancak bazı durumlarda yararlı olabilir yüzey dize hakkında daha fazla bilgi bu yaklaşım korur.The latter token would not normally be considered a word, but this approach retains more information about the surface string, which can sometimes be useful. Veya belki de bu kısaltma tek bir sözcük düşünülmelidir.Or perhaps that contraction should be considered a single word.

Bakılmaksızın hangi seçeneği yapıldığı, seçim tutarlı bir şekilde yapılması.Regardless which choice is made, that choice should be made consistently. Bu rolü tam olarak, bir belirtimi: karar verirken doğru gösterimi olmalıdır.This is precisely the role of a specification: to decide what a correct representation should be.

Çözümleyici çıkışları yalnızca oldukça aynı belirtimine uyan veriler için karşılaştırılabilir.Analyzer outputs can only be fairly compared to data that conforms to the same specification.

UygulamaImplementation

Genellikle aynı sonuçları elde etmek için birden çok modeli vardır ancak farklı performans özellikleri olan.Often there are multiple models that attempt to achieve the same results, but with different performance characteristics. Bir model daha hızlı olabilir ancak daha az doğru; başka farklı bir denge duruma getirebilir.One model might be faster though less accurate; another might make a different trade-off.

Uygulama Çözümleyicisi adının bir kısmını bu tür bilgiler, tanımlamak için kullanılır, böylece kullanıcılar için kendi gereksinimlerine en uygun Çözümleyicisi'ni seçebilirsiniz.The implementation portion of an analyzer name is used to identify this type of information, so that users can pick the most appropriate analyzer for their needs.