Metin Analizi API'si nedir?What is the Text Analytics API?

Metin Analizi API'si, ham metin üzerinde gelişmiş doğal dil işleme sağlayan bulut tabanlı bir hizmettir ve dört ana işlev içerir: yaklaşım analizi, anahtar ifade ayıklama, dil algılama ve varlık tanıma.The Text Analytics API is a cloud-based service that provides advanced natural language processing over raw text, and includes four main functions: sentiment analysis, key phrase extraction, language detection, and entity recognition.

API, geliştirme projeleriniz için bulutta makine öğrenimi ve AI algoritmaları koleksiyonu olan Azure bilişsel Hizmetler'in bir parçasıdır.The API is a part of Azure Cognitive Services, a collection of machine learning and AI algorithms in the cloud for your development projects.

Metin analizi farklı şeyler anlamına gelebilir, ancak bilişsel hizmetler 'de Metin Analizi API'si, aşağıda açıklandığı gibi dört tür analiz sağlar.Text analysis can mean different things, but in Cognitive Services, the Text Analytics API provides four types of analysis as described below. Bu özellikleri REST APIveya istemci kitaplığıylabirlikte kullanabilirsiniz.You can use these features with the REST API, or the client library.

Duygu AnaliziSentiment Analysis

Olumlu veya olumsuz yaklaşım hakkında ipuçları için ham metni analiz ederek hangi müşterilerin markanızı veya konuyu düşündüğünü öğrenmek için yaklaşım analizini kullanın.Use sentiment analysis to find out what customers think of your brand or topic by analyzing raw text for clues about positive or negative sentiment. API, her belge için 0 ile 1 arasında bir yaklaşım puanı döndürür ve 1 en pozitif değerdir.This API returns a sentiment score between 0 and 1 for each document, where 1 is the most positive.
Analiz modelleri, Microsoft tarafından sağlanan geniş kapsamlı gövde metinleri ve doğal dil teknolojileri kullanılarak önceden eğitilmiştir.The analysis models are pretrained using an extensive body of text and natural language technologies from Microsoft. API, seçili dillerde sağladığınız ham metni analiz edip puanlayabilir ve sonuçları doğrudan çağrıyı yapan uygulamaya döndürebilir.For selected languages, the API can analyze and score any raw text that you provide, directly returning results to the calling application.

Anahtar İfade AyıklamaKey Phrase Extraction

Ana noktaları hızlı bir şekilde tanımlamak için anahtar tümceleri otomatik olarak ayıklayın.Automatically extract key phrases to quickly identify the main points. Örneğin, "The food was delicious and there were wonderful staff" (Yemekler lezzetliydi ve personel harikaydı) giriş metni olduğunda API, "food" (yemek) ve "wonderful staff" (personel harikaydı) ana konuşma noktalarını döndürür.For example, for the input text "The food was delicious and there were wonderful staff", the API returns the main talking points: "food" and "wonderful staff".

Dil AlgılamaLanguage Detection

Giriş metninin hangi dilde yazıldığını algılayabilir ve çok çeşitli diller, çeşitler, diapacts ve bazı bölgesel/kültürel dillerinde istek üzerine gönderilen her belge için tek bir dil kodu rapor edebilirsiniz.You can detect which language the input text is written in and report a single language code for every document submitted on the request in a wide range of languages, variants, dialects, and some regional/cultural languages. Dil kodu, puanın ağırlığını belirten bir puanla eşleştirilir.The language code is paired with a score indicating the strength of the score.

Adlandırılmış Varlık TanımaNamed Entity Recognition

Metninizdeki varlıkları kişiler, konumlar, kuruluşlar, tarih/saat, miktarlar, yüzdeler, para birimleri ve daha fazlası olarak belirleyip kategorilere ayırın .Identify and categorize entities in your text as people, places, organizations, date/time, quantities, percentages, currencies, and more. İyi bilinen varlıklar da tanınarak web üzerindeki ek bilgilere bağlantı verilir.Well-known entities are also recognized and linked to more information on the web.

Kapsayıcıları kullanmaUse containers

Verilerinize daha yakın standartlaştırılmış Docker Kapsayıcıları yükleyerek anahtar tümceleri ayıklamak, dili algılamak ve yaklaşımı yerel olarak çözümlemek için metin analizi kapsayıcıları kullanın .Use the Text Analytics containers to extract key phrases, detect language, and analyze sentiment locally, by installing standardized Docker containers closer to your data.

Tipik iş akışıTypical workflow

İş akışı basittir. Analiz edilecek verileri gönderir ve çıktıları kodunuzda işlersiniz.The workflow is simple: you submit data for analysis and handle outputs in your code. Çözümleyiciler olduğu gibi kullanılır, ek yapılandırma veya özelleştirme gerçekleştirilmez.Analyzers are consumed as-is, with no additional configuration or customization.

  1. Metin Analizi için bir Azure kaynağı oluşturun .Create an Azure resource for Text Analytics. Daha sonra, isteklerinizin kimlik doğrulaması için sizin için oluşturulan anahtarı alın .Afterwards, get the key generated for you to authenticate your requests.

  2. JSON biçiminde verilerinizi yapılandırılmamış ham metin olarak içeren bir istek düzenleyin.Formulate a request containing your data as raw unstructured text, in JSON.

  3. İstediğiniz kaynağı ekleyerek isteği kayıt sırasında oluşturulan uç noktaya: yaklaşım analizi, anahtar ifade ayıklama, dil algılama veya varlık tanımlama.Post the request to the endpoint established during sign-up, appending the desired resource: sentiment analysis, key phrase extraction, language detection, or entity identification.

  4. Yanıtın akışını yapın veya yerel ortamda depolayın.Stream or store the response locally. Gönderilen isteğe bağlı olarak sonuçlar yaklaşım puanı, ayıklanan anahtar ifadelerden oluşan bir koleksiyon veya dil kodu olacaktır.Depending on the request, results are either a sentiment score, a collection of extracted key phrases, or a language code.

Çıktı tek bir JSON belgesi olarak döndürülür ve kimlikle birlikte gönderdiğiniz tüm metin belgelerinin sonucunu içerir.Output is returned as a single JSON document, with results for each text document you posted, based on ID. Sonuçları daha sonra analiz ederek, görselleştirerek veya kategorilere ayırarak eyleme dönüştürülebilir içgörüler elde edebilirsiniz.You can subsequently analyze, visualize, or categorize the results into actionable insights.

Veriler hesabınızda depolanmaz.Data is not stored in your account. Metin Analizi API'si tarafından gerçekleştirilen işlemlerde durum bilgisi yoktur. Başka bir deyişle sağladığınız metin işlenir ve sonuçlar anında döndürülür.Operations performed by the Text Analytics API are stateless, which means the text you provide is processed and results are returned immediately.

Birden çok programlama deneyimi düzeyi için Metin AnaliziText Analytics for multiple programming experience levels

Programlamada çok fazla deneyim olmasa bile, işlemlerinizde Metin Analizi API'si kullanmaya başlayabilirsiniz.You can start using the Text Analytics API in your processes, even if you don't have much experience in programming. API 'yi, deneyim düzeyinize uygun yollarla farklı şekillerde çözümlemek için nasıl kullanabileceğinizi öğrenmek için bu öğreticileri kullanın.Use these tutorials to learn how you can use the API to analyze text in different ways to fit your experience level.

Desteklenen dillerSupported languages

Bu bölüm, daha kolay bulunmasını sağlama amacıyla başka bir makaleye taşınmıştır.This section has been moved to a separate article for better discoverability. Bu içerik için Metin Analizi API'si desteklenen diller bölümüne bakın.Refer to Supported languages in the Text Analytics API for this content.

Veri sınırlarıData limits

Tüm Metin Analizi API'si uç noktaları ham metin verisi kabul eder.All of the Text Analytics API endpoints accept raw text data. Geçerli sınır, her belge için 5.120 karakterdir; daha büyük belgeleri analiz etmeniz gerekiyorsa, bunları daha küçük parçalara ayırın.The current limit is 5,120 characters for each document; if you need to analyze larger documents, you can break them up into smaller chunks.

SınırLimit DeğerValue
Tek belge için maksimum boyutMaximum size of a single document StringInfo.LengthInTextElementsölçülen 5.120 karakter.5,120 characters as measured by StringInfo.LengthInTextElements.
İsteğin tamamının maksimum boyutuMaximum size of entire request 1 MB1 MB
Bir istekte bulunabilecek maksimum belge sayısıMaximum number of documents in a request 1000 belge1,000 documents

Oran sınırınız fiyatlandırma katmanınızda farklılık gösterecektir.Your rate limit will vary with your pricing tier.

KatmanTier İstek/saniyeRequests per second Dakika başına istekRequests per minute
S/Multi-ServiceS / Multi-service 10001000 10001000
S0/F0S0 / F0 100100 300300
S1S1 200200 300300
S2S2 300300 300300
S3S3 500500 500500
S4S4 10001000 10001000

İstekler her bir Metin Analizi özelliği için ayrı olarak ölçülür.Requests are measured for each Text Analytics feature separately. Örneğin, fiyatlandırma katmanınız için en fazla istek sayısını aynı anda her bir özelliğe gönderebilirsiniz.For example, you can send the maximum number of requests for your pricing tier to each feature, at the same time.

Unicode kodlamaUnicode encoding

Metin Analizi API'si, metin gösterimi ve karakter sayısı hesaplamaları için Unicode kodlamasını kullanır.The Text Analytics API uses Unicode encoding for text representation and character count calculations. İstekler UTF-8 ve UTF-16 olarak gönderilebilir, karakter sayısında fark olmayacaktır.Requests can be submitted in both UTF-8 and UTF-16 with no measurable differences in the character count. Karakter uzunluğu için Unicode kod noktaları buluşsal değer olarak kullanılır ve metin analizi veri sınırları için eşdeğer kabul edilir.Unicode codepoints are used as the heuristic for character length and are considered equivalent for the purposes of text analytics data limits. Karakter sayısını almak için StringInfo.LengthInTextElements kullanıyorsanız, veri boyutunu ölçmek için kullandığımız yöntemi de kullanıyorsunuz.If you use StringInfo.LengthInTextElements to get the character count, you are using the same method we use to measure data size.

Sonraki adımlarNext steps