Metin Analizi içinde adlandırılmış varlık tanımayı kullanmaHow to use Named Entity Recognition in Text Analytics

Metin Analizi API'si, yapılandırılmamış metin almanıza ve Web hakkında daha fazla bilgi için bağlantılarla birlikte, Kesinleştirme varlıklarının bir listesini döndürmenize olanak tanır.The Text Analytics API lets you takes unstructured text and returns a list of disambiguated entities, with links to more information on the web. API, adlandırılmış varlık tanıma (NER) ve varlık bağlamayı destekler.The API supports both named entity recognition (NER) and entity linking.

Varlık BağlamaEntity Linking

Varlık bağlama, metinde bulunan bir varlığın kimliğini belirleme ve ayırt etme olanağıdır (örneğin, "Mars" sözcüğünün bir oluşumunun Planet 'e veya War 'ın gerçekleşen ' ine mi başvurduğunu belirleme).Entity linking is the ability to identify and disambiguate the identity of an entity found in text (for example, determining whether an occurrence of the word "Mars" refers to the planet, or to the Roman god of war). Bu işlem, tanınan varlıkları metinde bağlamak için uygun bir dilde Bilgi Bankası 'nın bulunmasını gerektirir.This process requires the presence of a knowledge base in an appropriate language, to link recognized entities in text. Varlık bağlama, bu Bilgi Bankası olarak Vikipedi kullanır.Entity Linking uses Wikipedia as this knowledge base.

Adlandırılmış varlık tanıma (NER)Named Entity Recognition (NER)

Adlandırılmış varlık tanıma (NER), metinde farklı varlıkları belirleme ve bunları önceden tanımlanmış sınıflar veya türler, örneğin: kişi, konum, olay, ürün ve kuruluş gibi kategorilere ayırma yeteneğidir.Named Entity Recognition (NER) is the ability to identify different entities in text and categorize them into pre-defined classes or types such as: person, location, event, product and organization.

Adlandırılmış varlık tanıma sürümleri ve özellikleriNamed Entity Recognition versions and features

Önemli

Metin Analizi API'si v3 şu bölgelerde kullanılamıyor: Çin Kuzey 2, Çin Doğu.Text Analytics API v3 is not available in the following regions: China North 2, China East.

ÖzellikFeature NER v 3.0NER v3.0 NER v 3.1-Önizleme. 2NER v3.1-preview.2
Tek ve toplu istekler için YöntemlerMethods for single, and batch requests XX XX
Çeşitli kategoriler genelinde Genişletilmiş varlık tanımaExpanded entity recognition across several categories XX XX
Varlık bağlama ve NER istekleri göndermek için ayrı uç noktalar.Separate endpoints for sending entity linking and NER requests. XX XX
Kişisel ( PII ) ve sağlık ( PHI ) bilgi varlıklarının tanınmasıRecognition of personal (PII) and health (PHI) information entities XX

Bilgi için bkz. dil desteği .See language support for information.

Varlık türleriEntity types

Adlandırılmış varlık tanıma v3, birden çok tür genelinde genişletilmiş algılama sağlar.Named Entity Recognition v3 provides expanded detection across multiple types. Şu anda NER v 3.0, genel varlık kategorisindekivarlıkları tanıyabilir.Currently, NER v3.0 can recognize entities in the general entity category.

Adlandırılmış varlık tanıma v 3.1-Önizleme. 2, v 3.0 'ın algılama yeteneklerini ve PII uç noktayı kullanarak kişisel bilgileri () algılama olanağını içerir v3.1-preview.2/entities/recognition/pii .Named Entity Recognition v3.1-preview.2 includes the detection capabilities of v3.0, and the ability to detect personal information (PII) using the v3.1-preview.2/entities/recognition/pii endpoint. domain=phiGizli sistem durumu bilgilerini () algılamak için isteğe bağlı parametresini kullanabilirsiniz PHI .You can use the optional domain=phi parameter to detect confidential health information (PHI). Daha fazla bilgi için varlık kategorileri makalesine ve istek uç noktaları bölümüne bakın.See the entity categories article, and request endpoints section below for more information.

REST API isteği gönderiliyorSending a REST API request

HazırlıkPreparation

Bu biçimde JSON belgelerinize sahip olmanız gerekir: KIMLIK, metin, dil.You must have JSON documents in this format: ID, text, language.

Her belge 5.120 karakterden oluşmalıdır ve koleksiyon başına en fazla 1.000 öğe (kimlik) olabilir.Each document must be under 5,120 characters, and you can have up to 1,000 items (IDs) per collection. Koleksiyon, istek gövdesinde gönderilir.The collection is submitted in the body of the request.

İsteği yapısıStructure the request

Bir POST isteği oluşturun.Create a POST request. Hızlı bir şekilde yapılandırmak ve göndermek için aşağıdaki bağlantılardan Postman veya API test konsolunu kullanabilirsiniz.You can use Postman or the API testing console in the following links to quickly structure and send one.

Not

Azure portalında Metin Analizi kaynağınız için anahtarınızı ve uç noktanızı bulabilirsiniz.You can find your key and endpoint for your Text Analytics resource on the azure portal. Kaynak yönetimialtında kaynağın hızlı başlangıç sayfasında yer alır.They will be located on the resource's Quick start page, under resource management.

İstek uç noktalarıRequest endpoints

Adlandırılmış varlık tanıma v3.1-preview.2 , ner ve varlık bağlama istekleri için ayrı uç noktalar kullanır.Named Entity Recognition v3.1-preview.2 uses separate endpoints for NER and entity linking requests. İsteğinize göre aşağıdan bir URL biçimi kullanın:Use a URL format below based on your request:

Varlık bağlamaEntity linking

  • https://<your-custom-subdomain>.cognitiveservices.azure.com/text/analytics/v3.1-preview.2/entities/linking

Adlandırılmış varlık tanıma sürüm 3,1-Önizleme başvurusu LinkingNamed Entity Recognition version 3.1-preview reference for Linking

HINER

  • Genel varlıklar- https://<your-custom-subdomain>.cognitiveservices.azure.com/text/analytics/v3.1-preview.2/entities/recognition/generalGeneral entities - https://<your-custom-subdomain>.cognitiveservices.azure.com/text/analytics/v3.1-preview.2/entities/recognition/general

Adlandırılmış varlık tanıma sürüm 3,1-Önizleme başvurusu GeneralNamed Entity Recognition version 3.1-preview reference for General

  • Kişisel ( PII ) bilgileri- https://<your-custom-subdomain>.cognitiveservices.azure.com/text/analytics/v3.1-preview.2/entities/recognition/piiPersonal (PII) information - https://<your-custom-subdomain>.cognitiveservices.azure.com/text/analytics/v3.1-preview.2/entities/recognition/pii

Ayrıca, domain=phi metindeki sağlık () bilgilerini algılamak için isteğe bağlı parametresini de kullanabilirsiniz PHI .You can also use the optional domain=phi parameter to detect health (PHI) information in text.

https://<your-custom-subdomain>.cognitiveservices.azure.com/text/analytics/v3.1-preview.2/entities/recognition/pii?domain=phi

Lütfen, redactedText ALGıLANAN PII varlıklarının varlıkların her bir karakteri için bir * ile değiştirildiği değiştirilmiş giriş metnini içeren yanıt json ' da özelliğinin eklenmesini unutmayın.Please note the addition of the redactedText property in the response JSON which contains the modified input text where the detected PII entities are replaced by an * for each character of the entities.

Adlandırılmış varlık tanıma sürüm 3,1-Önizleme başvurusu PIINamed Entity Recognition version 3.1-preview reference for PII

Metin Analizi API'si anahtarınızı dahil etmek için bir istek üst bilgisi ayarlayın.Set a request header to include your Text Analytics API key. İstek gövdesinde, hazırladığınız JSON belgelerini sağlayın.In the request body, provide the JSON documents you prepared.

Örnek NER isteğiExample NER request

Aşağıda, API 'ye gönderebilecek içeriklere bir örnek verilmiştir.The following is an example of content you might send to the API. İstek biçimi, her iki API sürümü için de aynıdır.The request format is the same for both versions of the API.

{
  "documents": [
    {
        "id": "1",
        "language": "en",
        "text": "Our tour guide took us up the Space Needle during our trip to Seattle last week."
    }
  ]
}

İsteği gönderPost the request

İstek alındığında analiz gerçekleştirilir.Analysis is performed upon receipt of the request. Dakika ve saniye başına gönderebilmeniz için isteklerin boyutu ve sayısı hakkında genel bakış konusundaki veri sınırları bölümüne bakın.See the data limits section in the overview for information on the size and number of requests you can send per minute and second.

Metin Analizi API'si durum bilgisiz.The Text Analytics API is stateless. Hesabınızda hiç veri depolanmaz ve sonuçlar yanıt içinde hemen döndürülür.No data is stored in your account, and results are returned immediately in the response.

Sonuçları görüntülemeView results

Tüm POST istekleri, kimlik ve algılanan varlık özelliklerine sahip JSON biçimli bir yanıt döndürür.All POST requests return a JSON formatted response with the IDs and detected entity properties.

Hemen çıktı döndürülür.Output is returned immediately. Sonuçları, JSON kabul eden bir uygulamada akışa alabilir veya çıktıyı yerel sistemde bir dosyaya kaydedebilir, sonra da verileri sıralamanıza, aramanıza ve işlemenize olanak sağlayan bir uygulamaya içeri aktarabilirsiniz.You can stream the results to an application that accepts JSON or save the output to a file on the local system, and then import it into an application that allows you to sort, search, and manipulate the data. Çok dilli ve Emoji desteği nedeniyle, yanıt metin uzaklıkları içerebilir.Due to multilingual and emoji support, the response may contain text offsets. Daha fazla bilgi için bkz. metin farklarını işleme .See how to process text offsets for more information.

Örnek yanıtlarExample responses

Sürüm 3, genel NER, PII ve varlık bağlama için ayrı uç noktalar sağlar.Version 3 provides separate endpoints for general NER, PII and entity linking. Her iki işlem için de yanıtlar aşağıda verilmiştir.The responses for both operations are below.

PII yanıtı örneği:Example of a PII response:

{
  "documents": [
    {
    "redactedText": "You can even pre-order from their online menu at *************************, call ************ or send email to ***************************!",
    "id": "0",
    "entities": [
        {
        "text": "www.contososteakhouse.com",
        "category": "URL",
        "offset": 49,
        "length": 25,
        "confidenceScore": 0.8
        }, 
        {
        "text": "312-555-0176",
        "category": "Phone Number",
        "offset": 81,
        "length": 12,
        "confidenceScore": 0.8
        }, 
        {
        "text": "order@contososteakhouse.com",
        "category": "Email",
        "offset": 111,
        "length": 27,
        "confidenceScore": 0.8
        }
      ],
    "warnings": []
    }
  ],
  "errors": [],
  "modelVersion": "2020-07-01"
}

Bir varlık bağlama yanıtı örneği:Example of an Entity linking response:

{
  "documents": [
    {
      "id": "1",
      "entities": [
        {
          "bingId": "f8dd5b08-206d-2554-6e4a-893f51f4de7e", 
          "name": "Space Needle",
          "matches": [
            {
              "text": "Space Needle",
              "offset": 30,
              "length": 12,
              "confidenceScore": 0.4
            }
          ],
          "language": "en",
          "id": "Space Needle",
          "url": "https://en.wikipedia.org/wiki/Space_Needle",
          "dataSource": "Wikipedia"
        },
        {
          "bingId": "5fbba6b8-85e1-4d41-9444-d9055436e473",
          "name": "Seattle",
          "matches": [
            {
              "text": "Seattle",
              "offset": 62,
              "length": 7,
              "confidenceScore": 0.25
            }
          ],
          "language": "en",
          "id": "Seattle",
          "url": "https://en.wikipedia.org/wiki/Seattle",
          "dataSource": "Wikipedia"
        }
      ],
      "warnings": []
    }
  ],
  "errors": [],
  "modelVersion": "2020-02-01"
}

ÖzetSummary

Bu makalede, bilişsel hizmetler 'deki Metin Analizi kullanarak varlık bağlama kavramlarını ve iş akışını öğrendiniz.In this article, you learned concepts and workflow for entity linking using Text Analytics in Cognitive Services. Özet:In summary:

  • İstek gövdesindeki JSON belgeleri bir KIMLIK, metin ve dil kodu içerir.JSON documents in the request body include an ID, text, and language code.
  • POST istekleri bir veya daha fazla uç noktaya gönderilir, bu, kişiselleştirilmiş bir erişim anahtarı ve aboneliğiniz için geçerli bir uç nokta kullanılarak gönderilir.POST requests are sent to one or more endpoints, using a personalized access key and an endpoint that is valid for your subscription.
  • Bağlı varlıklardan oluşan yanıt çıkışı (her belge KIMLIĞI için güven puanları, uzaklıklar ve Web bağlantıları dahil) herhangi bir uygulamada kullanılabilirResponse output, which consists of linked entities (including confidence scores, offsets, and web links, for each document ID) can be used in any application

Sonraki adımlarNext steps