Aptitud cognitiva para la extracción de frases claveKey Phrase Extraction cognitive skill

La aptitud Extracción de frases clave evalúa el texto no estructurado y, en cada registro, devuelve una lista de frases clave.The Key Phrase Extraction skill evaluates unstructured text, and for each record, returns a list of key phrases. Esta aptitud utiliza los modelos de aprendizaje automático proporcionados por Text Analytics en Cognitive Services.This skill uses the machine learning models provided by Text Analytics in Cognitive Services.

Esta capacidad es útil si necesita identificar rápidamente los principales puntos de conversación en el registro.This capability is useful if you need to quickly identify the main talking points in the record. Por ejemplo, dado el texto de entrada "La comida estaba deliciosa y el personal era maravilloso", el servicio devuelve "comida" y "personal maravilloso".For example, given input text "The food was delicious and there were wonderful staff", the service returns "food" and "wonderful staff".

Nota

A medida que expanda el ámbito aumentando la frecuencia de procesamiento, agregando más documentos o agregando más algoritmos de IA, tendrá que asociar un recurso facturable de Cognitive Services.As you expand scope by increasing the frequency of processing, adding more documents, or adding more AI algorithms, you will need to attach a billable Cognitive Services resource. Se acumulan cargos cuando se llama a las API de Cognitive Services y en la extracción de imágenes como parte de la fase de descifrado de documentos de Azure Cognitive Search.Charges accrue when calling APIs in Cognitive Services, and for image extraction as part of the document-cracking stage in Azure Cognitive Search. No hay ningún cargo por la extracción de texto de documentos.There are no charges for text extraction from documents.

La ejecución de aptitudes integradas se cobra según los precios de pago por uso de Cognitive Services existentes.Execution of built-in skills is charged at the existing Cognitive Services pay-as-you go price. Los precios de la extracción de imágenes se describen en la página de precios de Búsqueda cognitiva de Azure.Image extraction pricing is described on the Azure Cognitive Search pricing page.

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkillMicrosoft.Skills.Text.KeyPhraseExtractionSkill

Límites de datosData limits

El tamaño máximo de un registro debe ser de 50 000 caracteres, medidos por String.Length.The maximum size of a record should be 50,000 characters as measured by String.Length. Si tiene que dividir los datos antes de enviarlos al extractor de frases clave, puede usar la aptitud de división de texto.If you need to break up your data before sending it to the key phrase extractor, consider using the Text Split skill.

Parámetros de las aptitudesSkill parameters

Los parámetros distinguen mayúsculas de minúsculas.Parameters are case-sensitive.

EntradasInputs DESCRIPCIÓNDescription
defaultLanguageCodedefaultLanguageCode (Opcional) Es el código de idioma que se aplicará a los documentos que no especifiquen el lenguaje de forma explícita.(Optional) The language code to apply to documents that don't specify language explicitly. Si no se especifica el código de idioma predeterminado, se usará el inglés (en) como código de idioma predeterminado.If the default language code is not specified, English (en) will be used as the default language code.
Ver Full list of supported languages (Lista completa de idiomas admitidos).See Full list of supported languages.
maxKeyPhraseCountmaxKeyPhraseCount (Opcional) Es el número máximo de frases clave para producir.(Optional) The maximum number of key phrases to produce.

Entradas de la aptitudSkill inputs

EntradasInputs DESCRIPCIÓNDescription
texttext Texto que se va a analizar.The text to be analyzed.
languageCodelanguageCode Cadena que indica el idioma de los registros.A string indicating the language of the records. Si no se especifica este parámetro, el código de idioma predeterminado se utilizará para analizar los registros.If this parameter is not specified, the default language code will be used to analyze the records.
Ver Full list of supported languages (Lista completa de idiomas admitidos).See Full list of supported languages

Definición de ejemploSample definition

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/languagecode" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

Entrada de ejemploSample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
             "language": "en"
           }
      }
    ]

Salida de ejemploSample output

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
            "keyPhrases": 
            [
              "world’s glaciers", 
              "huge rivers of ice", 
              "Canadian Rockies", 
              "iconic landscapes",
              "Mount Everest region",
              "Continued warming"
            ]
           }
      }
    ]
}

Errores y advertenciasErrors and warnings

Si proporciona un código de idioma no admitido, se generará un error y no se extraerán las frases clave.If you provide an unsupported language code, an error is generated and key phrases are not extracted. Si el texto está vacío, se creará una advertencia.If your text is empty, a warning will be produced. Si el texto tiene más de 50 000 caracteres, solo se analizarán los primeros 50 000 caracteres y se emitirá una advertencia.If your text is larger than 50,000 characters, only the first 50,000 characters will be analyzed and a warning will be issued.

Otras referenciasSee also