Aptitud cognitiva Combinación de textoText Merge cognitive skill

La aptitud Combinación de texto consolida el texto de una colección de campos en un solo campo.The Text Merge skill consolidates text from a collection of fields into a single field.

Nota

Esta aptitud no está enlazada a una API de Cognitive Services y no se le cobrará por usarla.This skill is not bound to a Cognitive Services API and you are not charged for using it. Sin embargo, debe adjuntar un recurso de Cognitive Services para invalidar la opción del recurso Gratis, que tiene un límite de unos pocos enriquecimientos al día.You should still attach a Cognitive Services resource, however, to override the Free resource option that limits you to a small number of daily enrichments per day.

@odata.type

Microsoft.Skills.Text.MergeSkillMicrosoft.Skills.Text.MergeSkill

Parámetros de la aptitudSkill parameters

Los parámetros distinguen mayúsculas de minúsculas.Parameters are case-sensitive.

Nombre de parámetroParameter name DESCRIPCIÓNDescription
insertPreTaginsertPreTag Cadena que se incluirá antes de cada inserción.String to be included before every insertion. El valor predeterminado es " ".The default value is " ". Para omitir el espacio, establezca el valor en "".To omit the space, set the value to "".
insertPostTaginsertPostTag Cadena que se incluirá después de cada inserción.String to be included after every insertion. El valor predeterminado es " ".The default value is " ". Para omitir el espacio, establezca el valor en "".To omit the space, set the value to "".

Entrada de ejemploSample input

Un documento JSON con una entrada útil para esta aptitud podría ser:A JSON document providing usable input for this skill could be:

{
  "values": [
    {
      "recordId": "1",
      "data":
      {
        "text": "The brown fox jumps over the dog",
        "itemsToInsert": ["quick", "lazy"],
        "offsets": [3, 28],
      }
    }
  ]
}

Salida de ejemploSample output

Este ejemplo muestra la salida de la entrada anterior, suponiendo que insertPreTag esté establecido en " " y insertPostTag esté establecido en "".This example shows the output of the previous input, assuming that the insertPreTag is set to " ", and insertPostTag is set to "".

{
  "values": [
    {
      "recordId": "1",
      "data":
      {
        "mergedText": "The quick brown fox jumps over the lazy dog"
      }
    }
  ]
}

Definición del conjunto de aptitudes de ejemplo extendidoExtended sample skillset definition

Un escenario común a la hora de utilizar Combinación de texto es combinar la representación textual de imágenes (el texto de una aptitud de OCR o la leyenda de una imagen) en el campo de contenido de un documento.A common scenario for using Text Merge is to merge the textual representation of images (text from an OCR skill, or the caption of an image) into the content field of a document.

El siguiente conjunto de aptitudes de ejemplo utiliza la aptitud OCR para extraer el texto de las imágenes insertadas en el documento.The following example skillset uses the OCR skill to extract text from images embedded in the document. A continuación, crea un campo merged_text para que contenga el texto original y el texto de OCR de cada imagen.Next, it creates a merged_text field to contain both original and OCRed text from each image. Puede aprender más sobre la habilidad de OCR aquí.You can learn more about the OCR skill here.

{
  "description": "Extract text from images and merge with content text to produce merged_text",
  "skills":
  [
    {
      "description": "Extract text (plain and structured) from image.",
      "@odata.type": "#Microsoft.Skills.Vision.OcrSkill",
      "context": "/document/normalized_images/*",
      "defaultLanguageCode": "en",
      "detectOrientation": true,
      "inputs": [
        {
          "name": "image",
          "source": "/document/normalized_images/*"
        }
      ],
      "outputs": [
        {
          "name": "text"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.MergeSkill",
      "description": "Create merged_text, which includes all the textual representation of each image inserted at the right location in the content field.",
      "context": "/document",
      "insertPreTag": " ",
      "insertPostTag": " ",
      "inputs": [
        {
          "name":"text", "source": "/document/content"
        },
        {
          "name": "itemsToInsert", "source": "/document/normalized_images/*/text"
        },
        {
          "name":"offsets", "source": "/document/normalized_images/*/contentOffset" 
        }
      ],
      "outputs": [
        {
          "name": "mergedText", "targetName" : "merged_text"
        }
      ]
    }
  ]
}

En el ejemplo anterior se asume que existe un campo de imágenes normalizadas.The example above assumes that a normalized-images field exists. Para obtener este campo de imágenes normalizadas, establezca la configuración imageAction en la definición del indexador en generateNormalizedImages, tal como se muestra a continuación:To get normalized-images field, set the imageAction configuration in your indexer definition to generateNormalizedImages as shown below:

{
  //...rest of your indexer definition goes here ...
  "parameters":{
    "configuration":{
        "dataToExtract":"contentAndMetadata",
        "imageAction":"generateNormalizedImages"
    }
  }
}

Otras referenciasSee also