Der kognitive Skill „Text zusammenführen“Text Merge cognitive skill

Der Skill Text zusammenführen konsolidiert Text aus einer Sammlung von Feldern in einem einzigen Feld.The Text Merge skill consolidates text from a collection of fields into a single field.

Hinweis

Dieser Skill ist nicht an eine Cognitive Services-API gebunden, und Ihnen entstehen für seine Nutzung keine Kosten.This skill is not bound to a Cognitive Services API and you are not charged for using it. Es wird jedoch empfohlen, dennoch eine Cognitive Services-Ressource anzufügen, um die Ressourcenoption Free außer Kraft zu setzen, durch die Sie auf eine geringe Anzahl von Anreicherungen pro Tag beschränkt werden.You should still attach a Cognitive Services resource, however, to override the Free resource option that limits you to a small number of daily enrichments per day.

@odata.type

Microsoft.Skills.Text.MergeSkillMicrosoft.Skills.Text.MergeSkill

SkillparameterSkill parameters

Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden.Parameters are case-sensitive.

ParameternameParameter name BESCHREIBUNGDescription
insertPreTaginsertPreTag Zeichenfolge, die vor jedem Einfügen hinzugefügt wird.String to be included before every insertion. Standardwert: " ".The default value is " ". Um das Leerzeichen wegzulassen, setzen Sie den Wert auf "".To omit the space, set the value to "".
insertPostTaginsertPostTag Zeichenfolge, die nach jedem Einfügen hinzugefügt wird.String to be included after every insertion. Standardwert: " ".The default value is " ". Um das Leerzeichen wegzulassen, setzen Sie den Wert auf "".To omit the space, set the value to "".

BeispieleingabeSample input

So könnte ein JSON-Dokument aussehen, das hilfreiche Eingabewerte für diesen Skill enthält:A JSON document providing usable input for this skill could be:

{
  "values": [
    {
      "recordId": "1",
      "data":
      {
        "text": "The brown fox jumps over the dog",
        "itemsToInsert": ["quick", "lazy"],
        "offsets": [3, 28],
      }
    }
  ]
}

BeispielausgabeSample output

Dieses Beispiel zeigt die Ausgabe der vorherigen Eingabe, vorausgesetzt, dass insertPreTag auf " " und insertPostTag auf "" gesetzt ist.This example shows the output of the previous input, assuming that the insertPreTag is set to " ", and insertPostTag is set to "".

{
  "values": [
    {
      "recordId": "1",
      "data":
      {
        "mergedText": "The quick brown fox jumps over the lazy dog"
      }
    }
  ]
}

Erweiterte Beispiel für die Definition eines SkillsetsExtended sample skillset definition

Ein gängiges Szenario für die Verwendung von „Text zusammenführen“ ist das Zusammenführen der Textdarstellung von Bildern (Text aus einem OCR-Skill oder der Titel eines Bildes) im Inhaltsfeld eines Dokuments.A common scenario for using Text Merge is to merge the textual representation of images (text from an OCR skill, or the caption of an image) into the content field of a document.

Im folgenden Beispiel für ein Skillset wird der OCR-Skill verwendet, um Text aus in das Dokument eingebetteten Bildern zu extrahieren.The following example skillset uses the OCR skill to extract text from images embedded in the document. Als nächstes wird ein Feld merged_text erstellt, das sowohl Original- als auch OCR-Text aus jedem Bild enthält.Next, it creates a merged_text field to contain both original and OCRed text from each image. Weitere Informationen zur OCR-Qualifikation finden Sie hier.You can learn more about the OCR skill here.

{
  "description": "Extract text from images and merge with content text to produce merged_text",
  "skills":
  [
    {
      "description": "Extract text (plain and structured) from image.",
      "@odata.type": "#Microsoft.Skills.Vision.OcrSkill",
      "context": "/document/normalized_images/*",
      "defaultLanguageCode": "en",
      "detectOrientation": true,
      "inputs": [
        {
          "name": "image",
          "source": "/document/normalized_images/*"
        }
      ],
      "outputs": [
        {
          "name": "text"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.MergeSkill",
      "description": "Create merged_text, which includes all the textual representation of each image inserted at the right location in the content field.",
      "context": "/document",
      "insertPreTag": " ",
      "insertPostTag": " ",
      "inputs": [
        {
          "name":"text", "source": "/document/content"
        },
        {
          "name": "itemsToInsert", "source": "/document/normalized_images/*/text"
        },
        {
          "name":"offsets", "source": "/document/normalized_images/*/contentOffset" 
        }
      ],
      "outputs": [
        {
          "name": "mergedText", "targetName" : "merged_text"
        }
      ]
    }
  ]
}

Im oben gezeigten Beispiel wird davon ausgegangen, dass ein Feld mit normalisierten Bildern vorhanden ist.The example above assumes that a normalized-images field exists. Um ein Feld mit normalisierten Bildern zu erhalten, legen Sie die Konfiguration imageAction in Ihrer Indexerdefinition auf generateNormalizedImages fest, wie unten gezeigt:To get normalized-images field, set the imageAction configuration in your indexer definition to generateNormalizedImages as shown below:

{
  //...rest of your indexer definition goes here ...
  "parameters":{
    "configuration":{
        "dataToExtract":"contentAndMetadata",
        "imageAction":"generateNormalizedImages"
    }
  }
}

Weitere InformationenSee also