Gestructureerd objecten buiten tekenreeks uitpakken en parserenExtract and Parse Structured Objects out of String

Dit ook aanvullende functionaliteit voor introduceert de ConvertFrom-String cmdlet:This also introduces some additional functionality for the ConvertFrom-String cmdlet:

  • Hiermee verwijdert u de eigenschap van de tekst voor zover standaard.Removes the extent text property by default. U kunt opnemen met de parameter - IncludeExtent.You can include it with the -IncludeExtent parameter.

  • Veel learning-algoritme voor oplossingen voor problemen van MVP en community-feedback.Many learning algorithm bug fixes from MVP and community feedback.

  • Een nieuwe UpdateTemplate - parameter op te slaan van de resultaten van het learning-algoritme in een opmerking in het sjabloonbestand.A new -UpdateTemplate parameter to save the results of the learning algorithm into a comment in the template file. Dit maakt het learning verwerken (de traagste fase) een eenmalige kosten.This makes the learning process (the slowest stage) a one-time cost. Het omzetten van tekenreeks uitvoeren met een sjabloon met het gecodeerde learning-algoritme is nu nagenoeg onmiddellijke.Running Convert-String with a template that contains the encoded learning algorithm is now nearly instantaneous.

Gestructureerd objecten buiten tekenreeks inhoud uitpakken en parserenExtract and parse structured objects out of string content

In samenwerking met Microsoft Research, een nieuwe ConvertFrom-String cmdlet is toegevoegd.In collaboration with Microsoft Research, a new ConvertFrom-String cmdlet has been added.

Deze cmdlet ondersteunt twee modi: basic gescheiden parseren en automatisch gegenereerde voorbeeld gebaseerde parseren.This cmdlet supports two modes: basic delimited parsing, and auto generated example-driven parsing.

Gescheiden parseren, standaard, splitst de invoer op witruimte en namen van eigenschappen aan de resulterende groepen toegewezen.Delimited parsing, by default, splits the input at white space, and assigns property names to the resulting groups. U kunt het scheidingsteken aanpassen:You can customize the delimiter:

"Hello World" | ConvertFrom-String | Format-Table -Auto
P1     P2
--     --
Hello  World

De cmdlet biedt ook ondersteuning voor automatisch gegenereerde voorbeeld gebaseerde parseren op basis van de FlashExtract werk in onderzoek Microsoft Research.The cmdlet also supports auto-generated example-driven parsing based on the FlashExtract research work in Microsoft Research.

Als u wilt beginnen, kunt u overwegen een op tekst gebaseerde adresboek:To get started, consider a text-based address book:

    Ana Trujillo

    Redmond, WA

    Antonio Moreno

    Renton, WA

    Thomas Hardy

    Seattle, WA

    Christina Berglund

    Redmond, WA

    Hanna Moos

    Puyallup, WA

Enkele voorbeelden kopiëren naar een bestand, dat u als de sjabloon gebruikt:Copy a few examples into a file, which you will use as your template:

    Ana Trujillo

    Redmond, WA

    Antonio Moreno

    Renton, WA

Plaats accolades om de gegevens die u ophalen wilt, een naam geven als u dit doet.Put curly braces around data that you want to extract, giving it a name as you do so. Omdat de naam eigenschap (en de andere eigenschappen die zijn gekoppeld) kunnen meerdere keren worden weergegeven, gebruikt u een sterretje (*) om aan te geven dat dit resulteert in meerdere records (in plaats van een aantal eigenschappen in één extraheren record):Because the Name property (and its associated other properties) can appear multiple times, use an asterisk (*) to indicate that this results in multiple records (rather than extracting a bunch of properties into one record):

    {Name\*:Ana Trujillo}

    {City:Redmond}, {State:WA}

    {Name\*:Antonio Moreno}

    {City:Renton}, {State:WA}

In deze reeks voorbeelden, ConvertFrom-String uitvoer op basis van het object nu automatisch uit invoerbestanden met vergelijkbare structuur extraheren.From this set of examples, ConvertFrom-String can now automatically extract object-based output from input files with similar structure.

Get-Content .\addresses.output.txt | ConvertFrom-String -TemplateFile .\addresses.template.txt | Format-Table -Auto
ExtentText                     Name               City     State
----------                     ----               ----     -----
Ana Trujillo...                Ana Trujillo       Redmond  WA
Antonio Moreno...              Antonio Moreno     Renton   WA
Thomas Hardy...                Thomas Hardy       Seattle  WA
Christina Berglund...          Christina Berglund Redmond  WA
Hanna Moos...                  Hanna Moos         Puyallup WA

Aanvullende gegevens manipuleren op geëxtraheerde tekst, doet de ExtentText eigenschap bevat de onbewerkte tekst waaruit de record is opgehaald.To do additional data manipulation on extracted text, the ExtentText property captures the raw text from which the record was extracted. Feedback geven over deze functie of inhoud die u ondervindt problemen bij het schrijven van voorbeelden te delen, stuur e-mail psdmfb@microsoft.com.To provide feedback on this feature, or to share content for which you are having difficulty writing examples, please email psdmfb@microsoft.com.