Gestructureerd objecten buiten tekenreeks uitpakken en parserenExtract and Parse Structured Objects out of String

Dit brengt ook aanvullende functionaliteit voor de cmdlet ConverterenVan-tekenreeks:This also introduces some additional functionality for the ConvertFrom-String cmdlet:

  • Hiermee verwijdert u de teksteigenschap gebied standaard.Removes the extent text property by default. U kunt opnemen met de parameter - IncludeExtent.You can include it with the -IncludeExtent parameter.

  • Veel learning-algoritme foutoplossingen van MVP en community feedback.Many learning algorithm bug fixes from MVP and community feedback.

  • Een nieuwe UpdateTemplate - parameter voor de resultaten van het leeralgoritme in een opmerking in het sjabloonbestand op te slaan.A new -UpdateTemplate parameter to save the results of the learning algorithm into a comment in the template file. Hierdoor kunt u de learning verwerken (de traagste fase) een eenmalige kosten.This makes the learning process (the slowest stage) a one-time cost. Het omzetten van tekenreeks uitgevoerd met een sjabloon met de gecodeerde learning-algoritme is nu bijna onmiddellijk.Running Convert-String with a template that contains the encoded learning algorithm is now nearly instantaneous.

Uitpakken en parseren van gestructureerde objecten uit de inhoud van de tekenreeksExtract and parse structured objects out of string content

In samenwerking met Microsoft Research, een nieuwe ConverterenVan-tekenreeks cmdlet is toegevoegd.In collaboration with Microsoft Research, a new ConvertFrom-String cmdlet has been added.

Deze cmdlet ondersteunt twee modi: basic gescheiden parseren en automatisch gegenereerd voorbeeld aangestuurde parseren.This cmdlet supports two modes: basic delimited parsing, and auto generated example-driven parsing.

Parseren standaard gescheiden splitst de invoer op witruimte en worden de namen van eigenschappen wordt toegewezen aan de resulterende groepen.Delimited parsing, by default, splits the input at white space, and assigns property names to the resulting groups. U kunt het scheidingsteken aanpassen:You can customize the delimiter:

1 [C:\temp] > > 'Hallo wereld' | ConverterenVan-tekenreeks | Format-Table-automatisch1 [C:\temp] >> "Hello World" | ConvertFrom-String | Format-Table -Auto

P1 P2P1 P2


De cmdlet ondersteunt ook automatisch gegenereerde voorbeeld aangestuurde parseren op basis van de FlashExtract onderzoek werk in Microsoft Research.The cmdlet also supports auto-generated example-driven parsing based on the FlashExtract research work in Microsoft Research.

Houd rekening met een op tekst gebaseerde adresboek om te beginnen:To get started, consider a text-based address book:

Ana Trujillo

Redmond, WA

Antonio Moreno

Renton, WA

Thomas Hardy

Seattle, WA

Christina Berglund

Redmond, WA

Hanna Moos

Puyallup, WA

Kopieer een paar voorbeelden naar een bestand, dat u als uw sjabloon gebruiken gaat:Copy a few examples into a file, which you will use as your template:

Ana Trujillo

Redmond, WA

Antonio Moreno

Renton, WA

Plaats accolades gebruiken om gegevens die u ophalen wilt, een naam geven als u doet dit.Put curly braces around data that you want to extract, giving it a name as you do so. Omdat de naam eigenschap (en de andere eigenschappen die zijn gekoppeld) kunnen meerdere keren worden weergegeven, gebruikt u een sterretje (*) om aan te geven dat dit resulteert in meerdere records (in plaats van een aantal eigenschappen in te pakken op een record):Because the Name property (and its associated other properties) can appear multiple times, use an asterisk (*) to indicate that this results in multiple records (rather than extracting a bunch of properties into one record):

{Name\*:Ana Trujillo}

{City:Redmond}, {State:WA}

{Name\*:Antonio Moreno}

{City:Renton}, {State:WA}

In deze reeks voorbeelden ConverterenVan-tekenreeks uitvoer op basis van het object automatisch nu uit invoerbestanden met vergelijkbare structuur kan extraheren.From this set of examples, ConvertFrom-String can now automatically extract object-based output from input files with similar structure.

2 [C:\temp]2 [C:\temp]

>> Get-inhoud. \addresses.output.txt | ConverterenVan-tekenreeks - sjabloonbestand. \addresses.template.txt | > > > Format-Table-automatisch>> Get-Content .\addresses.output.txt | ConvertFrom-String -TemplateFile .\addresses.template.txt | >>> Format-Table -Auto

ExtentText naam stad statusExtentText Name City State


ANA Trujillo... ANA Trujillo Redmond, WA Antonio Moreno... Antonio Moreno Renton WA Thomas Hardy... Thomas Hardy Seattle WA Pascaline Berglund... Pascaline Berglund Redmond WA Hanna Moos... Hanna Moos Puyallup WAAna Trujillo... Ana Trujillo Redmond WA Antonio Moreno... Antonio Moreno Renton WA Thomas Hardy... Thomas Hardy Seattle WA Christina Berglund... Christina Berglund Redmond WA Hanna Moos... Hanna Moos Puyallup WA

Aanvullende gegevensmanipulatie op uitgepakte tekst, doen de ExtentText eigenschap bevat de onbewerkte tekst waaruit de record is opgehaald.To do additional data manipulation on extracted text, the ExtentText property captures the raw text from which the record was extracted. Feedback geven over deze functie of inhoud waarvoor u problemen ondervindt schrijven voorbeelden te delen, kunt u een e-mail psdmfb@microsoft.com.To provide feedback on this feature, or to share content for which you are having difficulty writing examples, please email psdmfb@microsoft.com.