Sleutel zinnen uit tekst extra heren

Extraheert sleutel zinnen uit opgegeven tekst

Categorie: Text Analytics

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

Module overzicht

In dit artikel wordt uitgelegd hoe u de sleutel woorden uit de module tekst in azure machine learning Studio (klassiek) kunt gebruiken om een tekst kolom vooraf te verwerken. Op basis van een kolom met tekst in natuurlijke taal, extraheert de module een of meer zinvolle woord groepen. Een woord groep kan bestaan uit één woord, een samengesteld zelfstandig woord of een aanpassings functie plus een zelfstandig naam paar.

Deze module is een wrapper voor de verwerking van Api's met natuurlijke taal voor het uitpakken van sleutel zinnen. De zinnen worden geanalyseerd als mogelijke betekenis in de context van de zin om verschillende redenen:

  • De woord groep legt het onderwerp van de zin vast.
  • De woord groep bevat een combi natie van modifier en zelfstandig naam woord dat sentiment aangeeft.

Stel dat de geanalyseerde zin als volgt is: "het is een fantastische hotel om op te blijven, met unieke décor en gebruiks vriendelijker personeel."

De sleutel woorden uit de module extra heren retour neren mogelijk deze sleutel zinnen:

  • fantastische hotels
  • vriendelijk personeel
  • unieke décor

Sleutel zinnen voor extra heren uit tekst configureren

Als u sleutel zinnen wilt extra heren, moet u een gegevensset met een tekst kolom verbinden.

  1. Voeg de sleutel zinnen extra heren uit de tekst module toe aan uw experiment in azure machine learning Studio (klassiek). Verbind vervolgens een gegevensset met ten minste één volledige-tekst kolom.

  2. Gebruik de kolom kiezer om een kolom van het type teken reeks te selecteren waaruit u sleutel zinnen wilt extra heren.

  3. Voor taalselecteert u een taal die moet worden gebruikt bij het analyseren van zinsdelen. Als u een taal opgeeft, worden alleen de zinnen in de doel taal uitgevoerd.

  4. Als de tekst kolom zinsdelen in meerdere talen bevat, kiest u de optie taal die in de kolommen is geïdentificeerd. Er wordt een nieuwe kolom kiezer weer gegeven waarmee u een kolom in uw gegevensset kunt selecteren die een taal-id bevat. De taal-id kan de taal naam of de Iso6391-cultuur-id zijn. Bijvoorbeeld: ' Engels ' of ' en ' zijn toegestaan.

    Tip

    Voordat u sleutel zinnen uitpakt vanuit tekst, gebruikt u de module talen detecteren om de taal in elke rij te identificeren en de id voor u te genereren. Er treedt een fout op als de kolom language Identifier een taal bevat die niet wordt ondersteund door sleutel zinnen uit tekst te halen.

Resultaten

De uitvoer van de module is een gegevensset met een kolom met door komma's gescheiden sleutel zinnen.

De volgende voorbeeld resultaten zijn bijvoorbeeld voor een invoer gegevensset met beoordelingen in meerdere talen:

Sleutel zinnen
roman, nucleair onderzeese, goed boek, Adventure verhaal, Avalanche van evenementen, goede tekens
primer Misterio, personajes, ventilator, Aventura, Isla
  • Alle uitvoer zinnen bevinden zich in één kolom. Er worden geen andere kolommen door gegeven en er wordt geen id toegevoegd. Als u de uitvoer zinnen echter wilt uitlijnen met de bron tekst, kunt u de uitvoer zinnen opnieuw combi neren met de invoer met behulp van de module kolommen toevoegen .

  • De uitvoer van de sleutel woord extractie markeert niet de taal van afzonderlijke zinsdelen.

  • Als een taal is opgenomen die niet wordt ondersteund door de module voor sleutel zinnen voor extractie , treedt er een fout op (0039). Als u fouten wilt voor komen, moet u ervoor zorgen dat invoer tekst met een niet-compatibele taal-id wordt gefilterd.

    Als er zeer weinig rijen van andere talen zijn, kunt u de fout ook vermijden door de taal-id weg te laten en alle tekst te analyseren met één taal selectie. Wanneer u dit echter doet, zijn de resultaten zeer slecht, omdat de hele zinnen in de andere talen kunnen worden uitgevoerd als een enkele sleutel woord.

Voorbeelden

In het volgende voor beeld wordt gedemonstreerd hoe u deze module gebruikt om sleutel zinnen te extra heren en vervolgens een Word-Cloud te bouwen met de woord groepen: sleutel zinnen extra heren en de Word-Cloud weer geven

Zie de Azure AI Gallery voor meer voor beelden van tekst verwerking met behulp van Azure machine learning.

Technische opmerkingen

Deze module ondersteunt momenteel de volgende talen:

  • Nederlands
  • Engels
  • Frans
  • Duits
  • Italiaans
  • Spaans

Voor extra talen kunt u de Text Analytics-API gebruiken in azure Cognitive Services. Zie sleutel zinnen extra heren in Text Analytics voor meer informatie.

Verwachte invoer

Naam Type Beschrijving
Gegevensset Gegevens tabel De tabel die de tekst bevat die moet worden verwerkt.

Module parameters

Naam Type Bereik Optioneel Standaard Beschrijving
Kolom cultuur-taal ColumnSelection taal: kolom bevat taal Naam of een index van de kolom die de informatie over de cultuur taal bevat
Tekst kolom ColumnSelection Vereist Naam of een index van de tekst kolom.
Taal T_Language Engels, Spaans, Frans, Nederlands, Duits, Italiaans, kolom bevat taal Vereist Engels Selecteer de taal van de tekst die moet worden verwerkt.

Outputs

Naam Type Beschrijving
Gegevensset voor resultaten Gegevens tabel De geëxtraheerde sleutel zinnen

Uitzonderingen

Uitzondering Beschrijving
Fout 0003 Uitzonde ring treedt op als een of meer invoer waarden null of leeg zijn.
Fout 0010 Uitzonde ring treedt op als invoer gegevens sets kolom namen bevatten die moeten overeenkomen, maar niet.
Fout 0016 Uitzonde ring treedt op als invoer gegevens sets die zijn door gegeven aan de module compatibele kolom typen moeten hebben, maar dat niet.
Fout 0008 Uitzonde ring treedt op als de para meter niet binnen het bereik valt.

Zie machine learning fout codesvoor een lijst met fouten die specifiek zijn voor Studio-modules (Classic).

Zie Machine Learning rest API fout codesvoor een lijst met API-uitzonde ringen.

Zie ook

Text Analytics
Module lijst a-Z