Extrahera nyckelfraser från text

Extraherar nyckelfraser från en viss text

Kategori: Textanalys

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra-och släpp moduler har lagts till i Azure Machine Learning designer. Mer information i den här artikeln är att jämföra de två versionerna.

Modulöversikt

Den här artikeln förklarar hur du använder modulen Extrahera nyckelfraser från text i Azure Machine Learning Studio (klassisk) för att förbeprocessa en textkolumn. Med en kolumn med text på naturligt språk extraherar modulen en eller flera meningsfulla fraser. En fras kan vara ett enda ord, ett sammansatt substantiv eller en modifierare plus ett substantiv.

Den här modulen är en omser för bearbetning av API:er för naturligt språk för extrahering av nyckelfraser. Fraserna analyseras som potentiellt meningsfulla i kontexten för meningen av olika skäl:

  • Frasen fångar upp ämnet i meningen.
  • Frasen innehåller en kombination av modifierare och substantiv som anger sentiment.

Anta till exempel att den analyserade meningen är: "Det var ett fantastiskt hotell att bo på, med unik känsla och vänlig personal."

Modulen Extrahera nyckelfraser från text kan returnera följande nyckelfraser:

  • fantastiska hotell
  • vänlig personal
  • unik unika

Så här konfigurerar du extrahering av nyckelfraser från text

Om du vill extrahera nyckelfraser måste du ansluta en datauppsättning som har en textkolumn.

  1. Lägg till modulen Extrahera nyckelfraser från text i experimentet i Azure Machine Learning Studio (klassisk). Anslut sedan en datauppsättning som har minst en fulltextkolumn.

  2. Använd kolumnväljaren för att välja en kolumn av typen sträng som du vill extrahera nyckelfraser från.

  3. För Språk väljer du ett språk som ska användas vid analys av fraser. Om du anger ett språk matas endast fraser i målspråket ut.

  4. Om textkolumnen innehåller fraser på flera språk väljer du alternativet Språk som identifierats i kolumnerna. En ny kolumnväljare visas där du kan välja en kolumn i datauppsättningen som innehåller en språkidentifierare. Språkidentifieraren kan antingen vara språknamnet eller iso6391-kulturidentifieraren. Till exempel är "engelska" eller "en" godtagbara.

    Tips

    Innan du kör Extrahera nyckelfraser från text använder du modulen Identifiera språk för att identifiera språket på varje rad och generera identifieraren åt dig. Ett fel uppstår om kolumnen för språkidentifierare innehåller språk som inte stöds av Extrahera nyckelfraser från text.

Resultat

Utdata från modulen är en datauppsättning som innehåller en kolumn med kommaavgränsade nyckelfraser.

Till exempel är följande exempelresultat för en indatauppsättning som innehåller granskningar på flera språk:

Nyckelfraser
roman, lycksent, bra bok, adventure story, avalanche av händelser, bra tecken
primer primer primerio,personajes,fan,aventura,isla
  • Alla utdatafraser finns i en enda kolumn. inga andra kolumner skickas och ingen identifierare läggs till. Men om du vill justera utdatafraserna med källtexten kan du kombinera utdatafraserna med indata med hjälp av modulen Lägg till kolumner.

  • Utdata från extrahering av nyckelfraser flaggar inte språket för enskilda fraser.

  • Om ett språk ingår som inte stöds av modulen Extrahera nyckelfraser utlöses ett fel (0039). För att undvika fel måste du filtrera bort indatatext som har en inkompatibel språkidentifierare.

    Om det finns mycket få rader med andra språk kan du också undvika felet genom att utelämna språkidentifieraren och analysera all text med ett enda språkval. Men när du gör det blir resultatet mycket dåligt, eftersom hela meningar på de andra språken kan matas ut som en enda nyckelfras.

Exempel

Följande exempel visar hur du använder den här modulen för att extrahera nyckelfraser och sedan skapa ett ordmoln från fraserna: Extrahera nyckelfraser och Visa Ordmoln

Fler exempel på textbearbetning med hjälp av Azure AI Gallery finns i Azure Machine Learning.

Teknisk information

Den här modulen stöder för närvarande följande språk:

  • Nederländska
  • Engelska
  • Franska
  • Tyska
  • Italienska
  • Spanska

Överväg att använda API:et för Textanalys språk i Azure Cognitive Services. Mer information finns i Extrahera nyckelfraser i Textanalys

Förväntade indata

Namn Typ Description
Datamängd Datatabell Tabellen som innehåller texten som ska bearbetas.

Modulparametrar

Namn Typ Intervall Valfritt Standardvärde Description
Kolumnen Kulturspråk ColumnSelection language:Kolumnen innehåller språk Namn eller ettbaserat index för kolumnen som innehåller information om kulturspråket
Textkolumn ColumnSelection Obligatorisk Namn eller ettbaserat index för textkolumnen.
Språk T_Language Engelska, spanska, franska, nederländska, tyska, italienska, kolumn innehåller språk Obligatorisk Engelska Välj språket för texten som ska bearbetas.

Utdata

Namn Typ Description
Resultatdatauppsättning Datatabell Extraherade nyckelfraser

Undantag

Undantag Description
Fel 0003 Undantag inträffar om en eller flera indata är null eller tomma.
Fel 0010 Undantag inträffar om indatauppsättningar har kolumnnamn som ska matcha men inte.
Fel 0016 Undantaget inträffar om indatauppsättningar som skickas till modulen ska ha kompatibla kolumntyper men inte göra det.
Fel 0008 Undantaget inträffar om parametern inte är inom intervallet.

En lista över fel som är specifika för Studio-moduler (klassisk) finns i Machine Learning felkoder.

En lista över API-undantag finns i Machine Learning REST API felkoder.

Se även

Textanalys
A-Z-modullista