Textanalys

I den här artikeln beskrivs modulerna för text analys som ingår i Azure Machine Learning Studio (klassisk). Dessa moduler tillhandahåller specialiserade beräknings verktyg för att arbeta med både strukturerad och ostrukturerad text, inklusive:

  • Flera alternativ för förbehandling av text.
  • Språk identifiering.
  • Skapa funktioner från text med anpassningsbara n-gram-ordlistor.
  • Hashing av funktioner för att effektivt analysera text utan för bearbetning eller avancerad språklig analys.
  • Vowpal Wabbit, för mycket snabb maskin inlärning på text. Vowpal Wabbit har stöd för funktions-hashing, ämnes modellering (LDA) och klassificering.
  • Igenkänning av namngivna enheter för att extrahera namn på personer, platser och organisationer från ostrukturerad text.

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra-och släpp moduler har lagts till i Azure Machine Learning designer. Mer information i den här artikeln är att jämföra de två versionerna.

Exempel

Exempel på text analys som använder Azure Machine Learning finns i Azure AI Gallery:

  • Kategorisering av diskussions grupper: använder funktionen hashing för att klassificera artiklar i en fördefinierad lista med kategorier.

  • Hitta liknande företag: använder texten i Wikipedia-artiklar för att kategorisera företag.

  • Text klassificering: visar processen från slut punkt till slut punkt för att använda text från Twitter-meddelanden i sentiment Analysis (exempel på fem delar).

Lista över moduler

Kategorin textanalys i Azure Machine Learning Studio (klassisk) innehåller följande moduler:

Se även