Extraire les phrases clés d’un texte

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Extrait des expressions clés du texte donné

catégorie : Analyse de texte

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module extraire des expressions clés du module de texte dans Machine Learning Studio (classic) pour prétraiter une colonne de texte. À partir d’une colonne de texte en langage naturel, le module extrait une ou plusieurs expressions explicites. Une expression peut être un mot unique, un nom composé ou un modificateur plus un nom.

Ce module est un wrapper pour les API de traitement en langage naturel pour l’extraction de phrases clés. Les expressions sont analysées comme potentiellement significatives dans le contexte de la phrase pour diverses raisons :

  • L’expression capture la rubrique de la phrase.
  • L’expression contient une combinaison de modificateur et de nom qui indique le sentiment.

Par exemple, supposons que la phrase analysée est : « il s’agissait d’un joyeux hôtel pour rester, avec un personnel décor et convivial ».

Le module extraire les expressions clés du module Text peut renvoyer les expressions clés suivantes :

  • Hôtel merveilleux
  • personnel convivial
  • décor unique

Comment configurer l’extraction d’expressions clés à partir d’un texte

Pour extraire des expressions clés, vous devez connecter un jeu de données qui contient une colonne de texte.

  1. ajoutez l' extrait des expressions clés du module Text à votre expérience dans Machine Learning Studio (classic). Ensuite, connectez un DataSet qui possède au moins une colonne de texte intégral.

  2. Utilisez le sélecteur de colonne pour sélectionner une colonne de type chaîne, à partir de laquelle extraire les expressions clés.

  3. Pour langue, sélectionnez une langue à utiliser lors de l’analyse des expressions. Si vous spécifiez une langue, seules les expressions de la langue cible seront générées.

  4. Si la colonne de texte contient des expressions dans plusieurs langues, choisissez l’option langue identifiée dans les colonnes. Un nouveau sélecteur de colonne s’affiche pour vous permettre de sélectionner une colonne dans votre jeu de données qui contient un identificateur de langue. L’identificateur de langue peut être soit le nom de la langue, soit l’identificateur de culture Iso6391. Par exemple, soit « English » soit « fr » sont acceptables.

    Conseil

    Avant d’exécuter, vous pouvez extraire des expressions clés du texteà l’aide du module détecter les langues pour identifier la langue de chaque ligne et générer l’identificateur pour vous. Une erreur est générée si la colonne d’identificateur de langue contient des langues non prises en charge par l' extraction d’expressions clés du texte.

Résultats

La sortie du module est un jeu de données contenant une colonne de phrases clés séparées par des virgules.

Par exemple, les résultats de l’exemple suivant concernent un jeu de données d’entrée contenant des révisions dans plusieurs langues :

Expressions clés
nouveau, sous-marin nucléaire, livre, aventure Story, avalanche d’événements, bons caractères
premier Misterio, personajes, fan, Aventura, Isla
  • Toutes les expressions de sortie sont contenues dans une seule colonne ; aucune autre colonne n’est passée, et aucun identificateur n’est ajouté. Toutefois, si vous souhaitez aligner les expressions de sortie avec le texte source, vous pouvez recombiner les expressions de sortie avec l’entrée à l’aide du module Ajouter des colonnes .

  • La sortie de l’extraction d’expressions clés ne marque pas la langue des expressions individuelles.

  • Si une langue qui n’est pas prise en charge par le module extraire les expressions clés est incluse, une erreur est générée (0039). Pour éviter les erreurs, veillez à filtrer le texte d’entrée dont l’identificateur de langage est incompatible.

    S’il y a très peu de lignes d’autres langues, vous pouvez également éviter l’erreur en omettant l’identificateur de langue et en analysant tout le texte à l’aide d’une sélection de langue unique. Toutefois, dans ce cas, les résultats sont très médiocres, car les phrases entières dans les autres langages peuvent être générées en tant qu’expression clé unique.

Exemples

L’exemple suivant montre comment utiliser ce module pour extraire des expressions clés et créer un Cloud Word à partir des expressions suivantes : extraire des expressions clés et afficher le Cloud Word

Pour plus d’exemples de traitement de texte à l’aide de Machine Learning, consultez l' Azure ai Gallery .

Notes techniques

Ce module prend actuellement en charge les langues suivantes :

  • Néerlandais
  • Anglais
  • Français
  • Allemand
  • Italien
  • Espagnol

pour d’autres langues, envisagez d’utiliser l' API Analyse de texte dans Azure Cognitive Services. pour plus d’informations, consultez comment extraire des expressions clés dans Analyse de texte

Entrées attendues

Nom Type Description
Dataset Table de données Table contenant le texte à traiter.

Paramètres du module

Nom Type Plage Facultatif Default Description
Colonne langue de la culture ColumnSelection langue : la colonne contient la langue Nom ou index de base un de la colonne contenant les informations sur la langue de la culture
Colonne de texte ColumnSelection Obligatoire Nom ou index de base un de la colonne de texte.
Language T_Language L’anglais, l’espagnol, le français, le néerlandais, l’allemand, l’italien, la colonne contient la langue Obligatoire Anglais Sélectionnez la langue du texte à traiter.

Sorties

Nom Type Description
Jeu de données de résultats Table de données Expressions clés extraites

Exceptions

Exception Description
Erreur 0003 Cette exception se produit si une ou plusieurs entrées sont null ou vide.
Erreur 0010 Une exception se produit si les jeux de données d’entrée possèdent des noms de colonnes qui ne correspondent pas alors qu’ils le devraient correspondre.
Erreur 0016 Une exception se produit si des jeux de données d’entrée transmis au module possèdent des types de colonnes incompatibles les uns avec les autres.
Erreur 0008 Une exception se produit si le paramètre n’est pas dans la plage.

pour obtenir la liste des erreurs spécifiques aux modules Studio (classiques), consultez Machine Learning codes d’erreur.

pour obtenir la liste des exceptions d’api, consultez Machine Learning les Codes d’erreur de l' api REST.

Voir aussi

Analyse de texte
Liste alphabétique des modules