Démarrage rapide : Détecter des textes protégés (préversion)

Les textes protégés correspondent à du contenu textuel connu (par exemple, paroles de chanson, articles, recettes, contenu web sélectionné). Cette fonctionnalité peut être utilisée pour identifier et bloquer l’affichage de contenu textuel connu dans la sortie du modèle de langage (contenu en anglais uniquement).

Prérequis

  • Un abonnement Azure - En créer un gratuitement
  • Une fois que vous avez votre abonnement Azure, créez une ressource Content Safety dans le portail Azure pour obtenir votre clé et votre point de terminaison. Entrez un nom unique pour votre ressource, sélectionnez votre abonnement, puis un groupe de ressources, une région prise en charge (USA Est ou Europe Ouest) et un niveau tarifaire pris en charge. Sélectionnez ensuite Créer.
    • Le déploiement de la ressource prend quelques minutes. Une fois qu’il est terminé, sélectionnez Accéder à la ressource. Dans le volet gauche, sous Gestion des ressources, sélectionnez Clé et point de terminaison de l’abonnement. Le point de terminaison et l’une des clés sont utilisés pour appeler les API.
  • Installation de cURL

Analyser du texte pour y détecter des textes protégés

La section suivante décrit en détail un exemple de requête avec cURL. Collez la commande ci-dessous dans un éditeur de texte et effectuez les modifications suivantes :

  1. Remplacez <endpoint> par l’URL de point de terminaison associée à votre ressource.
  2. Remplacez <your_subscription_key> par l’une des clés qui viennent avec votre ressource.
  3. Si vous le souhaitez, remplacez le champ "text" dans le corps par votre propre texte que vous souhaitez analyser.

    Conseil

    Taille et granularité du texte

    La longueur maximale par défaut pour les envois de texte est de 1 000 caractères. La longueur minimale est de 111 caractères. La détection de textes protégés est conçue pour être exécutée sur les complétions LLM, pas sur les invites utilisateur.

curl --location --request POST '<endpoint>/contentsafety/text:detectProtectedMaterial?api-version=2023-10-15-preview' \
--header 'Ocp-Apim-Subscription-Key: <your_subscription_key>' \
--header 'Content-Type: application/json' \
--data-raw '{
  "text": "to everyone, the best things in life are free. the stars belong to everyone, they gleam there for you and me. the flowers in spring, the robins that sing, the sunbeams that shine, they\'re yours, they\'re mine. and love can come to everyone, the best things in life are"
}'

Les champs ci-dessous doivent être inclus dans l’URL :

Nom Obligatoire Description Type
API Version Obligatoire Il s’agit de la version de l’API à vérifier. La version actuelle est : api-version=2023-10-15-preview. Exemple : <endpoint>/contentsafety/text:detectProtectedMaterial?api-version=2023-10-15-preview String

Les paramètres dans le corps de la requête sont définis dans ce tableau :

Nom Obligatoire Description Type
text Obligatoire Il s’agit du texte brut à vérifier. D’autres caractères non-ascii peuvent être inclus. Chaîne

Examinez l’exemple de corps de requête suivant :

{
  "text": "string"
}

Ouvrez une fenêtre d’invite de commandes et exécutez la commande cURL.

Interpréter la réponse de l’API

Vous devriez voir les résultats de la détection de textes protégés sous la forme de données JSON dans la sortie de la console. Par exemple :

{
  "protectedMaterialAnalysis": {
    "detected": true
  }
}

Les champs JSON dans la sortie sont définis ici :

Nom Description Type
protectedMaterialAnalysis Chaque classe de sortie prédite par l’API. Chaîne
détecté Indique si des textes protégés ont été détectés ou non. Booléen

Nettoyer les ressources

Si vous souhaitez nettoyer et supprimer un abonnement Azure AI services, vous pouvez supprimer la ressource ou le groupe de ressources. La suppression du groupe de ressources efface également les autres ressources qui y sont associées.

Étapes suivantes

Configurez des filtres pour chaque catégorie et testez des jeux de données en utilisant Content Safety Studio, puis exportez le code et déployez-le.