Analyser les journaux d’activité des sites web à l’aide d’Azure Data Lake Analytics

Découvrez comment analyser les journaux d’activité des sites web à l’aide de Data Lake Analytics, en particulier pour découvrir quels points d’accès ont rencontré des erreurs lorsqu’ils ont essayé de visiter le site web.

Important

Azure Data Lake Analytics mis hors service le 29 février 2024. Découvrez-en plus avec cette annonce.

Pour l’analytique des données, votre organization peut utiliser Azure Synapse Analytics ou Microsoft Fabric.

Prérequis

Connexion à Azure

Avant de pouvoir générer et tester des scripts U-SQL, vous devez d'abord vous connecter à Azure.

Pour se connecter à Data Lake Analytics

  1. Ouvrez Visual Studio.
  2. Sélectionnez Options et paramètres de Data Lake>.
  3. Sélectionnez Se connecter ou Modifier l’utilisateur si quelqu’un s’est connecté, puis suivez les instructions.
  4. Sélectionnez OK pour fermer la boîte de dialogue Options et paramètres.

Pour parcourir vos comptes Data Lake Analytics

  1. Dans Visual Studio, ouvrez l’Explorateur de serveurs en appuyant sur CTRL+ALT+S.
  2. Dans l’Explorateur de serveurs, développez Azure, puis Data Lake Analytics. Le cas échéant, la liste de vos comptes Data Lake Analytics s'affiche. Vous ne pouvez pas créer Data Lake Analytics comptes à partir du studio. Pour créer un compte, consultez Prise en main d’Azure Data Lake Analytics à l’aide de Portail Azure ou Prise en main d’Azure Data Lake Analytics à l’aide de Azure PowerShell.

Développement d'application U-SQL

Une application U-SQL est essentiellement un script U-SQL. Pour en savoir plus sur U-SQL, consultez Prise en main de U-SQL.

Vous pouvez ajouter des opérateurs définis par l'utilisateur à l'application. Pour plus d'informations, consultez Développer des opérateurs définis par l'utilisateur U-SQL pour des travaux Data Lake Analytics.

Pour créer et soumettre un travail Data Lake Analytics

  1. Sélectionnez le fichier > Nouveau > projet.

  2. Sélectionnez le type de projet U-SQL.

    nouveau projet U-SQL Visual Studio

  3. Sélectionnez OK. Visual Studio crée une solution avec un fichier Script.usql.

  4. Insérez le script suivant dans le fichier Script.usql :

    // Create a database for easy reuse, so you don't need to read from a file very time.
    CREATE DATABASE IF NOT EXISTS SampleDBTutorials;
    
    // Create a Table valued function. TVF ensures that your jobs fetch data from he weblog file with the correct schema.
    DROP FUNCTION IF EXISTS SampleDBTutorials.dbo.WeblogsView;
    CREATE FUNCTION SampleDBTutorials.dbo.WeblogsView()
    RETURNS @result TABLE
    (
        s_date DateTime,
        s_time string,
        s_sitename string,
        cs_method string,
        cs_uristem string,
        cs_uriquery string,
        s_port int,
        cs_username string,
        c_ip string,
        cs_useragent string,
        cs_cookie string,
        cs_referer string,
        cs_host string,
        sc_status int,
        sc_substatus int,
        sc_win32status int,
        sc_bytes int,
        cs_bytes int,
        s_timetaken int
    )
    AS
    BEGIN
    
        @result = EXTRACT
            s_date DateTime,
            s_time string,
            s_sitename string,
            cs_method string,
            cs_uristem string,
            cs_uriquery string,
            s_port int,
            cs_username string,
            c_ip string,
            cs_useragent string,
            cs_cookie string,
            cs_referer string,
            cs_host string,
            sc_status int,
            sc_substatus int,
            sc_win32status int,
            sc_bytes int,
            cs_bytes int,
            s_timetaken int
        FROM @"/Samples/Data/WebLog.log"
        USING Extractors.Text(delimiter:' ');
        RETURN;
    END;
    
    // Create a table for storing referrers and status
    DROP TABLE IF EXISTS SampleDBTutorials.dbo.ReferrersPerDay;
    @weblog = SampleDBTutorials.dbo.WeblogsView();
    CREATE TABLE SampleDBTutorials.dbo.ReferrersPerDay
    (
        INDEX idx1
        CLUSTERED(Year ASC)
        DISTRIBUTED BY HASH(Year)
    ) AS
    
    SELECT s_date.Year AS Year,
        s_date.Month AS Month,
        s_date.Day AS Day,
        cs_referer,
        sc_status,
        COUNT(DISTINCT c_ip) AS cnt
    FROM @weblog
    GROUP BY s_date,
            cs_referer,
            sc_status;
    

    Pour comprendre U-SQL, voir Prise en main du langage U-SQL Data Lake Analytics.

  5. Ajoutez un nouveau script U-SQL dans votre projet et entrez ce qui suit :

    // Query the referrers that ran into errors
    @content =
        SELECT *
        FROM SampleDBTutorials.dbo.ReferrersPerDay
        WHERE sc_status >=400 AND sc_status < 500;
    
    OUTPUT @content
    TO @"/Samples/Outputs/UnsuccessfulResponses.log"
    USING Outputters.Tsv();
    
  6. Revenez au premier script U-SQL, puis, à côté du bouton Soumettre , spécifiez votre compte Analytics.

  7. Dans Explorateur de solutions, sélectionnez Script.usql, puis Générer un script. Vérifiez les résultats dans le volet Sortie.

  8. Dans Explorateur de solutions, sélectionnez Script.usql, puis Envoyer un script.

  9. Vérifiez que le compte Analytics est celui dans lequel vous souhaitez exécuter le travail, puis sélectionnez Envoyer. Les résultats de la soumission et le lien vers la tâche sont disponibles dans la fenêtre Résultats de Data Lake Tools pour Visual Studio à l'issue de la soumission.

  10. Attendez que la tâche soit terminée avec succès. Si le travail a échoué, il manque probablement le fichier source. Consultez la section Prérequis de ce tutoriel. Pour plus d’informations sur la résolution des problèmes, consultez Surveiller et résoudre les problèmes liés aux travaux Azure Data Lake Analytics.

    Une fois la tâche terminée, l'écran suivant s'affiche :

    data lake analytics analyser les journaux d’activité des sites web

  11. Répétez les étapes 7 à 10 pour Script1.usql.

Pour visualiser la sortie du travail

  1. À partir de Server Explorer, développez Azure, Data Lake Analytics, développez votre compte Data Lake Analytics, développez Comptes de stockage, cliquez avec le bouton droit sur le compte Data Lake Storage par défaut, puis sélectionnez Explorer.
  2. Double-cliquez sur Exemples pour ouvrir le dossier, puis double-cliquez sur Sorties.
  3. Double-cliquez sur UnsuccessfulResponses.log.
  4. Vous pouvez également double-cliquer sur le fichier de sortie dans l'affichage graphique de la tâche afin d'accéder directement à la sortie.

Étapes suivantes

Pour commencer à utiliser Data Lake Analytics à l'aide de différents outils, consultez :