Учебник. Анализ Facebook с помощью Power BI DesktopTutorial: Facebook analytics using Power BI Desktop

Из этого руководства вы узнаете, как импортировать данные из Facebook и использовать их в Power BI Desktop.In this tutorial you learn how to import data from Facebook and use it in Power BI Desktop. Вы подключитесь к странице Power BI в Facebook, импортируете данные, примените к ним преобразования, а затем используете данные в визуализациях отчета.You'll connect and import data from the Power BI Facebook page, apply transformations to the imported data, and use the data in report visualizations.

Подключение к странице FacebookConnect to a Facebook page

В этом руководстве используются данные со страницы Microsoft Power BI в Facebook (https://www.facebook.com/microsoftbi).This tutorial uses data from the Microsoft Power BI Facebook page (https://www.facebook.com/microsoftbi). Чтобы подключиться к этой странице и импортировать данные, вам не нужны никакие учетные данные, кроме вашей личной учетной записи Facebook.You don't need any special credentials to connect and import data from this page except for a personal Facebook account.

  1. Откройте приложение Power BI Desktop и выберите Получить данные в диалоговом окне Начало работы. Или на вкладке ленты Главная последовательно выберите Получить данные и Дополнительно...Open Power BI Desktop and select Get data in the Getting Started dialog, or in the Home ribbon tab, select Get Data and then select More....

  2. В диалоговом окне Получение данных выберите Facebook из группы Веб-службы и нажмите кнопку Подключиться.In the Get Data dialog, select Facebook from the Online Services group, and then select Connect.

    Получать данные

    Откроется диалоговое окно с предупреждением о рисках, связанных с использованием службы сторонних производителей.A dialog appears to alert you to the risks of using a third-party service.

    Предупреждение о службе сторонних производителей

  3. Нажмите кнопку Продолжить.Select Continue. Откроется диалоговое окно Facebook.The Facebook dialog box appears.

  4. Введите или вставьте имя страницы microsoftbi в поле Имя пользователя и выберите Записи из раскрывающегося списка Подключение. Затем нажмите кнопку ОК.Type or paste the page name microsoftbi into the Username text box, select Posts from the Connection dropdown, and then select OK.

    Подключите

  5. При появлении запроса на учетные данные войдите в свою учетную запись Facebook и разрешите Power BI доступ с помощью этой учетной записи.When prompted for credentials, sign in to your Facebook account, and allow Power BI access through your account.

    Учетные данные

    После подключения к странице Power BI в Facebook вы сможете просмотреть данные страницы Записи.After connecting to the Power BI Facebook page, you see a preview of the page's Posts data.

    Предварительный просмотр данных

Обработка и преобразование импортируемых данныхShape and transform the imported data

Предположим, вам нужно отобразить записи с наибольшим количеством комментариев. Но в области предварительного просмотра записей вы видите, что данные в столбце created_time трудно прочесть и понять, а сведения о комментариях отсутствуют.You want to see and show which posts have the most comments over time, but you notice in the Posts data preview that the created_time data is hard to read and understand, and there is no comments data at all. Чтобы извлечь из данных полезную информацию, необходимо обработать и очистить их.You need to perform some shaping and cleansing of the data to pull the most out of it. Прежде чем импортировать данные в Power BI Desktop, можно отредактировать их с помощью редактора Power Query в приложении Power BI Desktop. Это можно сделать и после импорта данных.You can use the Power BI Desktop Power Query Editor to edit the data, before or after importing it into Power BI Desktop.

Разбиение столбца даты и времениSplit the date/time column

Сначала разделите значения даты и времени в столбце created_time, чтобы их было удобнее читать.First, separate the date and time values in the created_time column to be more readable.

  1. В области предварительного просмотра данных Facebook нажмите кнопку Изменить.In the Facebook data preview, select Edit.

    Изменение данных в области предварительного просмотра

    В новом окне откроется редактор Power Query приложения Power BI Desktop. Отобразится область предварительного просмотра данных со страницы Power BI в Facebook.The Power BI Desktop Power Query Editor opens in a new window and displays the data preview from the Power BI Facebook page.

    Редактор Power Query

  2. Выберите столбец created_time.Select the created_time column. Обратите внимание, что это текстовый тип данных, на что указывает значок ABC в заголовке столбца.Note that it is currently a Text data type, denoted by an ABC icon in the column header. Щелкните правой кнопкой мыши заголовок и последовательно выберите в раскрывающемся списке Разделить столбец > По разделителю или последовательно выберите Разделить столбец > По разделителю в меню Преобразование на вкладке "Главная" на ленте.Right-click the header and select Split Column > By Delimiter in the dropdown, or select Split Column > By Delimiter under Transform in the Home tab of the ribbon.

    Разделение столбца по разделителю

  3. В диалоговом окне Split column by delimiter (Разделение столбца по разделителю) из раскрывающегося списка выберите Настраиваемый. В поле ввода введите букву T (символ, который запускает часть "Время" (Time) значений created_time) и нажмите кнопку ОК.In the Split column by delimiter dialog, select Custom from the dropdown, enter T (the character that starts the time part of the created_time values) in the input field, and select OK.

    Диалоговое окно разделения столбца по разделителю

    Столбец разделится на два столбца, которые содержат строки до и после разделителя T, с именами created_time.1 и created_time.2 соответственно.The column splits into two columns that contain the strings before and after the T delimiter and are named created_time.1 and created_time.2, respectively. Обратите внимание, что в службе Power BI были автоматически обнаружены и изменены типы данных. Теперь тип данных первого столбца — Дата, а тип данных второго столбца — Время. Кроме того, отформатированы значения даты и времени, чтобы их было удобнее читать.Note that Power BI has automatically detected and changed the data types to Date for the first column and Time for the second column, and formatted the date and time values to be more readable.

  4. Переименуйте столбцы. Для этого дважды щелкните заголовок каждого столбца или выберите столбец, а затем выберите Переименовать в группе Любой столбец на вкладке Преобразование на ленте. Введите новые заголовки столбцов created_date и created_time.Rename the columns by double-clicking each column header, or selecting each column and then selecting Rename in the Any Column Group of the Transform tab in the ribbon, and typing new column headers created_date and created_time, respectively.

    Новые столбцы даты и времени

Развертывание вложенного столбцаExpand the nested column

Теперь, когда данные даты и времени отображаются правильно, вам нужно отобразить данные комментариев. Для этого потребуется развернуть вложенный столбец.Now that the date and time data are the way you want them, you'll expose comments data by expanding a nested column.

  1. Выберите столбец object_link, затем выберите значок значок развертывания, чтобы открыть диалоговое окно Expand/Aggregate (Развертывание и агрегирование).Select the object_link column and then select the expand icon icon to open the Expand/Aggregate dialog. Выберите столбец connections и нажмите кнопку ОК.Select connections, and then select OK.

    Развертывание столбца object_link

    Заголовок столбца изменится на object_link.connections.The column heading changes to object_link.connections.

  2. Снова выберите значок значок развертывания в верхней части столбца object_link.connections, выберите comments и нажмите кнопку ОК.Again select the expand icon icon at the top of the object_link.connections column, select comments, and then select OK. Заголовок столбца изменится на object_link.connections.comments.The column heading changes to object_link.connections.comments.

  3. Выберите значок значок развертывания в верхней части столбца object_link.connections.comments. В этот раз выберите в диалоговом окне агрегирование вместо развертывания.Select the expand icon icon at the top of the object_link.connections.comments column, and this time select Aggregate instead of Expand in the dialog box. Выберите # Count of id и нажмите кнопкуОК.Select # Count of id, and then select OK.

    Агрегирование комментариев

    Теперь в столбце отображается количество комментариев для каждого сообщения.The column now displays the number of comments for each message.

  4. Переименуйте столбец Count of object_link.connections.comments.id на Number of comments.Rename the Count of object_link.connections.comments.id column to Number of comments.

  5. Щелкните стрелку вниз рядом с заголовком Number of comments и выберите Сортировать по убыванию, чтобы просмотреть записи, отсортированные по убыванию количества комментариев.Select the down arrow next to the Number of comments header and select Sort Descending to see the Posts sorted from most to fewest comments.

    Количество комментариев в сообщении

Просмотр шагов запросаReview query steps

После того как вы обработали и преобразовали данные в редакторе Power Query, каждый шаг был записан в область Примененные шаги на панели Параметры запроса в правой части окна редактора Power Query.As you shaped and transformed data in the Power Query Editor, each step was recorded in the Applied Steps area of the Query Settings pane at the right side of the Power Query Editor window. Вы можете вернуться к области "Примененные шаги", чтобы просмотреть внесенные изменения и при необходимости изменить, удалить или переупорядочить их. Но это может быть небезопасно, так как изменение предыдущих шагов может негативно повлиять на последующие.You can step back through the Applied Steps to see exactly what changes you made, and edit, delete, or rearrange them if necessary (although this can be risky, because changing preceding steps can break later steps).

После преобразования данных область "Примененные шаги" может выглядеть так:After applying the data transformations so far, your Applied Steps should look like the following:

Примененные шаги

Совет

В основе примененных действий — формулы, написанные на языке Power Query, который также известен как язык M.Underlying the Applied Steps are formulas written in the Power Query Language, also known as the M language. Чтобы просмотреть и изменить формулы, выберите Расширенный редактор в группе Запрос на вкладке "Главная" на ленте.To see and edit the formulas, select Advanced Editor in the Query group of the Home tab of the ribbon.

Импорт преобразованных данныхImport the transformed data

Если вы формат данных вас устраивает, последовательно выберите Close & Apply (Закрыть и применить) > Close & Apply (Закрыть и применить) на вкладке "Главная" на ленте, чтобы импортировать данные в Power BI Desktop.When you are satisfied with the data, select Close & Apply > Close & Apply in the Home tab of the ribbon to import it into Power BI Desktop.

Закрыть и применить

Откроется диалоговое окно со сведениями о ходе выполнения для загрузки данных в модель данных Power BI Desktop.A dialog displays the progress of loading the data into the Power BI Desktop data model.

Загрузка данных

После того как данные загрузятся, они отобразятся в представлении отчета в виде нового запроса в списке "Поля".Once the data is loaded, it appears in the Report view as a new Query in the Fields list.

Новый запрос

Использование данных в визуализациях отчетаUse the data in report visualizations

После импорта данных со страницы Facebook вы можете быстро и легко проанализировать их, используя визуализации.Now that you have imported data from the Facebook page, you can quickly and easily gain insights about your data by using visualizations. Создать визуализацию несложно. Просто выберите поле или перетащите его из списка Поля на полотно отчета.Creating a visualization is easy; just select a field or drag it from the Fields list onto the report canvas.

Создание линейчатой диаграммыCreate a bar chart

  1. В представлении "Отчет" Power BI Desktop выберите столбец message из списка полей или перетащите его на полотно.In Power BI Desktop Report view, select message from the field list, or drag it onto the canvas. На полотне отобразится таблица со всеми сообщениями записи.A table showing all post messages appears on the canvas.

    Новый запрос

  2. Выберите эту таблицу, выберите столбец Number of comments из списка "Поля" или перетащите его в таблицу.With that table selected, also select Number of comments from the Fields list, or drag it into the table.

  3. Выберите значок Линейчатая диаграмма с накоплением на панели "Визуализации".Select the Stacked bar chart icon in the Visualizations pane. Таблица станет линейчатой диаграммой, в которой отображается количество комментариев в каждой записи.The table changes to a bar chart showing the number of comments per post.

    Линейчатая диаграмма

  4. Выберите кнопку с многоточием (…) в правом верхнем углу визуализации, а затем выберите Sort by Number of comments (Сортировать по числу комментариев), чтобы сортировать таблицу по убыванию числа комментариев.Select the ellipsis (...) in the upper right of the visualization, and then select Sort by Number of comments to sort the table by descending number of comments.

    Сортировка по числу комментариев

  5. Обратите внимание, что большинство комментариев относятся к пустым сообщениям. Эти записи могут содержать истории, ссылки, видео или другое нетекстовое содержимое.Note that the most comments were associated with Blank messages (these posts may have been stories, links, videos, or other non-text content). Чтобы отфильтровать строку "Пустое", выберите message (all) (сообщение (все)) в области Фильтры в нижней части области "Визуализации", выберите Выделить все и выберите Пустое, чтобы исключить пустые сообщения из выбора.To filter out the Blank row, select message (all) under Filters at the bottom of the Visualizations pane, select Select All, and then select Blank to deselect it. Запись "Фильтры" изменится на сообщение не является (пустым). После этого строка "Пустое" исчезнет из визуализации диаграммы.The Filters entry changes to message is not (Blank), and the Blank row disappears from the chart visualization.

    Фильтрация пустых сообщений

Форматирование диаграммыFormat the chart

Визуализация становится более интересной, но на диаграмме отображается лишь небольшая часть текста записи.The visualization is getting more interesting, but you can't see much of the post text in the chart. Чтобы отобразить больший объем текста записи, выполните следующие действия:To show more of the post text:

  1. Используя маркеры на визуализации диаграммы, измените размер диаграммы, максимально увеличив ее.Using the handles on the chart visualization, resize the chart to be as large as possible.

  2. Выберите диаграмму, выберите значок формата (значок с изображением валика) на панели визуализаций.With the chart selected, select the Format icon (paint roller) in the Visualizations pane.

  3. Щелкните стрелку вниз рядом с осью Y, перетащите ползунок и поместите его рядом с надписью Максимальный размер в крайнюю правую позицию (50 %).Select the down arrow next to Y-axis, and drag the slider next to Maximum size all the way to the right (50%).

  4. Также уменьшите размер текста до значения 10, чтобы отобразилось больше текста.Also reduce the Text size to 10 to fit more text.

    Изменения форматирования

    Теперь на диаграмме отображается больше содержимого записи.The chart now shows more of the post content.

    Больше содержимого записи

Ось X (количество комментариев) диаграммы не содержит точные значения, и внизу диаграммы часть значений теряется.The X axis (number of comments) of the chart does not show exact values, and looks lost at the bottom of the chart. Вместо этого вы можете использовать метки данных.You decide to use data labels instead.

  1. Выберите значок "Формат" и поместите ползунок рядом с осью X, чтобы отключить ее.Select the Format icon, and then select the slider next to X-axis to turn it Off.

  2. Поместите ползунок рядом с надписью Метки данных, чтобы включить их.Select the slider next to Data labels to turn them On. Теперь на диаграмме отображается точное количество комментариев для каждой записи.Now the chart shows the exact number of comments for each post.

    Применение меток данных

Изменение типа данныхEdit the data type

Визуализация улучшилась, но все метки данных содержат десятичный разряд .0, который отвлекает и вводит в заблуждение, так как количество записей должно быть целым числом.That's better, but the data labels all have a .0 decimal place, which is distracting and misleading, since Number of posts must be a whole number. Необходимо изменить тип данных для количества записей на целое число.You need to change the data type of the Number of posts column to Whole Number.

  1. Чтобы изменить тип данных, щелкните правой кнопкой мыши Запрос1 в списке "Поля" или наведите на него указатель мыши и выберите кнопку дополнительных параметров с многоточием (…). Затем выберите Изменить запрос.To edit the data type, right-click Query1 in the Fields list, or hover over it and select the More options ellipsis (...), and then select Edit Query. Кроме того, можно выбрать действие Изменить запросы в области Внешние данные на вкладке "Главная" на ленте. Затем выберите в раскрывающемся списке Изменить запросы.You can also select Edit Queries from the External data area of the Home tab in the ribbon, and then select Edit Queries from the dropdown. В отдельном окне откроется Редактор Power Query приложения Power BI Desktop.The Power BI Desktop Power Query Editor opens in a separate window.

    Действие "Изменить запрос" в списке "Поля" Действие "Изменить запрос" на ленте

  2. В редакторе Power Query выберите столбец Number of comments и измените тип данных на целое число. Это можно сделать разными способами:In the Power Query Editor, select the Number of comments column, and change the data type to Whole Number by either:

    • Выберите значок 1.2 рядом с заголовком столбца Number of comments, затем в раскрывающемся списке выберите Целое число.Selecting the 1.2 icon next to the Number of comments column header, and selecting Whole number from the dropdown, or
    • Или щелкните правой кнопкой мыши заголовок столбца и последовательно выберите Изменить тип > Целое число.Right-clicking the column header and selecting Change type > Whole Number, or
    • Или выберите Тип данных: десятичное число в группе Преобразование на вкладке "Главная" либо в группе Любой столбец на вкладке Преобразование и выберите Целое число.Selecting Data type: Decimal Number in the Transform group of the Home tab, or the Any Column group of the Transform tab, and selecting Whole Number.

    Значок в заголовке столбца изменится на 123, что обозначает тип данных "Целое число".The icon in the column header changes to 123, denoting a Whole Number data type.

    Изменение типа данных

  3. Выберите Close & Apply (Закрыть и применить) или просто Применить, чтобы применить изменения, не закрывая окно редактора Power Query.Select Close & Apply, or just Apply to apply the changes while keeping the Power Query Editor window open. После того как загрузятся изменения, метки данных на диаграмме станут целыми числами.Once the changes load, the data labels on the chart become whole numbers.

    Диаграмма с целыми числами

Создание среза датCreate a date slicer

Допустим, вам нужно визуализировать количество комментариев к записям по времени.You want to visualize the number of comments on posts over time. Вы можете создать визуализацию среза, чтобы фильтровать данные диаграммы по различным временным отрезкам.You can create a slicer visualization to filter the chart data to different time frames.

  1. Щелкните пустую область полотна и выберите Значок среза на панели "Визуализации".Click a blank area of the canvas, and then select the Slicer icon in the Visualizations pane. Отобразится пустая визуализация среза.A blank slicer visualization appears.

    Выбор значка среза

  2. Выберите поле created_date из списка "Поля" или перетащите его в новый срез.Select the created_date field from the Fields list, or drag it into the new slicer. Срез станет ползунком диапазона даты, основанным на типе данных "Дата".The slicer changes to a date range slider, based on the field's Date data type.

    Срез в виде ползунка для диапазона даты

  3. Перемещайте маркеры ползунка, чтобы выбрать другие диапазоны дат, и обратите внимание, как фильтруются данные диаграммы по мере его перемещения.Move the slider handles to select different date ranges, and note how the chart data filters accordingly. Также можно выбрать в срезе поля дат и ввести конкретные даты или выбрать их из всплывающего окна календаря.You can also select the date fields in the slicer and type in specific dates, or choose them from a calendar popup.

    Срез данных

Форматирование визуализацийFormat the visualizations

Допустим, вы решили сделать заголовок диаграммы более описательным и привлекательным.You decide to give the chart a more descriptive and attractive title.

  1. Выберите диаграмму, затем — значок Формат, а после этого — стрелку раскрывающегося списка, чтобы развернуть раздел Заголовок.With the chart selected, select the Format icon, and select the dropdown arrow to expand Title.
  2. Измените заголовок текста на Комментарии к одной записи.Change the Title text to Comments per post.
  3. Щелкните стрелку раскрывающегося списка рядом с полем Цвет шрифта и выберите зеленый цвет, который соответствует зеленым полосам визуализации.Select the dropdown arrow next to Font color, and select a green color to match the green bars of the visualization.
  4. Увеличьте размер текста до значения 10 и измените семейство шрифтов на Segoe (Bold).Increase the Text size to 10, and change the Font family to Segoe (Bold).

Форматирование заголовка диаграммы

Поэкспериментируйте с другими вариантами форматирования, чтобы изменить внешний вид визуализации.Experiment with other formatting options and settings to change the appearance of your visualizations.

Визуализации

Создание других визуализацийCreate more visualizations

Как видите, вы можете легко настроить визуализации в отчете для любого представления данных.As you can see, it's easy to customize visualizations in your report to present the data in ways that you want. Например, с помощью импортированных данных Facebook можно создать этот график, на котором отображается количество комментариев со временем.For example, try using the imported Facebook data to create this line chart showing number of comments over time.

график;

Power BI Desktop предоставляет удобные возможности для получения данных из разнообразных источников и их обработки для анализа и визуализации в интерактивном режиме.Power BI Desktop provides a seamless end-to-end experience, from getting data from a wide range of data sources and shaping it to meet your analysis needs, to visualizing this data in rich and interactive ways. Готовый отчет можно отправить в Power BI, создать на его основе панели мониторинга и предоставить к ним общий доступ другим пользователям Power BI.When your report is ready, you can upload it to Power BI service and create dashboards based on it, which you can share with other Power BI users.

Дальнейшие действияNext steps