Руководство по анализу данных с веб-страницы с помощью Power BI DesktopTutorial: Analyze web page data using Power BI Desktop

Предположим, что вы уже долгое время являетесь футбольным болельщиком и хотите получить сведения о победителях Чемпионата Европы по футболу за разные годы.As a long-time soccer fan, you want to report on the UEFA European Championship (Euro Cup) winners over the years. Power BI Desktop поможет вам импортировать в отчет нужные данные с веб-страницы и создать на их основе визуализации.With Power BI Desktop, you can import this data from a web page into a report and create visualizations that show the data. Из этого руководства вы узнаете, как с помощью Power BI Desktop выполнить следующие действия:In this tutorial, you learn how to use Power BI Desktop to:

  • подключение к источнику данных в Интернете и переход по доступным в нем таблицам;Connect to a web data source and navigate across its available tables,
  • сбор и преобразование данных в редакторе Power Query;Shape and transform data in the Power Query Editor,
  • присвоение запросу имени и импорт этого запроса в отчет Power BI Desktop;Name a query and import it into a Power BI Desktop report, and
  • создание и настройка визуализаций карты и круговой диаграммы.Create and customize a map and a pie chart visualization.

Подключение к веб-источнику данныхConnect to a web data source

Данные о победителях Чемпионата Европы по футболу УЕФА можно найти в таблице результатов на странице Википедии по адресу http://en.wikipedia.org/wiki/UEFA_European_Football_Championship.You can get the UEFA winners data from the Results table on the UEFA European Football Championship Wikipedia page at http://en.wikipedia.org/wiki/UEFA_European_Football_Championship.

Таблица результатов в Википедии

Обратите внимание на то, что веб-подключения устанавливаются только с помощью обычной проверки подлинности.Note that Web connections are only established using basic authentication. Веб-сайты, требующие проверки подлинности, могут работать неправильно с веб-соединителем.Web sites requiring authentication may not work properly with the Web connector.

Чтобы импортировать данные, выполните следующие действия:To import the data:

  1. В Power BI Desktop на вкладке ленты Главная щелкните стрелку рядом с элементом Получить данные и в раскрывающемся списке выберите вариант Интернет.In the Power BI Desktop Home ribbon tab, drop down the arrow next to Get Data, and then select Web.

    Элемент "Получить данные" на ленте

    Примечание

    Можно также выбрать сам элемент Получить данные или элемент Получить данные в диалоговом окне Power BI Начало работы. После этого выберите Интернет из раздела Все или Другое в диалоговом окне Получение данных и щелкните Подключить.You can also select the Get Data item itself, or select Get Data from the Power BI Get started dialog, then select Web from the All or Other section of the Get Data dialog box, and then select Connect.

  2. В диалоговом окне Из Интернета вставьте URL-адрес http://en.wikipedia.org/wiki/UEFA_European_Football_Championship в текстовое поле URL-адрес и нажмите кнопку ОК.In the From Web dialog box, paste the URL http://en.wikipedia.org/wiki/UEFA_European_Football_Championship into the URL text box, and then select OK.

    Получение данных из файлов

    Когда вы установите подключение к веб-странице Википедии, откроется диалоговое окно Power BI Навигатор со списком доступных на этой странице таблиц.After connecting to the Wikipedia web page, the Power BI Navigator dialog box shows a list of available tables on the page. Вы можете выбрать имя любой таблицы, чтобы просмотреть содержащиеся в ней данные.You can select any of the table names to preview its data. Нужная нам информация содержится в таблице Results[edit], но сейчас у нее не совсем удобный формат.The Results[edit] table has the data you want, although it is not exactly in the shape you want. Вам нужно обработать и очистить эти данные, прежде чем загружать их в отчет.You will reshape and clean up the data before loading it into your report.

    Диалоговое окно "Навигатор"

    Примечание

    На панели Предварительный просмотр отображается только одна таблица, которую вы выбрали последней, но при выборе действия Изменить или Загрузить все выбранные таблицы будет загружены в редактор Power Query.The Preview pane shows the most recent table selected, but all selected tables will load into the Power Query Editor when you select Edit or Load.

  3. Выберите таблицу Results[edit] в списке Навигатор и щелкните Изменить.Select the Results[edit] table in the Navigator list, and then select Edit.

    В редакторе Power Query откроется окно предварительного просмотра таблицы, где вы можете применить преобразования для очистки данных.A preview of the table opens in the Power Query Editor, where you can apply transformations to clean up the data.

    Редактор Power Query

Формирование данных в редакторе Power QueryShape data in Power Query Editor

Чтобы данные было удобнее просматривать, сохраните в списке для отображения только годы и страны-победительницы.You want to make the data easier to scan by displaying only the years and the countries that won. Для этого в редакторе Power Query можно применить процессы обработки и очистки.You can use the Power Query Editor to perform these data shaping and cleansing steps.

Сначала удалите все столбцы, кроме Year (Год) и Final Winners (Победители финала).First, remove all the columns except Year and Final Winners from the table.

  1. В редакторе Power Query выберите столбцы Year (Год) и Final Winners (Победители финала). Чтобы выбрать несколько элементов, удерживайте нажатой клавишу CTRL.In the Power Query Editor grid, select the Year and Final Winners columns (hold down the Ctrl key to select multiple items).

  2. Щелкните выбранные элементы правой кнопкой мыши и выберите в раскрывающемся меню действие Удалить другие столбцы или последовательно выберите Удалить столбцы > Удалить другие столбцы в группе Управление столбцами на вкладке ленты Главная. После этого все столбцы будут удалены из таблицы.Right-click and select Remove Other Columns from the dropdown, or select Remove Columns > Remove Other Columns from the Manage Columns group in the Home ribbon tab, to remove all other columns from the table.

    "Удалить другие столбцы" в раскрывающемся списке илиor "Удалить другие столбцы" на ленте

Теперь удалите лишнее слово Details (Сведения) из ячеек столбца Year (Год).Next, remove the extra word Details from the Year column cells.

  1. Выберите столбец Year (Год).Select the Year column.

  2. Щелкните его правой кнопкой мыши и выберите в раскрывающемся меню Замена значений или выберите Замена значений в группе Преобразования на вкладке ленты Главная (этот же пункт есть и в группе Любой столбец на вкладке Преобразование).Right-click, and select Replace Values from the dropdown, or select Replace Values from the Transform group in the Home tab of the ribbon (also found in the Any Column group in the Transform tab).

    "Замена значений" в раскрывающемся списке илиor "Замена значений" на ленте

  3. В диалоговом окне Замена значений введите строку Details (Сведения) в текстовом поле Значение для поиска, а текстовое поле Replace With (Заменить на) оставьте пустым. Затем нажмите кнопку ОК, чтобы удалить слово "Details" (Сведения) из всех ячеек в столбце Year (Год).In the Replace Values dialog box, type Details in the Value To Find text box, leave the Replace With text box empty, and then select OK to delete the word "Details" from the Year entries.

В некоторых ячейках поля Year (Год) вместо номера года есть только слово "Year" (Год).Some Year cells only contain the word "Year" rather than year values. Установите фильтр по столбцу Year (Год), чтобы отображались только строки без слова "Year" (Год).You can filter the Year column to only display rows that do not contain the word "Year".

  1. Выберите стрелку раскрывающегося списка фильтра в столбце Year (Год).Select the filter drop-down arrow on the Year column.

  2. Прокрутите вниз раскрывшийся список и снимите флажок рядом с вариантом Year (Год), а затем нажмите кнопку ОК, чтобы удалить строки, в которых столбец Year (Год) содержит только слово "Year" (Год).In the drop-down, scroll down and clear the checkbox next to the Year option, and then select OK, to remove the rows that only have the word "Year" in the Year column.

    Фильтрация данных

Итак, вы очистили столбец Year (Год). Теперь можно приступать к столбцу Final Winner (Победитель финала).Now that you have cleaned up the data in the Year column, you can work on the Final Winner column. Так как в этом списке и так остались только победители финалов, вы можете смело присвоить ему имя Country(Страна).Since you are only looking at the final winners data now, you can rename this column to Country. Чтобы переименовать столбец, сделайте следующее:To rename the column:

  1. Дважды щелкните или нажмите и удерживайте заголовок столбца Final Winner (Победитель финала).Double-click or tap and hold in the Final Winner column header, or

    • Или щелкните правой кнопкой мыши заголовок столбца Final Winners (Победители финала) и выберите в открывшемся меню действие Переименовать.Right-click the Final Winners column header, and select Rename from the dropdown, or
    • Либо же выберите столбец Final Winners и выберите команду Переименовать в группе Любой столбец на вкладке ленты Преобразование.Select the Final Winners column and select Rename from the Any Column group in the Transform tab of the ribbon.

    "Переименовать" в раскрывающемся списке илиor "Переименовать" на ленте

  2. Введите в заголовок текст Country (Страна) и нажмите клавишу ВВОД, чтобы переименовать столбец.Type Country in the header and press Enter to rename the column.

Также есть смысл отфильтровать некоторые строки, например за 2020-й год, чтобы в столбце Country (Страна) не осталось пустых значений.You also want to filter out rows like "2020" that have null values in the Country column. Для этого примените меню фильтра, как вы уже делали со значениями столбца Year (Год), или сделайте следующее:You could use the filter menu as you did with the Year values, or you can:

  1. Щелкните правой кнопкой мыши ячейку Country (Страна) в строке 2020, которая содержит значение NULL.Right-click on the Country cell in the 2020 row, which has the value null.

  2. Последовательно выберите в контекстном меню Текстовые фильтры > Не равно, чтобы удалить все строки с таким же значением этой ячейки.Select Text Filters > Does not Equal in the context menu to remove any rows that contain that cell's value.

    Фильтрация по тексту

Импорт запроса в представление отчетаImport the query into Report View

Теперь вы подготовили данные в нужном формате, и этот запрос можно импортировать в отчет, присвоив ему имя "Euro Cup Winners" (Победители Чемпионата Европы).Now that you've shaped the data the way you want, you're ready to name your query "Euro Cup Winners" and import it into your report.

  1. В области Параметры запроса в текстовом поле Имя введите Euro Cup Winners(Победители Чемпионата Европы) и нажмите клавишу ВВОД.In the Query Settings pane, in the Name text box, type Euro Cup Winners, and then press Enter.

    Присвоение запросу имени

  2. Последовательно выберите Close & Apply (Закрыть и применить) > Close & Apply (Закрыть и применить) на вкладке ленты Главная.Select Close & Apply > Close & Apply from the Home tab of the ribbon.

    Закрыть и применить

Созданный запрос будет загружен в представление отчета Power BI Desktop, где вы увидите его на панели Поля.The query loads into the Power BI Desktop Report View, where you can see it in the Fields pane.

Панель "Поля"

Совет

Вы можете в любой момент снова открыть редактор Power Query, чтобы изменить и (или) уточнить запрос, выполнив одну из описанных ниже последовательностей действий:You can always get back to the Power Query Editor to edit and refine your query by:

  • выберите кнопку Дополнительные параметры с символом многоточия (...) рядом с отчетом Euro Cup Winners (Победители Чемпионата Европы) на панели Поля и выберите действие Изменить запрос в раскрывающемся списке;Selecting the More options ellipsis (...) next to Euro Cup Winners in the Fields pane, and selecting Edit Query from the dropdown, or
  • выберите Изменить запросы > Изменить запросы в группе Внешние данные на вкладке ленты Главная в представлении отчета.Selecting Edit Queries > Edit Queries in the External data group of the Home ribbon tab in Report view.

Создание визуализацииCreate a visualization

Чтобы создать визуализацию на основе данных, сделайте следующее:To create a visualization based on your data:

  1. Выберите поле Country (Страна) на панели Поля или перетащите это поле на холст отчета.Select the Country field in the Fields pane, or drag it to the report canvas. Power BI Desktop автоматически распознает, что эти данные содержат названия стран, и создает визуализацию карты.Power BI Desktop recognizes the data as country names, and automatically creates a Map visualization.

    Визуализация карты

  2. Увеличьте эту карту, перетаскивая маркеры в ее углах, чтобы были видны имена всех победителей.Enlarge the map by dragging the handles in the corners so all the winning country names are visible.

    Увеличение карты

  3. На этой карте все точки, обозначающие страны-победительницы Чемпионата Европы по футболу, обозначены одинаковыми маркерами.The map shows identical data points for every country that won a Euro Cup tournament. Чтобы размер маркера отображал количество побед для каждой страны, перетащите поле Year (Год) в область Drag data fields here (Перетащите сюда поля данных) под элементом Размер в нижней части области Визуализации.To make the size of each data point reflect how often the country has won, drag the Year field to Drag data fields here under Size in the lower part of the Visualizations pane. Это поле автоматически преобразуется в меру Count of Year (Число значений Year), и на визуализации карты увеличится размер точек данных для тех стран, которые выиграли турнир несколько раз.The field automatically changes to a Count of Year measure, and the map visualization now shows larger data points for countries that have won more tournaments.

Настройка визуализацииCustomize the visualization

Вы убедились, что можно очень легко создать визуализации на основе данных.As you can see, it is very easy to create visualizations based on your data. Ничуть не сложнее будет настроить эти визуализации, чтобы данные было удобно просматривать.It's also easy to customize your visualizations to better present the data in ways that you want.

Форматирование картыFormat the map

Чтобы изменить внешний вид визуализации, выберите ее, а затем выберите значок Формат (с изображением валика) на панели Визуализации.You can change the appearance of a visualization by selecting it and then selecting the Format (paint roller) icon in the Visualizations pane. Например, точка данных "Germany" (Германия) на этой визуализации вводит пользователя в заблуждение: дважды турнир выигрывала ФРГ и один раз объединенная Германия. Эти две точки накладываются друг на друга, но не объединяются и не разделяются.For example, the "Germany" data point(s) in your visualization could be misleading, because West Germany won two tournaments and Germany won one, and the map superimposes the two points rather than separating or adding them together. Чтобы прояснить эту ситуацию, раскрасьте точки разными цветами.You can color these two points differently to highlight this. Также вы можете присвоить диаграмме более подробный и привлекательный заголовок.You can also give the map a more descriptive and attractive title.

  1. Выберите визуализацию и щелкните значок Формат, а затем выберите Цвета данных, чтобы развернуть параметры цветов данных.With the visualization selected, select the Format icon, and then select Data colors to expand the data color options.

    Форматирование цветов данных

  2. Для параметра Показать все выберите значение Включено, а затем выберите значок раскрывающегося списка рядом с элементом West Germany (ФРГ) и выберите для него желтый цвет.Turn Show All to On, and then select the dropdown next to West Germany and choose a yellow color.

    Изменение цвета

  3. Выберите Заголовок, чтобы развернуть параметры заголовка, и замените текущее значение поля Текст заголовка текстовой строкой Euro Cup Winners (Победители Чемпионата Европы).Select Title to expand the title options, and in the Title text field, type Euro Cup Winners in place of the current title.

  4. Укажите для параметра Цвет шрифта значение "Красный", затем установите для параметра Размер текста значение 12 и измените семейство шрифтов на Segoe (Bold) (Segoe (полужирный)).Change Font color to red, Text size to 12, and Font family to Segoe (Bold).

    Форматирование цветов данных

Теперь визуализация карты выглядит примерно так:Your map visualization now looks like this:

Визуализация карты после настройки формата

Изменение типа визуализацииChange the visualization type

Вы можете изменить тип визуализации, выбрав нужную визуализацию и значок другого типа в верхней части панели Визуализация.You can change the type of a visualization by selecting it and then selecting a different icon at the top of the Visualization pane. Например, на нашей визуализации карты отсутствуют данные для СССР и Чехословакии, поскольку их больше нет на карте мира.For example, your map visualization is missing the data for the Soviet Union and Czechoslovakia, because those countries no longer exist on the world map. Другой тип визуализации, например диаграмма дерева или круговая диаграмма могут оказаться более точными, так как на них отображаются все значения.Another type of visualization like a treemap or pie chart may be more accurate, because it shows all the values.

Чтобы заменить карту на круговую диаграмму, выберите карту и щелкните значок круговой диаграммы на панели Визуализация.To change the map to a pie chart, select the map and then select the Pie chart icon in the Visualization pane.

Совет

  • После этого можно изменить цвета данных, чтобы ФРГ и объединенная Германия отображались одним и тем же цветом.You can use the Data colors formatting options to make "Germany" and "West Germany" the same color.
  • Чтобы страны с наибольшим количеством побед отображались на круговой диаграмме рядом, выберите кнопку с многоточием (...) в верхнем правом углу визуализации и щелкните Sort by Count of Year (Сортировать по числу значений Year) в раскрывающемся списке.To group the countries with the most wins together on the pie chart, select the ellipsis (...) at the upper right of the visualization, and then select Sort by Count of Year from the dropdown.

Power BI Desktop предоставляет удобные возможности для получения данных из разнообразных источников и их обработки для анализа и визуализации в интерактивном режиме.Power BI Desktop provides a seamless end-to-end experience, from getting data from a wide range of data sources and shaping it to meet your analysis needs, to visualizing this data in rich and interactive ways. Готовый отчет можно отправить в Power BI и создать на его основе панели мониторинга, к которым можно предоставить общий доступ для других пользователей Power BI.Once your report is ready, you can upload it to Power BI and create dashboards based on it, which you can share with other Power BI users.

См. также:See also