Анализ данных веб-страницы с помощью Power BI Desktop (руководство)Analyzing Web page data using Power BI Desktop (tutorial)

Изучив этот учебник, вы узнаете, как импортировать таблицу данных с веб-страницы и создать отчет для их визуализации.In this tutorial, you learn how to import a table of data from a Web page and create a report to visualize this data. В ходе этого процесса вы будете переходить по таблицам, доступным на веб-странице, и применять преобразования данных для обработки таблицы.As part of this process, you navigate across tables available on a web page, and apply data transformation steps to bring the table into a new shape.

В этой статье:In this article:

  • Задача 1. Подключение к веб-источнику данныхTask 1: Connect to a web data source
  • Задача 2. Обработка данных в представлении запросовTask 2: Shape data in the Query view
    • Шаг 1. Удаление других столбцов для отображения только нужных столбцовStep 1: Remove Other Columns to only display columns of interest
    • Шаг 2. Замена значений для очистки выделенного столбцаStep 2: Replace Values to clean up values in a selected column
    • Шаг 3. Фильтрация значений в столбцеStep 3: Filter values in a column
    • Шаг 4. Переименование столбцаStep 4: Rename a column
    • Шаг 5. Фильтрация нулевых значений в столбцеStep 5: Filter null values in a column
    • Шаг 6. Переименование запросаStep 6: Rename a query
    • Созданные действия запросаQuery Steps created
  • Задача 3. Создание визуализаций с помощью представления отчетаTask 3: Create visualizations using the Report view
    • Шаг 1. Загрузка запроса в отчетStep 1: Load the query to your report
    • Шаг 2. Создание визуализации диаграммы дереваStep 2: Create a Map visualization

Задача 1. Подключение к веб-источнику данныхTask 1: Connect to a web data source

В задаче 1 вам нужно импортировать таблицу со сводкой турнира со страницы УЕФА в Википедии (http://en.wikipedia.org/wiki/UEFA_European_Football_Championship).In task 1, you import a Tournament Summary table from the UEFA European Football Championship Wikipedia page at the following location: http://en.wikipedia.org/wiki/UEFA_European_Football_Championship

Добавление источника данных страницы ВикипедииAdd a Wikipedia page data source

  1. В диалоговом окне Приступая к работе или на вкладке Главная на ленте выберите Получить данные.In the Getting Started dialog or in the Home ribbon tab, select Get Data.
  2. Откроется диалоговое окно Получение данных , в котором можно выбрать из множества источников данных для импорта данных в Power BI Desktop.This brings up the Get Data dialog, where you can pick from a wide range of data sources to import data into Power BI Desktop. Мы выберем источник Интернет в группе Все или Другие .We will select Web which is available under the All or Other group.
  3. В диалоговом окне Веб-содержимое в текстовое поле URL-адрес вставьте URL-адрес страницы Википедии (http://en.wikipedia.org/wiki/UEFA_European_Football_Championship).In the Web Content dialog box, in the URL text box, paste the Wikipedia URL (http://en.wikipedia.org/wiki/UEFA_European_Football_Championship).
  4. Нажмите кнопку ОК.Click OK.

После подключения к веб-странице в диалоговом окне Навигатор отображается список таблиц, доступных на этой странице Википедии.After establishing a connection to the web page, you see a list of tables available on this Wikipedia page in the Navigator dialog. Можно щелкнуть один раз каждую из этих таблиц для просмотра данных.You can single-click on each of these tables to preview the data.

В левой области окна Навигатор щелкните таблицу Results[edit] сводки результатов турнира или выберите таблицу Results[edit] и нажмите кнопку Изменить.In the Navigator left-pane, select the Results[edit] table for the Tournament Summary results, or select the Results[edit] table and select Edit. Это позволит изменить форму таблице перед ее загрузкой в отчет, так как формат данных пока не подходят для анализа.This will allow us to reshape this table before loading it to the Report, since the data is not in the shape that we need for our analysis.

Откроется окно предварительного просмотра таблицы в представлении запроса, где мы сможем применить набор преобразований для очистки данных.This will land a preview of the table in the Query view, where we can apply a set of transformation steps to clean up the data.

Задача 2. Обработка данных в таблицеTask 2: Shape data in the subject table

После выбора таблицы выбранной для запроса данных вы узнаете, как выполнять различные действия обработки и очистки данных.Now that you have the subject table selected for your data query, you learn how to perform various data shaping and cleansing steps.

Шаг 1. Удаление других столбцов для отображения только нужных столбцовStep 1: Remove Other Columns to only display columns of interest

На этом шаге вы удалите все столбцы, кроме Year (Год) и Final Winners(Победители финала).In this step, you remove all columns except Year and Final Winners.

  1. В таблице Просмотр запроса выберите столбцы Год и Победители финала (CTRL + щелчок).In the Query Preview grid, select the Year and Final Winners columns (use CTRL + Click).
  2. Щелкните правой кнопкой мыши заголовок столбца в таблице Просмотр запроса и выберите команду Удалить другие столбцы , чтобы удалить невыбранные столбцы.Right-click a column header in the Query Preview grid, and click Remove Other Columns to remove the unselected columns. Обратите внимание, что эта операция также доступна на вкладке Главная в группе Управление столбцами ленты.Note that this operation is also available in the Home ribbon tab, in the Manage Columns group.

Шаг 2. Замена значений для очистки выделенного столбцаStep 2: Replace Values to clean up values in a selected column

На этом шаге вы замените суффикс сведений в столбце Year (Год).In this step, you replace the Details suffix in the Year column. Обратите внимание, что этот суффикс размещен в новой строке, поэтому он не отображается в области предварительного просмотра таблицы.Note that this suffix is on a new line so it is not visible in the table preview. Но если щелкнуть одну из ячеек с числовым значением в столбце "Year", вы увидите полное значение в подробном представлении.However, if you click in one of the cells with a numeric value in the Year column, you will see the full value in the detailed view.

  1. Выберите столбец Year (Год).Select the Year column.
  2. На ленте представления запроса нажмите кнопку Заменить значения на вкладке Главная или щелкните правой кнопкой мыши столбец Year (Год) и выберите команду Заменить значения , чтобы заменить сведения на пустой текст.In the Query view ribbon, click Replace Values under the Home tab or right-click the Year column, and click Replace Values to replace Details with empty text.
  3. В диалоговом окне Замена значений введите сведения в текстовом поле Значение для поиска и оставьте текстовое поле Заменить на пустым.In the Replace Values dialog box, type Details in the Value to Find text box and leave the Replace With text box empty.
  4. Нажмите кнопку ОК.Click OK.

Шаг 3. Фильтрация значений в столбцеStep 3: Filter values in a column

На этом шаге вы отфильтруете столбец Year (Год) так, чтобы показывать только строки, которые не содержат слово Year.In this step, you filter the Year column to display rows that do not contain “Year”.

  1. Щелкните стрелку раскрывающегося фильтра в столбце Year (Год).Click the filter drop down arrow on the Year column.
  2. В раскрывающемся списке Фильтр снимите флажок Year (Год).In the Filter drop-down, clear the Year option.
  3. Нажмите кнопку ОК.Click OK.

Шаг 4. Переименование столбцаStep 4: Rename a column

После очистки данных в столбце Year (Год) мы поработаем над столбцом Final Winner (Победитель финала).Now that we have cleaned up the data in the Year column, we are going to work on the Final Winner column.

Поскольку мы ищем только в списке победителей, мы можем переименовать этот столбец в Country(Страна).Since we are only looking at the list of winners, we can rename this column to Country.

  1. Выберите столбец Final Winner (Победитель финала) в области предварительного просмотра запроса.Select the Final Winner column in the Query preview.
  2. На ленте представления запроса на вкладке Преобразование в группе Любой столбец вы найдете команду Переименовать.In the Query view ribbon, under the Transform tab and Any Column group, you will find Rename.
  3. После этого имя столбца можно будет изменить.This will make the column name editable. Мы переименуем этот столбец в Country(Страна).We will rename this column to Country.

Шаг 5. Фильтрация нулевых значений в столбцеStep 5: Filter out null values in a column

Кроме того, нам нужно отфильтровать нулевые значения в столбце Country (Страна).We also need to filter out null values in the Country column. Для этого можно использовать меню фильтра, как на шаге 3. Или же можно выполнить следующие действия.In order to do this, we could use the filter menu as we saw in Step 3, or alternatively we can:

  1. Щелкните правой кнопкой мыши одну из ячеек в столбце Country (Страна), который содержит нулевое значение.Right-click on one of the cells in the Country column that contain a null value.
  2. В контекстном меню выберите Текстовые фильтры -> Не равно.Select Text Filters -> Does not Equal in the context menu.
  3. При этом создается новое действие фильтра для удаления строк с нулевыми в столбце Country (Страна).This creates a new filter step to remove rows with null values in the Country column.

Шаг 6. Указание имени запросаStep 6: Name a query

На этом шаге вы укажете имя окончательного запроса Euro Cup Winners(Победители Еврокубка).In this step, you name your final query Euro Cup Winners.

  1. В области Параметры запроса в текстовом поле Имя введите Euro Cup Winners(Победители Еврокубка).In the Query Settings pane, in the Name text box, enter Euro Cup Winners.

Задача 3. Создание визуализаций с помощью представления отчетаTask 3: Create visualizations using the Report view

После преобразования данных в форму, необходимую для анализа, мы можем загрузить полученную таблицы в отчет и создать визуализации.Now that we have converted the data into the shape that we need for our analysis, we can load the resulting table into our Report and create a few visualizations.

Шаг 1. Загрузка запроса в отчетStep 1: Load the query to your report

Чтобы загрузить результаты запроса в Power BI Desktop и создать отчет, выберите Загрузить и закрыть на ленте Главная.In order to load the query results to Power BI Desktop and create a report, we select Close & Load from the Home ribbon.

При этом начинается вычисление запроса и загрузка выходных данных таблицы в отчет.This will trigger evaluation of the query and load of the table output to the Report. В Power BI Desktop выберите значок Отчет , чтобы увидеть Power BI Desktop в представлении отчета.In Power BI Desktop, select the Report icon to see Power BI Desktop in Report view.

После завершения загрузки запроса вы увидите полученную таблицу в области полей справа от представления отчетов.You can see the resulting table fields in the Fields pane at the right of the Report view.

Шаг 2. Создание визуализации диаграммы дереваStep 2: Create a Map visualization

Чтобы создать визуализацию, можно перетащить поля из списка полей и разместить их на холсте отчета.In order to create a visualization, we can drag fields from the Field list and drop them in the Report canvas.

  1. Перетащите поле Country (Страна) и поместите его на холсте отчета.Drag the Country field and drop it in the Report canvas. При этом на холсте отчетасоздается визуализация.This will create a new visualization in the Report canvas. Поскольку в этом случае у нас есть список стран, будет создана визуализация карты.In this case, since we have a list of countries, it will create a Map visualization.

  2. Можно легко изменить тип визуализации, щелкнув другой значок в области Визуализация .We can easily change the type of visualization by clicking on a different icon in the Visualization pane.

  3. Мы оставим тип визуализации Карта. Можно также изменить размеры визуализации, перетащив один из углов визуализации до нужного размера.We are going to stay with the Map visualization type to Map, We can also resize the visualization by dragging from one of the corners of the visualization up to the desired size.

  4. Обратите внимание, что в настоящее время все точки на карте одинакового размера.Note that currently all the points in the map have the same size. Нам необходимо изменить размер так, чтобы страны, выигравшие больше всех еврокубков, были представлены большей точкой на карте.We want to change this so that countries with more Euro Cup tournaments won are represented with a larger point in the map. Для этого можно перетащить поле Year (Год) в списке полей в поле Значения в нижней части области полей.In order to do thiso, we can drag the Year field in the Fields list to the Values box in the lower half of the Fields pane.

Как видно, вы можете очень легко настроить визуализации в отчете для представления данных нужным образом.As you can see, it is very easy to customize visualizations in your report, in order to present the data in the way that you want. Power BI Desktop предоставляет удобные возможности для получения данных из разнообразных источников и их обработки для анализа и визуализации интерактивными способами.Power BI Desktop provides a seamless end-to-end experience from getting data from a wide range of data sources and shaping it to meet your analysis needs to visualizing this data in rich and interactive ways. Готовый отчет можно отправить в Power BI и создать на его основе панели мониторинга, к которым можно предоставить общий доступ для других пользователей Power BI.Once your report is ready, you can upload it to Power BI and create dashboards based on it, which you can share with other Power BI users.

На этом изучение учебника Импорт данных из Интернета завершено.This concludes the Importing Data from the Web tutorial. Полный файл Power BI Desktop можно скачать здесь.You can download the completed Power BI Desktop file here.

Где еще можно получить дополнительные сведения?Where else can I get more information?