Получение данных с веб-страниц по примерам

Функция получения данных из веб-страницы позволяет легко извлекать данные из веб-страниц и импортировать их в Power BI Desktop. Однако часто данные на веб-страницах не находятся в аккуратных таблицах, которые просто извлечь. Получение данных с таких страниц может быть сложной задачей, даже если данные структурированы и согласованы.

Но есть решение. Функция получения данных из Интернета по образцу позволяет вам "объяснить" Power BI Desktop, какие данные нужно извлечь, предоставив один или несколько примеров в диалоговом окне соединителя. Power BI Desktop собирает другие данные на странице, соответствующие вашим примерам. С помощью этого решения можно извлекать из веб-страниц все виды данных, включая данные, найденные в таблицах и других данных, отличных от таблиц.

Get data from web by example

Цены на диаграммах приведены только в качестве примера.

Использование функции получения данных из Интернета по образцу

Выберите Получить данные в меню ленты Главная. В диалоговом окне выберите Другие в списке категорий на панели слева, а затем выберите Интернет. Чтобы продолжить, щелкните Подключить.

select Web from Get Data

В разделе Из Интернета введите URL-адрес той веб-страницы, из которой вы хотите извлечь данные. В этой статье мы продемонстрируем работу этого соединителя на примере веб-страницы Microsoft Store.

Если вы хотите параллельно выполнять эти операции самостоятельно, скопируйте URL-адрес хранилища Microsoft, который мы используем в этой статье:

https://www.microsoft.com/store/top-paid/games/xbox?category=classics

Web dialog

Когда вы щелкнете ОК, откроется диалоговое окно Навигатор со всеми таблицами, которые были автоматически обнаружены на этой веб-странице. В сценарии на рисунке ниже таблицы не найдены. Выберите Добавить таблицу, используя примеры, чтобы указать примеры.

Navigator window

В разделе Добавить таблицу, используя примеры находится интерактивное окно, в котором можно просмотреть содержимое веб-страницы. Введите образцы значений данных, которые необходимо извлечь.

В нашем примере мы извлекаем имя и цену для каждой игры на странице. Достаточно указать для каждого столбца пару примеров значений, представленных на странице. При вводе примеров Power Query извлекает данные, соответствующие шаблону примеров записей, используя интеллектуальные алгоритмы извлечения данных.

Screenshot shows data from the internet.

Примечание

Предложения значений включают только значения, длина которых не превышает 128 символов.

Когда вы будете довольны данными, извлеченными с веб-страницы, выберите ОК, чтобы открыть редактор Power Query. Можно применить дополнительные преобразования или сформировать данные, например объединить эти данные с другими источниками данных.

Screenshot shows data extracted from the internet in the Power Query Editor.

Теперь вы можете создать на основе этих данных визуальные элементы или иначе использовать их в отчетах Power BI Desktop.

Дальнейшие действия

В Power BI Desktop можно подключаться к данным самых разных видов. Дополнительные сведения об источниках данных см. в перечисленных ниже статьях.