Источники данных для службы Power BIData sources for the Power BI service

Данные находятся в основе Power BI.Data is at the heart of Power BI. При изучении данных, создании диаграмм и панелей мониторинга или добавлении вопросов в список вопросов и ответов все визуализации и ответы, отображаемые на экране, основаны на определенном наборе данных.Whenever you’re exploring data, creating charts and dashboards, asking questions with Q&A, all of those visualizations and answers you see are really getting their underlying data from a dataset. Этот набор извлекаетсяBut where does that dataset come from? из источника.Well, from a data source.

В этой статье мы рассмотрим различные типы источников данных, к которым можно подключаться из службы Power BI.In this article, we’re going to go over the different types of data sources you can connect to from the Power BI service. Помните о том, что существует и множество других источников.Keep in-mind, there are many other types of data sources you can get data from, too. Однако для них вам могут потребоваться приложение Power BI Desktop либо расширенные функции запросов и моделирования Excel.But those might require first using Power BI Desktop or Excel’s advanced data query and modeling features. Мы обратимся к этим темам позже.We’ll go into more about that later. Пока что изучим различные типы источников данных, к которым можно подключаться непосредственно с сайта службы Power BI.For now, let’s look at the different types of data sources you can connect to right from your Power BI service site.

Чтобы загрузить информацию из любого из этих источников, в Power BI нужно выбрать Моя рабочая область > Получить данные.You can get data from any of these data sources in Power BI by clicking My Workspace > Get Data.

ФайлыFiles

Excel (XLSX, XLXM). Особенность Excel заключается в том, что книга может содержать как значения, введенные непосредственно на листах, так и данные, загруженные из внешних источников с помощью запросов Power Query (функция "Скачать и преобразовать" в Excel 2016) или Power Pivot.Excel (.xlsx, xlxm) – Excel is unique in that a workbook can have both data you’ve entered into worksheets yourself, and you can query and load data from external data sources by using Power Query (Get & Transform in Excel 2016) or Power Pivot. Вы можете импортировать данные из таблиц на листах (данные должны быть в формате таблицы) или данные, загруженные в модель данных.You can import data that is in tables in worksheets (the data must be in a table), or import data that is loaded into a data model. Дополнительные сведения см. в статье Получение данных из Excel.To learn more, see Get data from Excel.

Power BI Desktop (формат PBIХ) — с помощью Power BI Desktop можно запрашивать и загружать данные из внешних источников, добавлять в модель данных меры и отношения, а также создавать отчеты.Power BI Desktop (.pbix) - You can use Power BI Desktop to query and load data from external data sources, extend your data model with measures and relationships, and create reports. Файл Power BI Desktop можно импортировать на сайт Power BI.You can import your Power BI Desktop file into your Power BI site. Приложение Power BI Desktop лучше всего подходит для более опытных пользователей, которые хорошо понимают, как работают их источники данных, запросы и преобразования, а также знакомы с принципами моделирования данных.Power BI Desktop is best for more advanced users who have a good understanding of their data sources, data query and transformation, and data modeling concepts. Дополнительные сведения см. в статье Подключение к данным в Power BI Desktop.To learn more, see Connect to data in Power BI Desktop.

Файл с разделителями-запятыми (CSV). Это обычные текстовые файлы, данные в которых упорядочены по строкам.Comma Separated Value (.csv) - Files are simple text files with rows of data. Каждая строка может содержать одно или несколько значений через запятуюEach row can contain one or more values, each separated by a comma. Например, в CSV-файле с именами и адресами может быть несколько строк, каждая из которых содержит значение имени, фамилии, улицы, номера дома, города, региона и т. д.For example, a .csv containing name and address data can have a number of rows where each row has values for first name, last name, street address, city, state, and so on. Импортировать данные в CSV-файл нельзя, однако многие приложения, такие как Excel, позволяют сохранять данные из простых таблиц в виде таких файлов.You cannot import data into a .csv file, but many applications, like Excel, can save simple table data as a .csv file.

Данные других типов, таких как таблицы XML (XML) и текстовые файлы (TXT), можно извлечь и преобразовать с помощью функции «Скачать и преобразовать», а затем загрузить в файл Excel или Power BI Desktop.For other file types like XML Table (.xml) or text (.txt) files, you can use Get & Transform to query, transform, and load that data into an Excel or Power BI Desktop file first. После этого такой файл можно импортировать в Power BI.You can then import the Excel or Power BI Desktop file into Power BI.

Многое также зависит от того, где хранятся файлы.Where you store your files makes a big difference, too. Служба OneDrive для бизнеса обеспечивает высокую степень гибкости и интеграции с Power BI.OneDrive for Business provides the greatest amount of flexibility and integration with Power BI. Файлы можно хранить и на локальном диске, однако для обновления данных потребуется выполнить несколько дополнительных действий.If you keep your files on your local drive, that’s ok, but if you need to refresh your data, a few extra steps are involved. Дополнительные сведения приведены в статьях по ссылкам.More details are provided in the linked articles.

Пакеты содержимогоContent packs

В пакетах содержимого есть все необходимые данные и отчеты, уже готовые к работе.Content packs contain all of the data and reports you need already prepared for you. В Power BI есть пакеты содержимого двух типов: загруженные из служб наподобие Google Analytics, Marketo и Salesforce, а также созданные и опубликованные другими пользователями организации.In Power BI, there are two types of content packs; those from services like Google Analytics, Marketo, or Salesforce, and those created and shared by other users in your organization.

Службы. Существуют буквально десятки служб с пакетами содержимого для Power BI, и каждый день появляются новые.Services – There are literally dozens of services with content packs for Power BI, and more are being added all the time. Для работы с большинством из них необходима учетная запись.Most services require you to have an account. Дополнительные сведения см. в статье Подключение к службам.To learn more, see Connect to services.

Организация. Если у вас и других пользователей организации есть учетная запись Power BI Pro, вы можете создавать, публиковать и использовать пакеты содержимого.Organizational – If you and other users in your organization have a Power BI Pro account, you can create, share, and use content packs. Дополнительные сведения см. в статье Знакомство с пакетами содержимого организации.To learn more, see Organizational content packs.

Базы данныхDatabases

Базы данных в облаке. Из службы Power BI можно в режиме реального времени подключаться к базам данных и хранилищу данных SQL Azure, службам Spark на Azure HDInsight и SQL Server Analysis Services с помощью DirectQuery.Databases in the Cloud – From the Power BI service, you can connect live to Azure SQL Database, Azure SQL Data Warehouse, Spark on Azure HD Insight, and SQL Server Analysis Services using DirectQuery. Подключения из Power BI к этим базам данных являются динамическими. Это означает, что при работы с информацией с помощью отчетов в Power BI в режиме соединения, например, с базой данных SQL Azure каждый раз, когда вы создаете срез данных или добавляете поле в визуализацию, формируется запрос непосредственно к базе.Connections from Power BI to these databases are live, that is, when you’ve connected to say an Azure SQL Database, and you begin exploring its data by creating reports in Power BI, anytime you slice your data or add another field to a visualization, a query is made right to the database. Дополнительные сведения см. в разделе Azure и Power BI.To learn more, see Azure and Power BI.

Локальные базы данных. Из службы Power BI можно подключаться непосредственно к базам данных табличных моделей в службах SQL Server Analysis Services.Databases on-premises – From the Power BI service, you can connect directly to SQL Server Analysis Services Tabular model databases. Для этого необходим корпоративный шлюз Power BI.A Power BI Enterprise gateway is required. Если вы не знаете точно, как подключиться к базе данных табличной модели организации, уточните это у своего администратора или в отделе ИТ.If you’re unsure how to connect to your organization’s tabular model database, check with your administrator or IT department. Дополнительные сведения см. в разделе Табличные данные служб SQL Server Analysis Services в Power BI.To learn more, see SQL Server Analysis Tabular data in Power BI.

Для работы с корпоративными базами данных других типов потребуется сначала установить подключение, извлечь и загрузить информацию в модель данных с помощью приложения Power BI Desktop или Excel.For other types of databases in your organization, you’ll need to first use Power BI Desktop or Excel to connect to, query, and load data into a data model. После этого файл можно импортировать в Power BI, где будет создан соответствующий набор данных.You can then import your file into Power BI where a dataset is created. Если у вас настроено обновление по расписанию, Power BI использует сведения о подключении из файла, а также заданные вами параметры для подключения непосредственно к источнику данных и запроса обновлений.If you setup scheduled refresh, Power BI will use connection information from the file along with refresh settings you configure to connect directly to the datasource and query for updates. Новая информация затем загружается в набор данных в Power BI.Those updates are then loaded into the dataset in Power BI. Дополнительные сведения см. в статье Подключение к данным в Power BI Desktop.To learn more, see Connect to data in Power BI Desktop.

Что, если мои данные находятся в другом источнике?What if my data comes from a different source?

Для работы с Power BI можно использовать буквально сотни различных источников данных.There are literally hundreds of different data sources you can use with Power BI. Однако независимо от того, где находится ваша информация, для создания отчетов и панелей мониторинга, поиска ответов в списках вопросов и ответов и т. д. формат этих данных должен поддерживаться службой Power BI.But regardless of where you get your data from, that data has to be in a format the Power BI service can use to create reports and dashboards, answer questions with Q & A, and so on.

Данные в некоторых источниках, таких как пакеты содержимого от поставщиков наподобие Google Analytics и Twilio, уже представлены в формате, готовом к работе с Power BI.Some data sources already have their data in a format ready for the Power BI service, like content packs from service providers like Google Analytics, and Twilio. Это относится и к базам данных табличных моделей служб SQL Server Analysis Services.SQL Server Analysis Services Tabular model databases are ready, too. Кроме того, можно в режиме реального времени подключаться к облачным базам данных, таким как SQL Azure и Spark на HDInsight.And you can connect live to databases in the cloud like Azure SQL Database and Spark on HDInsight.

В других случаях может потребоваться извлечь и загрузить необходимые данные в файл.In other cases, it might be necessary to query and load the data you want into a file. Например, предположим, информация о логистических операциях находится в хранилище данных на корпоративном сервере.For example, let’s say you have logistics data in a data warehouse database on a server in your organization. Из службы Power BI невозможно подключиться непосредственно к этой базе и приступить к работе с хранящимися в ней сведениями (если только это не база табличной модели).In the Power BI service, you cannot connect directly to that database and begin exploring its data (unless it is a tabular model database). Однако эту информацию можно извлечь и загрузить в модель данных с помощью приложения Power BI Desktop или Excel, а затем сохранить ее в виде файла.You can, however, use Power BI Desktop or Excel to query and load that logistics data into a data model you then save as a file. После этого файл можно импортировать в Power BI, где будет создан соответствующий набор данных.You can then import that file into Power BI where a dataset is created.

У вас может возникнуть вопрос: что, если логистическая информация меняется каждый день?You’re probably thinking “But that logistics data on that database changes every day. Как сделать так, чтобы сведения в Power BI постоянно обновлялись?How do I make sure my dataset in Power BI is refreshed?” В набор данных вместе с информацией из файла Power BI Desktop или Excel импортируются и сведения о подключении.Connection information from the Power BI Desktop or Excel file is imported into the dataset along with the data. Если у вас настроено обновление по расписанию либо вы обновляете набор данных вручную, Power BI использует эту информацию вместе с рядом дополнительных параметров для установки соединения непосредственно с базой данных, запроса обновлений и их загрузки в набор.If you setup scheduled refresh or do a manual refresh on the dataset, Power BI will use the connection information from the dataset, along with a couple other settings, to connect directly to the database, query for updates, and load those updates into the dataset. Для безопасного обмена данными между локальным сервером и Power BI, вероятно, потребуется шлюз Power BI.A Power BI gateway will likely be required to secure any data transfer between your on-premises server and Power BI. Все визуализации в отчетах и информационных панелях обновляются автоматически.Any visualizations in reports and dashboards are refreshed automatically.

Как мы видим, невозможность непосредственного подключения к источнику данных непосредственно из службы Power BI не означает, что данные нельзя загрузить в Power BI.You see, just because you cannot connect to your data source right from the Power BI service doesn’t mean you can’t get that data into Power BI. Для этого просто потребуется несколько дополнительных действий и, возможно, помощь специалистов из отдела ИТ.It just might take a few more steps and maybe some help from your IT department. Дополнительные сведения см. в статье Источники данных в Power BI Desktop.See Data sources in Power BI Desktop to learn more.

Еще кое-чтоSome more details

В контексте Power BI часто встречаются термины "набор данных" и "источник данных".You’ll see the terms dataset and data source used a lot in Power BI. Они часто смешиваются, но на самом деле это две разные, хотя и связанные между собой вещи.They’re often use synonymously, but they really are two different things, albeit related.

Набор данных автоматически создается в Power BI при использовании операции получения данных для подключения к пакету содержимого, файлу и импорта данных из него или при подключении к источнику динамических данных.A dataset is automatically created in Power BI when you use Get Data to connect to and import data from a content pack, file, or you connect to a live data source. Набор данных содержит сведения об источниках данных, учетные данные для подключения к ним, а во многих случаях и подмножество данных, скопированных из источника.A dataset contains information about the data source, data source credentials, and in many cases, a sub-set of data copied from the data source. В большинстве случаев при создании визуализаций в отчетах и панелях мониторинга используются данные из набора.In most cases, when you create visualizations in reports and dashboards, you’re looking at data in the dataset.

Источник данных — это место происхождения данных в наборе.A data source is where the data in a dataset really comes from. Например, это может быть веб-служба, такая как Google Analytics или QuickBooks, база данных в облаке, такая как SQL Azure, либо база данных или файл на локальном компьютере или сервере вашей организации.For example, an online service like Google Analytics or QuickBooks, a database in the cloud like Azure SQL Database, or a database or file on a local computer or server in your own organization.

Обновление данныхData refresh

Если ваши файлы хранятся на локальном диске или другом компьютере организации, для обновления наборов данных в Power BI вам, возможно, потребуется шлюз Power BI.If you save your files on your local drive, or a drive somewhere in your organization, a Power BI gateway might be required in-order to refresh the dataset in Power BI. Кроме того, во время обновления компьютер, на котором находится соответствующий файл, должен быть включен.And, the computer where the file is saved must be on when a refresh happens. Вы также можете повторно импортировать файл или воспользоваться функцией публикации из Excel или Power BI Desktop, однако эти действия выполняются вручную.You can also re-import your file, or use Publish from Excel or Power BI Desktop, but those are not automated processes.

Если вы подключаетесь к файлам, которые хранятся в службе OneDrive для бизнеса или на сайтах групп SharePoint, либо импортируете из них информацию в Power BI, ваши наборы данных, отчеты и панели мониторинга будут всегда актуальны.If you save your files on OneDrive for Business or SharePoint – Team Sites, and then connect to or import them into Power BI, your dataset, reports, and dashboard will always be up-to-date. Поскольку службы OneDrive и Power BI являются облачными, Power BI примерно раз в час подключается непосредственно к сохраненному файлу для проверки обновлений.Because both OneDrive and Power BI are in the cloud, Power BI can connect directly to your saved file, about once every hour, and check for updates. При их наличии все наборы данных и визуализации обновляются автоматически.If any are found, the dataset and any visualizations are refreshed automatically.

Пакеты содержимого из служб обновляются автоматически.Content packs from services are automatically updated. В большинстве случаев это происходит раз в сутки.In most cases, once a day. Обновление можно выполнить и вручную, однако наличие или отсутствие новых данных зависит от поставщика соответствующей службы.You can manually refresh, but whether or not you’ll see any updated data will depend on the service provider. Пакеты содержимого, публикуемые пользователями организации, связаны с соответствующими источниками данных, и их обновление зависит от параметров, настроенных их создателями.Content packs from others in your organization will depend on the data sources used and how the person who created the content pack setup refresh.

Особенность базы данных и хранилища данных SQL Azure, а также Spark на Azure HDInsight заключается в том, что эти источники находятся в облаке.Azure SQL Database, Azure SQL Data Warehouse, and Spark on Azure HDInsight are unique in that they are data sources in the Cloud. Поскольку служба Power BI также является облачной, она может подключаться к этим источникам данных в динамическом режиме с помощью DirectQuery.Because the Power BI service is also in the cloud, Power BI can connect to them live, using DirectQuery. Благодаря этому все содержимое в Power BI постоянно синхронизировано с источниками, и настраивать его обновление не требуется.What you see in Power BI is always in-sync and there’s no need to setup refresh.

Особенность служб SQL Server Analysis Services заключается в том, что подключение к ним из Power BI является динамическим (так же, как, например, к облачной базе данных Azure), но при этом сама база расположена на корпоративном сервере.SQL Server Analysis Services is unique in that when you connect to it from Power BI, it’s a live connection just like an Azure database in the cloud, but the database itself is on a server in your organization. Для подключений такого типа необходим шлюз Power BI, который обычно настраивают специалисты отдела ИТ.This type of connection requires a Power BI gateway, which is usually configured by an IT department.

Обновление данных — исключительно важный аспект работы с Power BI, и здесь невозможно рассмотреть все связанные с этим вопросы.Data refresh is a super important part of Power BI, and much too deep to cover here. Если вы хотите подробнее ознакомиться с ними, изучите статью Обновление данных в Power BI.If you want to get a thorough understanding, be sure to checkout Data Refresh in Power BI.

Рекомендации и ограниченияConsiderations and Limitations

Для всех источников данных, используемых в службе Power BI, действуют приведенные ниже ограничения и рекомендации.For all data sources used in the Power BI service, the following considerations and limitations apply. Существуют и другие ограничения, которые относятся к отдельным функциям, но перечисленные ниже ограничения действуют для службы Power BI в целом.There are other limitations that apply to specific features, but the following list apply to the Power BI service overall:

  • Максимальный размер набора данных. Максимальный размер каждого набора данных в службе Power BI не может превышать 1 ГБ.Dataset size limit - there is a 1 GB limit for each dataset in the Power BI service.
  • Ограничение количества строк. Максимальное число строк в наборе данных (если не используется DirectQuery) составляет 2 млрд. Три из этих строк зарезервированы, поэтому для использования остаются доступными 1 999 999 997 строк. Максимальное количество строк при использовании DirectQuery равно 1 млн.Row limit - the maximum number of rows in your dataset (when not using DirectQuery) is 2 billion, with three of those rows reserved (resulting in a usable maximum of 1,999,999,997 rows); the maximum number of rows when using DirectQuery is 1 million rows.
  • Ограничение количества столбцов. Максимальное число столбцов в наборе данных (все таблицы в наборе данных) равно 16 000.Column limit - the maximum number of columns allowed in a dataset, across all tables in the dataset, is 16,000 columns. Это ограничение распространяется на службу Power BI, а также на наборы данных в Power BI Desktop.This applies to the Power BI service and to datasets used in Power BI Desktop. В Power BI в каждой таблице из набора данных один столбец используется для внутренней нумерации строк. Это означает, что максимальное количество столбцов в каждой таблице из набора данных равно 16 000 минус один столбец.Power BI uses an internal row number column per table included in the dataset, which means the maximum number of columns is 16,000 minus one for each table used in the dataset.