Статистические выражения в визуализациях Power BIAggregates in Power BI visualizations

Что такое статистическое выражение?What is an aggregate?

Иногда над данными нужно выполнить математическую операцию с объединением значений.Sometimes you want to mathematically combine values in your data. К таким операциям относятся сложение, вычисление среднего или максимального значения, подсчет и др. Объединение значений данных называется статистическим вычислением.The mathematical operation could be sum, average, maximum, count, etc. When you combine values in your data, it is called aggregating. В результате таких операций появляются статистические выражения.The result of that mathematical operation is an aggregate.

При создании визуализаций в службе Power BI и приложении Power BI Desktop для данных может выполняться статистическое вычисление.When Power BI service and Power BI Desktop create visualizations, they may aggregate your data. Часто этот вариант подходит, но в некоторых случаях, возможно, потребуется обработать значения по-другому.Often the aggregate is just what you need, but other times you may want to aggregate the values in a different way. Например, для суммирования и получения среднего значения применяются разные подходы.For example, a sum versus an average. Есть несколько способов управления статистическим вычислением, используемым в визуализации, и его изменения.There are several different ways to manage and change the aggregate being used in a visualization.

Сначала давайте рассмотрим типы данных, так как тип данных определяет, как выполнять статистическое вычисление и требуется ли это.First, let's take a look at data types because the type of data determines how, and if, it can be aggregated.

Типы данныхTypes of data

В большинстве наборов данных содержится более одного типа данных.Most datasets have more than one type of data. На самом базовом уровне данные могут быть числовыми или нечисловыми.At the most basic level, the data is either numeric or it is not. Для числовых данных можно выполнить статистическое вычисление с помощью выражений "Сумма", "Среднее", "Количество", "Минимум", "Дисперсия" и многих других.Numeric data can be aggregated using a sum, average, count, minimum, variance, and much more. Даже для текстовых данных, часто называемых категориальными, можно выполнить статистическое вычисление.Even textual data, often called categorical data, can be aggregated. Если вы пытаетесь выполнить статистическое вычисление для полей с категориальными данными (поместив их в контейнер только числовых значений, такой как Значения или Подсказки), PowerBI может подсчитать количество экземпляров каждой категории или количество уникальных экземпляров каждой категории.If you try to aggregate a categorical fields (by placing it in a numeric only bucket like Values or Tooltips), Power BI will count the occurrences of each category or count the distinct occurrences of each category. А специальные типы данных, такие как даты, могут иметь несколько собственных статистических параметров, например: самая ранняя, самая поздняя, первая и последняя.And special types of data, like dates, have a few of their own aggregate options: earliest, latest, first, and last.

В следующем примере:In the example below:

  • Столбцы Units Sold (Продано единиц) и Manufacturing Price (Цена производителя) содержат числовые данные.Units Sold and Manufacturing Price are columns that contains numeric data
  • Столбцы Segment (Сегмент), Country (Страна), Product (Продукт), Month (Месяц), и Month Name (Название месяца) содержат категориальные данные.Segment, Country, Product, Month, and Month Name contain categorical data

При создании визуализации в Power BI статистическое вычисление для числовых полей (по умолчанию Сумма) будет выполняться по определенному полю с категориальными данными.When creating a visualization in Power BI, numeric fields will be aggregated (the default is sum) over some categorical field. Например, Units Sold by Product (Продано единиц по продуктам), Units Sold by Month (Продано единиц по месяцам) и Manufacturing Price by Segment (Цена производителя по сегментам).For example, "Units Sold by Product, "Units Sold by Month" and "Manufacturing Price by Segment. Некоторые числовые значения называют мерами.Some numeric fields are referred to as measures. Меры в редакторе отчетов Power BI определить очень просто — они отображаются с символом ∑ в списке "Поля".It's easy to identify measaures in the Power BI report editor -- measures are shown with the ∑ symbol in the Fields list. Дополнительные сведения см. в статье Знакомство с редактором отчетов.For more information see The report editor... take a tour.

Почему статистические выражения не работают так, как мне нужно?Why don't aggregates work the way I want them to?

Работа статистических выражений в службе Power BI может сбивать с толку. Например, в Power BI может не получиться изменить статистическое выражение для числового поля.Working with aggregates in Power BI service can be confusing; maybe you have a numeric field and Power BI won't let you change the aggregation. Или, например, вы не хотите применять статистическое выражение к полю "год" — вам просто нужно подсчитать количество экземпляров.Or maybe you have a field, like a year, and you don't want to aggregate it, you just want to count the number of occurrences.

Чаще всего источником проблемы является неправильное определение полей в наборе данных.Most often, the source of the problem is how the field was defined in the dataset. Поле может быть определено как текстовое. В таком случае для него нельзя вычислить сумму или среднее значение.Maybe the field is defined as text and that explains why it can't be summed or averaged. К сожалению, категорию поля может изменить только владелец набора данных.Unfortunately, only the dataset owner can change the way a field is categorized. При наличии разрешений владельца для набора данных, как в приложении Desktop, так и в программе, которая использовалась для создания набора данных (например, Excel), вы можете решить эту проблему.So if you have owner permissions to the dataset, either in Desktop or the program that was used to create the dataset (e.g., Excel), you can fix this problem. В противном случае потребуется обратиться к владельцу набора данных за помощью.Otherwise, you'll need to contact the dataset owner for help.

См. раздел Рекомендации и устранение неполадок в конце этой статьи, чтобы разобраться в работе статистических выражений.To help you navigate the confusion we have a special section at the end of this article called Considerations and troubleshooting. Если вы не нашли ответ на свой вопрос, опубликуйте его на форуме сообщества Power BI, чтобы получить оперативный ответ непосредственно от команды Power BI.If you don't find your answer there, post your question on the Power BI Community forum for a quick response directly from the Power BI team.

Изменение вычисления числового поляChange how a numeric field is aggregated

Предположим, есть диаграмма, в которой суммируются проданные единицы различных продуктов, но вместо суммы требуется получить среднее значение.Say you have a chart that sums the units sold for different products, but you'd rather have the average.

  1. Создайте диаграмму, в которой используются категория и мера.Create a chart that uses a category and a measure. В этом примере мы используем Units Sold by Product (Продано единиц по продукту).In this example we're using Units Sold by Product. По умолчанию в Power BI создается диаграмма, в которой суммируется число проданных единиц (мера в списке значений) для каждого продукта (категория в списке осей).By default, Power BI creates a chart that sums the units sold (measure in the Value well) for each product (category in the Axis well).

  2. На панели "Визуализации" щелкните правой кнопкой мыши меру и выберите нужный тип вычисления.In the Visualizations pane, right-click the measure, and select the aggregate type you need. В этом случае мы выбираем "Среднее".In this case, we're selecting Average. Если нужного статистического выражения нет, см. раздел "Рекомендации и устранение неполадок" ниже.If you don't see the aggregation you need, see "Considerations and troubleshooting" below.

    Примечание

    Параметры, доступные в раскрывающемся списке, будут зависеть от выбранного поля и способа его категоризации владельцем набора данных.The options available in the dropdown will vary depending on 1) the field selected and 2) the way that field was categorized by the dataset owner.

  3. Теперь для вашей визуализации выполнено статистическое вычисление среднего значения.Your visualization is now using aggregated by average.

Способы статистического вычисления для данныхWays to aggregate your data

Некоторые параметры, которые могут быть доступны для статистической обработки поля:Some of the options that may be available for aggregating a field:

  • Не суммировать.Do Not Summarize. Если этот параметр выбран, каждое значение в этом поле обрабатывается отдельно и не суммируется.With this option chosen, each value in that field is treated separately and not summarized. Это часто используется при наличии числового столбца идентификатора, который не должен суммироваться.This is often used if you have a numeric ID column that shouldn't be summed.
  • Сумма.Sum. Все значения в этом поле суммируются.This adds all the values in that field up.
  • Среднее.Average. Вычисляется среднее арифметическое значений.Takes an arithmetic mean of the values.
  • Минимум.Minimum. Отображается самое низкое значение.Shows the smallest value.
  • Максимум.Maximum. Отображается самое высокое значение.Shows the largest value.
  • Количество (не пустых).Count (Not Blanks). Подсчитывается количество значений в этом поле, которые не являются пустыми.This counts the number of values in that field that are not blank.
  • Количество (уникальных).Count (Distinct). Подсчитывается количество уникальных значений в этом поле.This counts the number of different values in that field.
  • Стандартное отклонение.Standard deviation.
  • Отклонение.Variance.
  • Медиана.Median. Показывает значение медианы (среднее).Shows the median (middle) value. Это значение с тем же или меньшим числом элементов.This is the value that has the same number of items above and below. Если медиан две, Power BI вычисляет среднюю.If there are 2 medians, Power BI averages them.

Например, эти данные:For example, this data:

СтранаCountry ОбъемAmount
СШАUSA 100100
Соединенное КоролевствоUK 150150
КанадаCanada 100100
ГерманияGermany 125125
ФранцияFrance
ЯпонияJapan 125125
АвстралияAustralia 150150

выдадут следующие результаты:Would give the following results:

  • Не суммировать: каждое значение отображается отдельноDo Not Summarize: Each value is shown separately
  • Сумма: 750Sum: 750
  • Среднее: 125Average: 125
  • Максимум: 150Maximum: 150
  • Минимум: 100Minimum: 100
  • Количество (не пустых): 6Count (Not Blanks): 6
  • Количество (уникальных): 4Count (Distinct): 4
  • Стандартное отклонение: 20.4124145...Standard deviation: 20.4124145...
  • Отклонение: 416.666...Variance: 416.666...
  • Медиана: 125Median: 125

Создание статистического вычисления с использованием категориального (текстового) поляCreate an aggregate using a category (text) field

Можно выполнять статистическое вычисление и для нечисловых полей.You can also aggregate a non-numeric field. Например, существующее поле с названия продукта можно добавить в качестве значения и задать для него выражение Количество, Количество уникальных, Первый или Последний.For example, if you have a product name field, you can add it as a value and then set it to Count, Distinct count, First, or Last.

  1. В этом примере мы перетащили поле Product (Продукт) в список значений.In this example, we've dragged the Product field into the Values well. Список значений обычно используется для числовых полей.The Values well is typically used for numeric fields. Power BI распознает, что это текстовое поле, задает для статистического вычисления параметр Не суммировать и выводит таблицу с одним столбцом.Power BI recognizes that this is a text field, sets the aggregate to Do not summarize, and presents us with a single-column table.

  2. Если изменить статистическую функцию по умолчанию Не суммировать на Количество уникальных, Power BI подсчитает количество разных продуктов.If we change the aggregation from the default Do not summarize to Count (Distinct), Power BI counts the number of different products. В нашем случае это 4.In this case, there are 4.

  3. Если мы изменим статистическое выражение на Количество, Power BI подсчитает общее количество.And if we change the aggregation to Count, Power BI counts the total number. В этом случае для элемента Product (Продукт) отображается 7 записей.In this case, there are 7 entries for Product.

  4. Перетащив то же поле (в этом случае Product (Продукт)) в список значений и оставив статистическое выражение по умолчанию Не суммировать, мы распределим в Power BI количество по продуктам.By dragging the same field (in this case Product) into the Values well, and leaving the default aggregation Do not summarize, Power BI breaks down the count by product.

Рекомендации и устранение неполадокConsiderations and Troubleshooting

Вопрос. Почему не отображается параметр Не суммировать?Q: Why don't I have a Do not summarize option?

Ответ. Выбранное поле, скорее всего, является вычисляемой или дополнительной мерой, созданной в Excel или Power BI Desktop.A: The field you've selected is likely a calculated measure or advanced measure created in Excel or Power BI Desktop. Каждая вычисляемая мера имеет собственную жестко заданную формулу.Each calculated measure has its own hard-coded formula. Используемое статистическое выражение изменить нельзя.You can’t change the aggregation being used. Например если это выражение "Сумма", выполнять можно только суммирование.For example, if it’s a sum, it can only be a sum. В списке полей вычисляемые меры отображаются с символом калькулятора.In the Fields list, calculated measures are shown with the calculator symbol.

Вопрос. Мое поле является числовым, почему доступны только варианты Количество и Число разных элементов?Q: My field is numeric, why are my only choices Count and Distinct count?

Ответ 1. Вероятно, владелец набора данных случайно или преднамеренно не отнес поле к категории числовых.A1: The likely explanation is that the dataset owner has, accidentally or intentionally, not classified the field as a number. Например, если в наборе данных есть поле Год, владелец набора данных может категоризировать его как текст, ведь поле Год, скорее всего, будет подсчитано (например, вычислено количество человек, родившихся в 1974 г.), а не суммировано или усреднено.For example, if a dataset has a year field, the dataset owner may categorize that as text because it is more likely that the year field will be counted (i.e., number of people born in 1974) and not that it will be summed or averaged. Если вы владелец, откройте набор данных в Power BI Desktop и измените тип данных на вкладке Моделирование.If you are the owner, you can open the dataset in Power BI Desktop and use the Modeling tab to change the data type.

Ответ 2. Если рядом с полем отображается значок калькулятора, это поле является вычисляемой мерой. Каждая вычисляемая мера имеет свою жестко заданную формулу, изменить которую может только владелец набора данных.A2: If the field has a calculator icon, that means it's a calculated measure and each calculated measure has its own hard-coded formula that can only be changed by a dataset owner. Используемое вычисление может быть простым статистическим выражением, например средним значением или суммой, но это может быть и более сложная операция, например "процент вклада в родительскую категорию" или "нарастающий итог с начала года".The calculation being used may be a simple aggregation like an average or sum, but it may also be something more complicated like a "percent of contribution to parent category" or "running total since start of the year". Power BI не суммирует и не находит среднее значение, но вместо этого просто повторно вычисляет значение (с помощью жестко заданной формулы) для каждой точки данных.Power BI isn't going to sum or average the results but will instead just re-calculate (using the hard-coded formula) for each data point.

Ответ 3. Еще один вариант: вы случайно поместили поле в контейнер, который допускает только категориальные значения.A3: Another possibility is that you've dropped the field into a bucket that only allows categorical values. В этом случае единственным доступными параметрами будут "Количество" и "Число разных элементов".In that case, your only options will be count and distinct count.

Ответ 4. Третье возможное объяснение: вы используете поле для оси.A4: And a third possibility is that you're using the field for an axis. Например, на оси линейчатой диаграммы Power BI отображает одну панель для каждого уникального значения. Значения полей в этом случае вообще не вычисляются.On a bar chart axis, for example, Power BI shows one bar for each distinct value -- it doesn't aggregate the field values at all.

Примечание

Исключением из этого правила являются точечные диаграммы, для которых требуются вычисленные значения для осей X и Y.The exception to this rule is scatter charts, which require aggregated values for the X and Y axes.

Вопрос. Я использую точечную диаграмму и хочу, чтобы поле не вычислялось.Q: I have a scatter chart and I want my field to not aggregate. Как это сделать?How do I do this?

Ответ. Добавьте поле в контейнер Сведения, но не в контейнеры осей X и Y.A: Add the field to the Details bucket and not to the X or Y axes buckets.

Вопрос. Когда я добавляю числовые поля в визуализацию, большинство полей по умолчанию суммируются, но для некоторых по умолчанию вычисляется среднее значение, количество или выполняется другая операция.Q: When I add a numeric field to a visualization, most of them default to sum but some default to average or count or some other aggregation. Почему статистическое выражение по умолчанию не всегда одинаковое?Why isn't the default aggregation always the same?

Ответ. Владельцы наборов данных могут назначать суммирование по умолчанию для каждого поля.A: Dataset owners have the option to set the default summarization for each field. Если вы владелец набора данных, измените суммирование по умолчанию на вкладке Моделирование в Power BI Desktop.If you are a dataset owner, change the default summarization in the Modeling tab of Power BI Desktop.

Вопрос. Я владелец набора данных. Я хочу, чтобы в поле никогда не выполнялось статистическое выражение.Q: I'm a dataset owner and I want to ensure that a field is never aggregated.

Ответ. В Power BI Desktop на вкладке Моделирование установите для параметра Тип данных значение Текст.A: In Power BI Desktop, in the Modeling tab, set Data type to Text.

Вопрос. В раскрывающемся списке не отображается параметр Не суммировать.Q: I do not see Do not summarize as an option in my dropdown.

Ответ. Попробуйте удалить поле, а затем добавить его снова.A: Try removing the field and adding it back in.

Появились дополнительные вопросы?More questions? Ответы на них см. в сообществе Power BI.Try the Power BI Community