Тип SimpleAggregateFunction
Описание
Тип данных SimpleAggregateFunction
хранит промежуточное состояние агрегатной функции, но не её полное состояние, как это делает тип AggregateFunction
.
Эта оптимизация может быть применена к функциям, для которых выполняется следующее свойство:
результат применения функции
f
к набору строкS1 UNION ALL S2
можно получить, применивf
к частям набора строк отдельно, а затем снова применивf
к результатам:f(S1 UNION ALL S2) = f(f(S1) UNION ALL f(S2))
.
Это свойство гарантирует, что частичные результаты агрегации достаточно для вычисления комбинированного результата, поэтому нам не нужно хранить и обрабатывать какие-либо дополнительные данные. Например, результат функций min
или max
не требует дополнительных шагов для вычисления окончательного результата из промежуточных шагов, в то время как функция avg
требует отслеживания суммы и количества, которые будут делиться для получения среднего в окончательном шаге Merge
, который объединяет промежуточные состояния.
Значения агрегатной функции обычно производятся путем вызова агрегатной функции с добавленным к имени функции комбинирующим вариантом -SimpleState
.
Синтаксис
Параметры
aggregate_function_name
- Имя агрегатной функции.Type
- Типы аргументов агрегатной функции.
Поддерживаемые функции
Поддерживаются следующие агрегатные функции:
any
anyLast
min
max
sum
sumWithOverflow
groupBitAnd
groupBitOr
groupBitXor
groupArrayArray
groupUniqArrayArray
groupUniqArrayArrayMap
sumMap
minMap
maxMap
Значения SimpleAggregateFunction(func, Type)
имеют тот же Type
, поэтому в отличие от типа AggregateFunction
нет необходимости применять комбинирующие варианты -Merge
/-State
.
Тип SimpleAggregateFunction
имеет лучшую производительность, чем AggregateFunction
для одинаковых агрегатных функций.