quantileTDigestWeighted
Вычисляет приблизительный квантиль числовой последовательности данных с помощью t-дискрета. Функция учитывает вес каждого элемента последовательности. Максимальная ошибка составляет 1%. Потребление памяти равно log(n)
, где n
— это количество значений.
Производительность функции ниже, чем у quantile или quantileTiming. В отношении соотношения размера состояния к точности эта функция значительно лучше, чем quantile
.
Результат зависит от порядка выполнения запроса и является недетерминированным.
При использовании нескольких функций quantile*
с разными уровнями в одном запросе внутренние состояния не комбинируются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.
Использование quantileTDigestWeighted
не рекомендуется для маленьких наборов данных и может приводить к значительным ошибкам. В этом случае рассмотрите возможность использования quantileTDigest
вместо.
Синтаксис
Псевдоним: medianTDigestWeighted
.
Аргументы
level
— Уровень квантиля. Необязательный параметр. Константа с плавающей запятой от 0 до 1. Мы рекомендуем использовать значениеlevel
в диапазоне[0.01, 0.99]
. Значение по умолчанию: 0.5. Приlevel=0.5
функция вычисляет медиану.expr
— Выражение по значениям колонки, результатом которого являются числовые типы данных, Date или DateTime.weight
— Колонка с весами элементов последовательности. Вес — это количество вхождений значения.
Возвращаемое значение
- Приблизительный квантиль указанного уровня.
Тип:
- Float64 для входных данных числового типа.
- Date если входные значения имеют тип
Date
. - DateTime если входные значения имеют тип
DateTime
.
Пример
Запрос:
Результат:
Смотрите также