Перейти к основному содержимому
Перейти к основному содержимому

Ограничения на Сложность Запросов

Обзор

В рамках настроек ClickHouse предлагает возможность устанавливать ограничения на сложность запросов. Это помогает защитить от потенциально ресурсоемких запросов, обеспечивая более безопасное и предсказуемое выполнение, особенно при использовании пользовательского интерфейса.

Практически все ограничения применяются только к запросам SELECT, а для распределенной обработки запросов ограничения применяются на каждом сервере отдельно.

ClickHouse обычно проверяет ограничения только после полной обработки частей данных, а не для каждой строки. Это может привести к ситуации, когда нарушения ограничений происходят во время обработки части.

Настройки overflow_mode

У большинства ограничений также есть настройка overflow_mode, которая определяет, что происходит, когда лимит превышен, и может принимать одно из двух значений:

  • throw: выбросить исключение (значение по умолчанию).
  • break: остановить выполнение запроса и вернуть частичный результат, как если бы исходные данные исчерпались.

Настройки group_by_overflow_mode

Настройка group_by_overflow_mode также имеет значение any:

  • any: продолжить агрегацию для ключей, которые попали в набор, но не добавлять новые ключи в набор.

Список настроек

Следующие настройки используются для применения ограничений на сложность запросов.

примечание

Ограничения на "максимальное количество чего-либо" могут принимать значение 0, что означает, что это "без ограничений".

НастройкаКраткое описание
max_memory_usageМаксимальное количество оперативной памяти, которое можно использовать для выполнения запроса на одном сервере.
max_memory_usage_for_userМаксимальное количество оперативной памяти, которое можно использовать для выполнения запросов пользователя на одном сервере.
max_rows_to_readМаксимальное количество строк, которое можно прочитать из таблицы при выполнении запроса.
max_bytes_to_readМаксимальное количество байт (некомпрессированных данных), которое можно прочитать из таблицы при выполнении запроса.
read_overflow_mode_leafУстанавливает, что происходит, когда объем прочитанных данных превышает один из предельных значений.
max_rows_to_read_leafМаксимальное количество строк, которое можно прочитать из локальной таблицы на узле листа при выполнении распределенного запроса.
max_bytes_to_read_leafМаксимальное количество байт (некомпрессированных данных), которое можно прочитать из локальной таблицы на узле листа при выполнении распределенного запроса.
read_overflow_mode_leafУстанавливает, что происходит, когда объем прочитанных данных превышает один из предельных значений.
max_rows_to_group_byМаксимальное количество уникальных ключей, полученных из агрегации.
group_by_overflow_modeУстанавливает, что происходит, когда количество уникальных ключей для агрегации превышает лимит.
max_bytes_before_external_group_byВключает или отключает выполнение операторов GROUP BY во внешней памяти.
max_bytes_ratio_before_external_group_byСоотношение доступной памяти, которое разрешено для GROUP BY. После достижения этого значения используется внешняя память для агрегации.
max_bytes_before_external_sortВключает или отключает выполнение операторов ORDER BY во внешней памяти.
max_bytes_ratio_before_external_sortСоотношение доступной памяти, которое разрешено для ORDER BY. После достижения этого значения используется внешняя сортировка.
max_rows_to_sortМаксимальное количество строк перед сортировкой. Позволяет ограничить потребление памяти при сортировке.
max_bytes_to_sortМаксимальное количество байт перед сортировкой.
sort_overflow_modeУстанавливает, что происходит, если количество строк, полученных перед сортировкой, превышает один из предельных значений.
max_result_rowsОграничивает количество строк в результате.
max_result_bytesОграничивает размер результата в байтах (некомпрессированных).
result_overflow_modeУстанавливает, что делать, если объем результата превышает одно из предельных значений.
max_execution_timeМаксимальное время выполнения запроса в секундах.
timeout_overflow_modeУстанавливает, что делать, если запрос выполняется дольше, чем max_execution_time, или предполагаемое время выполнения превышает max_estimated_execution_time.
max_execution_time_leafСемантически похоже на max_execution_time, но применяется только на узлах листа для распределенных или удаленных запросов.
timeout_overflow_mode_leafУстанавливает, что происходит, когда запрос на узле листа выполняется дольше, чем max_execution_time_leaf.
min_execution_speedМинимальная скорость выполнения в строках в секунду.
min_execution_speed_bytesМинимальное количество байт выполнения в секунду.
max_execution_speedМаксимальное количество строк выполнения в секунду.
max_execution_speed_bytesМаксимальное количество байт выполнения в секунду.
timeout_before_checking_execution_speedПроверяет, что скорость выполнения не слишком медленная (не менее min_execution_speed), после истечения указанного времени в секундах.
max_estimated_execution_timeМаксимальное оценочное время выполнения запроса в секундах.
max_columns_to_readМаксимальное количество колонок, которые можно прочитать из таблицы в одном запросе.
max_temporary_columnsМаксимальное количество временных колонок, которые должны храниться в оперативной памяти одновременно при выполнении запроса, включая постоянные колонки.
max_temporary_non_const_columnsМаксимальное количество временных колонок, которые должны храниться в оперативной памяти одновременно при выполнении запроса, но без учета постоянных колонок.
max_subquery_depthУстанавливает, что происходит, если запрос содержит больше указанного количества вложенных подзапросов.
max_ast_depthМаксимальная глубина вложения синтаксического дерева запроса.
max_ast_elementsМаксимальное количество элементов в синтаксическом дереве запроса.
max_rows_in_setМаксимальное количество строк для набора данных в IN-клаузе, созданном из подзапроса.
max_bytes_in_setМаксимальное количество байт (некомпрессированных данных), используемое набором в IN-клаузе, созданной из подзапроса.
set_overflow_modeУстанавливает, что происходит, когда количество данных превышает одно из предельных значений.
max_rows_in_distinctМаксимальное количество различных строк при использовании DISTINCT.
max_bytes_in_distinctМаксимальное количество байт состояния (в некомпрессированных байтах) в памяти, используемое хеш-таблицей при использовании DISTINCT.
distinct_overflow_modeУстанавливает, что происходит, когда количество данных превышает одно из предельных значений.
max_rows_to_transferМаксимальный размер (в строках), который можно передать на удаленный сервер или сохранить во временной таблице при выполнении секции GLOBAL IN/JOIN.
max_bytes_to_transferМаксимальное количество байт (некомпрессированных данных), которые можно передать на удаленный сервер или сохранить во временной таблице при выполнении секции GLOBAL IN/JOIN.
transfer_overflow_modeУстанавливает, что происходит, когда количество данных превышает одно из предельных значений.
max_rows_in_joinОграничивает количество строк в хеш-таблице, используемой при соединении таблиц.
max_bytes_in_joinМаксимальный размер в байтах хеш-таблицы, используемой при соединении таблиц.
join_overflow_modeОпределяет, какое действие выполняет ClickHouse, когда достигается одно из следующих ограничений соединения.
max_partitions_per_insert_blockОграничивает максимальное количество партиций в одном вставленном блоке, и выбрасывается исключение, если блок содержит слишком много партиций.
throw_on_max_partitions_per_insert_blockПозволяет контролировать поведение при достижении max_partitions_per_insert_block.
max_temporary_data_on_disk_size_for_userМаксимальное количество данных, потребляемых временными файлами на диске в байтах для всех одновременно выполняемых пользовательских запросов.
max_temporary_data_on_disk_size_for_queryМаксимальное количество данных, потребляемых временными файлами на диске в байтах для всех одновременно выполняемых запросов.
max_sessions_for_userМаксимальное количество одновременных сессий на одного аутентифицированного пользователя на сервере ClickHouse.
max_partitions_to_readОграничивает максимальное количество партиций, которые можно получить в одном запросе.

Устаревшие настройки

примечание

Следующие настройки устарели.

max_pipeline_depth

Максимальная глубина конвейера. Соответствует количеству преобразований, которые проходит каждый блок данных во время обработки запроса. Считается в пределах одного сервера. Если глубина конвейера больше, выбрасывается исключение.