Агрегирование в контексте SQL означает объединение нескольких значений в одно, используя определенную агрегатную функцию. В SQL агрегатные функции используются для выполнения операций, таких как подсчет, суммирование, вычисление среднего значения и многое другое над группами данных.
Групповые функции выполняются над множеством строк с одинаковыми значениями в определенных столбцах. Например, предположим у нас есть таблица с информацией о продажах по разным юридическим лицам, где каждая строка представляет отдельную продажу. Мы можем использовать групповые функции, такие как SUM() или AVG(), для агрегирования данных по конкретным юридическим лицам, группировать их и вычислять общую сумму продаж или среднюю стоимость каждого юридического лица.
Оконные функции, с другой стороны, выполняются над набором строк, определенным окном. Окно определяет, какие строки включаются в оконные функции. Например, мы можем использовать оконную функцию ROW_NUMBER() для присвоения номера каждой строке в таблице, независимо от группировки или сортировки данных.
Оконные функции используются, когда мы хотим выполнить вычисления, связанные с некоторыми наборами строк, в которых каждая строка может быть обработана независимо от других строк в таблице. Например, мы можем использовать оконные функции для вычисления скользящего среднего значения продаж за последние 3 месяца для каждого юридического лица в таблице.
Оконная функция имеет следующий синтаксис:
<функция> OVER ([PARTITION BY <столбец_группировки>] [ORDER BY <столбец_сортировки> [ASC|DESC]])
Где:
- <функция> - это агрегатная функция или аналитическая функция, которую мы хотим применить к каждому окну строк
- PARTITION BY - определяет столбец или столбцы для группировки данных. Окна будут созданы для каждой комбинации значений в указанных столбцах.
- ORDER BY - определение порядка сортировки строк внутри каждого окна. Можно указать несколько столбцов и задать порядок сортировки (ASC или DESC).
Например, допустим у нас есть таблица "sales" с колонками "legal_entity", "date" и "amount". Мы хотим рассчитать сумму продаж каждого юридического лица по месяцам и также вычислить процентное соотношение продаж каждого юридического лица к общей сумме продаж за месяц.
Мы можем использовать следующий запрос:
SELECT legal_entity, date, amount, SUM(amount) OVER (PARTITION BY legal_entity, DATE_TRUNC('month', date)) AS total_sales_month, amount / SUM(amount) OVER (PARTITION BY DATE_TRUNC('month', date)) * 100 AS sales_percent_month FROM sales
В этом запросе мы группируем продажи по юридическим лицам и месяцам, используя функцию PARTITION BY. Затем мы используем агрегатную функцию SUM() с оконным оператором OVER для вычисления общей суммы продаж каждого юридического лица по месяцам. Мы также используем арифметическую операцию, чтобы вычислить процентное соотношение каждой продажи к общей сумме продаж за месяц, используя оконный оператор OVER.
Это пример того, как агрегирование в контексте группы и оконной функции работает в SQL. Оконные функции позволяют выполнять вычисления над наборами строк, в то время как групповые функции позволяют агрегировать данные по определенным столбцам или группам. Оба этих типа функций предоставляют мощные возможности для обработки и анализа данных в SQL.