Группировка данных в PostgreSQL выполняется с помощью ключевого слова GROUP BY. Она позволяет объединить строки в группы на основе значения одного или нескольких столбцов и выполнить агрегатные функции для каждой группы.
Синтаксис GROUP BY выглядит следующим образом:
SELECT столбцы
FROM таблица
GROUP BY столбцы
HAVING условие
Столбцы, указанные в предложении SELECT, могут быть агрегатными функциями (например, COUNT, SUM, AVG, MAX, MIN) или нагруппированными столбцами. Предложение GROUP BY указывает, по каким столбцам должна быть выполнена группировка.
Например, у нас есть таблица "orders" с следующими столбцами: order_id, customer_id, product_id и quantity. Мы хотим получить общее количество продуктов для каждого клиента. Вот как будет выглядеть запрос с использованием GROUP BY:
SELECT customer_id, SUM(quantity) as total_quantity
FROM orders
GROUP BY customer_id
В результате выполнения этого запроса мы получим два столбца: customer_id и total_quantity. Первый столбец содержит идентификаторы клиентов, а второй - суммарное количество продуктов для каждого клиента.
Также можно использовать предложение HAVING для фильтрации результатов, основываясь на условиях, которые применяются к группам. Например, если мы хотим получить только те группы, в которых общее количество продуктов больше 100, мы можем добавить следующее:
SELECT customer_id, SUM(quantity) as total_quantity
FROM orders
GROUP BY customer_id
HAVING SUM(quantity) > 100
В этом запросе HAVING SUM(quantity) > 100 означает, что мы выбираем только те группы, в которых общее количество продуктов больше 100.
Группировка данных позволяет получать более детализированную информацию о данных, агрегировать их и делать выводы на основе этих агрегированных значений. Она является важным инструментом при анализе данных в PostgreSQL и других базах данных.