Как можно оптимизировать SQL-запрос?

«Как можно оптимизировать SQL-запрос?» — вопрос из категории SQL и базы данных, который задают на 46% собеседований Data Инженер. Ниже — развёрнутый ответ с разбором ключевых моментов.

Тип вопроса: SQL и базы данных Вероятность: 46% Категория: Data Инженер

Ответ

Оптимизация SQL-запросов — это итеративный процесс анализа и улучшения. Вот мой подход, основанный на практическом опыте:

Анализ плана выполнения (EXPLAIN). Это первый и обязательный шаг. Нужно смотреть на стоимость операций, тип сканирования (Seq Scan vs Index Scan), наличие и эффективность JOIN.
```
EXPLAIN (ANALYZE, BUFFERS) SELECT * FROM orders WHERE user_id = 123;
```
Использование индексов. Создание правильных индексов — самый эффективный способ. Важно индексировать поля в условиях WHERE, JOIN и ORDER BY. Для составных условий используем составные индексы.
```
-- Индекс для фильтрации и сортировки
CREATE INDEX idx_orders_user_status ON orders(user_id, status);
```
Сокращение объёма данных на ранних этапах.
- Выбирайте только нужные столбцы (SELECT column1, column2 вместо SELECT *).
- Применяйте фильтры (WHERE) как можно раньше, особенно перед операциями JOIN и GROUP BY.
- Используйте LIMIT для тестирования и в пагинации.
Оптимизация JOIN.
- JOIN самой маленькой таблицы или подзапроса. Часто помогает материализация подзапроса с агрегацией в CTE перед JOIN.
- Убедитесь, что поля для JOIN проиндексированы.
Работа с оконными функциями и агрегацией. Избегайте излишне вложенных оконных функций. Иногда сложную логику можно разбить на несколько CTE для лучшей читаемости и производительности.
Переписывание запроса. Иногда изменение логики (замена подзапроса на JOIN, использование EXISTS вместо IN для больших наборов) даёт радикальное ускорение.