Приведи пример, когда следует использовать unordered_set в C++.

Question

Приведи пример, когда следует использовать unordered_set в C++.

Тип вопроса: STL Вероятность: 25% Категория: C/C++ Разработчик

Ответ

std::unordered_set — это хеш-таблица, которая обеспечивает амортизированное O(1) для вставки, удаления и поиска. Его следует использовать, когда порядок элементов не важен, но критична скорость проверки принадлежности (membership test).

Типичный пример: кэш уникальных элементов в процессе обработки данных

#include <unordered_set>
#include <vector>
#include <string>
#include <iostream>

// Задача: отфильтровать дубликаты ID из входного потока
std::vector<int> filter_duplicates(const std::vector<int>& input_ids) {
    std::unordered_set<int> seen_ids; // Храним уже обработанные ID
    std::vector<int> unique_ids;
    unique_ids.reserve(input_ids.size());

    for (int id : input_ids) {
        // Проверка и вставка за O(1) в среднем
        if (seen_ids.insert(id).second) { // .second == true, если вставка прошла (элемента не было)
            unique_ids.push_back(id);
        }
        // Альтернативная проверка: if (seen_ids.find(id) == seen_ids.end()) { ... }
    }
    return unique_ids;
}

int main() {
    std::vector<int> raw_data = {101, 205, 101, 308, 205, 422};
    auto filtered = filter_duplicates(raw_data);
    // filtered содержит {101, 205, 308, 422} (порядок может быть любым)

    for (int id : filtered) {
        std::cout << id << ' ';
    }
    return 0;
}

Ключевые сценарии использования unordered_set:

Удаление дубликатов из коллекции.
Быстрая проверка наличия элемента (например, валидация токена из чёрного списка).
Реализация отношений "многие ко многим" (например, хранение множества друзей пользователя).
Кэширование результатов вычислений, где ключом является входной параметр.

Сравнение с `std::set`:	Критерий	`std::unordered_set`
Средняя сложность операций	O(1)	O(log n)
Порядок элементов	Не гарантирован	Отсортирован по возрастанию
Требования к элементам	Должен быть определён `std::hash<Key>` и `operator==`	Должен быть определён `operator<` или кастомный компаратор
Производительность	Выше при хорошей хеш-функции	Предсказуема, но ниже

Важно: Для пользовательских типов необходимо специализировать std::hash и определить operator==.

Ответ 18+ 🔞

Слушай, вот объясняю про std::unordered_set, чтобы ты понял наконец, в чём его соль. Представь себе бардак в твоей комнате, но такой бардак, где ты с закрытыми глазами за секунду находишь нужный носок. Это оно и есть — хеш-таблица, где всё валяется как попало, но находится моментально.

Идеальный случай: когда тебе похуй на порядок, но нужно знать, БЫЛО или НЕ БЫЛО.

Вот смотри, реальная задача: у тебя поток данных, а ты должен отсеять повторы, как назойливых мух. Использовать для этого std::set — это всё равно что приглашать уборщицу, чтобы она разложила носки по цвету, прежде чем ты поймёшь, есть ли у тебя синий. Зачем? Тебе же просто знать — есть синий носок или нет.

#include <unordered_set>
#include <vector>
#include <iostream>

// Задача: выкинуть нахуй все повторяющиеся ID
std::vector<int> отсеять_повторы(const std::vector<int>& сырые_айдишники) {
    std::unordered_set<int> уже_виденные; // Наш волшебный бардак-помощник
    std::vector<int> уникальные;
    уникальные.reserve(сырые_айдишники.size());

    for (int id : сырые_айдишники) {
        // Всё гениальное просто: пытаемся засунуть в бардак.
        // Если засунули (.second == true), значит, раньше его не было — добавляем в результат.
        if (уже_виденные.insert(id).second) {
            уникальные.push_back(id);
        }
        // Если не засунули — значит, этот носок уже валялся в куче. Иди нахуй, дубликат.
    }
    return уникальные;
}

int main() {
    std::vector<int> данные = {101, 205, 101, 308, 205, 422};
    auto результат = отсеять_повторы(данные);
    // В результате будет {101, 205, 308, 422}, но порядок, блядь, может быть ЛЮБОЙ.

    for (int id : результат) {
        std::cout << id << ' ';
    }
    return 0;
}

Так когда же его использовать, этот unordered_set? Да элементарно:

Убрать дубликаты из списка. Овердохуища быстрее, чем через set.
Молниеносно проверить, есть ли элемент в чёрном списке. Токен, IP-адрес, имя твоего бывшего — что угодно.
Хранить кучу уникальных связей. Например, всех друзей пользователя в соцсети. Порядок вывода друзей — это уже проблема фронтенда, а не твоя.
Кэшировать результаты тяжёлых вычислений. Вычислил значение для ключа "Х" — закинул пару (ключ, результат) в unordered_map (близкий родственник сета). При следующем запросе просто достаёшь из бардака, а не считаешь заново.

А теперь главное: в чём разница с std::set? Чувак, это как выбрать между спортивной тачкой и танком.

Критерий	`std::unordered_set` (Спорткар)	`std::set` (Танк)
Скорость (в среднем)	O(1), быстрее просто некуда.	O(log n), стабильно, но не ахти.
Порядок элементов	Абсолютно никакого. Как бомжи в подъезде.	Чётко отсортирован по возрастанию. Армейский порядок.
Что нужно от элементов	Должны уметь хешироваться (`std::hash<Key>`) и сравниваться на равенство (`operator==`).	Должны уметь сравниваться (`operator<` или свой компаратор).
Надёжность	Может скатиться в O(n) при ужасной хеш-функции или коллизиях.	Всегда стабильный O(log n). Никаких сюрпризов.

Важный момент на посошок: Если ты захотел запихнуть в unordered_set свой собственный класс (типа User или Transaction), то тебе придётся, блядь, повозиться. Нужно будет написать для него хеш-функцию (специализировать std::hash) и определить оператор проверки на равенство (operator==). Без этого компилятор тебе устроит терпения ноль ебать и просто не скомпилирует код.

Видео-ответы

▶

Mock - собеседование программиста: секция С++ Junior / Middle | Август 2021

Ответ

Ответ 18+ 🔞

Видео-ответы

Оформление подписки

Международная оплата

Вход на сайт

Введите код

Оформление подписки