Опишите интересную техническую задачу, которую вы решали, и ваше решение

Question

Опишите интересную техническую задачу, которую вы решали, и ваше решение

Тип вопроса: Софт-скиллы Вероятность: 10% Категория: Java Разработчик

Ответ

Задача: Оптимизировать поиск дубликатов в большом массиве целых чисел, сократив временную сложность с O(n²) до O(n).

Исходная проблема: Наивное решение с двумя вложенными циклами для массива из n элементов выполняет n*(n-1)/2 сравнений, что неприемлемо для больших данных.

Решение: Использовать HashSet для отслеживания уже встреченных элементов. HashSet обеспечивает константное время выполнения add() и contains() в среднем случае (O(1)).

Реализация алгоритма:

import java.util.*;

public List<Integer> findDuplicates(int[] nums) {
    // Set для хранения уникальных элементов, которые мы уже видели
    Set<Integer> seen = new HashSet<>();
    // List для результата — найденных дубликатов
    List<Integer> duplicates = new ArrayList<>();

    for (int num : nums) {
        // Метод add() возвращает false, если элемент УЖЕ присутствует в множестве
        if (!seen.add(num)) {
            duplicates.add(num);
        }
    }
    return duplicates;
}

Объяснение «почему»:

Сложность: Алгоритм проходит по массиву один раз (O(n)). Каждая операция с HashSet в среднем стоит O(1), что дает общую сложность O(n).
Компромисс: Мы жертвуем памятью (O(n) для HashSet) ради значительного выигрыша во времени.

Рассмотренные edge-кейсы:

Пустой или null массив — возвращается пустой список.
Отрицательные числа и ноль — HashSet корректно с ними работает.
Очень большие массивы — важно оценить потребление памяти HashSet-ом.

Альтернатива для экономии памяти: Если диапазон чисел ограничен и невелик (например, от 1 до 100), можно использовать boolean-массив, что даст сложность O(n) по времени и O(1) по дополнительной памяти (относительно диапазона).

Ответ 18+ 🔞

Ну и что тут у нас, блядь? Опять эти дубликаты в массиве, как назойливые мухи, сука. Всех их найти надо, а делать это в лоб — это ж овердохуища операций, ёпта. Два цикла вложенных — это как Герасим, который немой, но здоровый, так и тут: сила есть, а ума не надо, просто тупо сравнивай всё со всем, пока не охуеешь от времени выполнения.

Так, слушай сюда, а не пойти ли нам другим путём, блядь? Вместо того чтобы каждый раз, как дурак, бегать по всему массиву и искать, не встречался ли этот пидорас-число раньше, давай заведём себе, блядь, шпаргалку. Типа записной книжки, куда мы будем заносить всех, кого уже видели. И как только очередной кандидат припёрся, а мы глянем в книжку — о, сука, а этот ужо тут был! — значит, он наш, дубликат, блядь, лови его!

И для этой благородной цели у нас в Java есть, ёбана, HashSet. Штука, которая хранит хуй пойми что, но главное — быстро, блядь. Добавить элемент — в среднем O(1), проверить, есть ли он — тоже O(1). Не константа в строгом смысле, но близко к тому, ебать мои старые костыли.

Вот смотри, как это выглядит в коде, сука:

import java.util.*;

public List<Integer> findDuplicates(int[] nums) {
    // Это наша книжка учета. Кто тут уже был — тот уже в ней.
    Set<Integer> seen = new HashSet<>();
    // А это мешок, куда мы складываем пойманных повторюг.
    List<Integer> duplicates = new ArrayList<>();

    for (int num : nums) {
        // Метод add — хитрая жопа. Он возвращает false, если этот уродец УЖЕ сидел в сете.
        // То есть если не добавился — значит, попался, падла!
        if (!seen.add(num)) {
            duplicates.add(num);
        }
    }
    return duplicates;
}

И что мы имеем в сухом остатке, блядь? Мы прошлись по массиву всего один раз, O(n). На каждой итерации сделали одну быструю операцию с хеш-сетом. И всё, пиздец, задача решена. Вместо квадратичной сложности, от которой волосы дыбом встают, получили почти линейную. Правда, за память заплатили — сету нужно O(n) места в худшем случае, но, как говорится, либо грудь в крестах, либо хуй в пальто. Выбирай.

Ах да, ещё нюансы, блядь, куда без них. Если массив пустой или null — вернём пустой список, не паримся. Отрицательные числа? Да похуй, HashSet и с ними справится. А если чисел дохуища и память жалко? Ну, если диапазон их известный и небольшой, типа от 1 до 100, можно boolean-массив завести, размером с этот диапазон. Это будет O(1) по доп. памяти (относительно диапазона, конечно) и всё так же O(n) по времени. Но это уже для особых извращенцев, блядь.

Короче, суть в чём: не надо изобретать велосипед, когда есть готовые инструменты, которые не дадут тебе, как последнему мудаку, написать алгоритм, который будет работать до второго пришествия. Используй хеш-таблицы, и будет тебе счастье. В рот меня чих-пых, вот и вся наука.

Ответ

Ответ 18+ 🔞

Оформление подписки

Международная оплата

Вход на сайт

Введите код

Оформление подписки