Почему многопоточность в Python неэффективна для CPU-зависимых задач?

Question

Почему многопоточность в Python неэффективна для CPU-зависимых задач?

Тип вопроса: Python Вероятность: 10% Категория: Python Разработчик

Ответ

Многопоточность в Python неэффективна для CPU-зависимых задач из-за Global Interpreter Lock (GIL) — глобальной блокировки интерпретатора.

Причина неэффективности:

GIL позволяет выполняться только одному потоку Python за раз, даже на многоядерных процессорах. Это означает, что потоки не могут выполнять вычисления параллельно, что нивелирует преимущества многоядерных систем для задач, интенсивно использующих процессор.
GIL был введен для упрощения управления памятью и интеграции с C-библиотеками, но является основным ограничением для параллельных вычислений в Python.

Когда многопоточность эффективна:

Для I/O-зависимых задач (например, сетевые запросы, чтение/запись файлов). В таких случаях, пока один поток ожидает завершения операции ввода-вывода, GIL освобождается, позволяя другому потоку выполнять код Python. Это создает иллюзию параллелизма, но не является истинным параллелизмом вычислений.

Альтернативы для CPU-зависимых задач:

Модуль multiprocessing: Создает отдельные процессы, каждый со своим интерпретатором Python и собственным GIL. Это позволяет достичь истинного параллелизма на многоядерных системах, так как каждый процесс выполняется независимо.
Использование внешних библиотек: Библиотеки, написанные на C/C++ (например, NumPy, SciPy), могут освобождать GIL во время выполнения своих ресурсоемких операций, позволяя другим потокам Python работать параллельно.

Пример (демонстрация неэффективности многопоточности для CPU-зависимых задач):

import threading
import time
import os

def cpu_task():
    # Интенсивная CPU-операция
    sum(range(10**7))

print(f"Количество ядер CPU: {os.cpu_count()}")

# Последовательное выполнение (для сравнения)
start_sequential = time.time()
cpu_task()
print(f"Последовательно: {time.time() - start_sequential:.2f}s")

# Многопоточность (неэффективно для CPU-задач из-за GIL)
start_threading = time.time()
threads = [threading.Thread(target=cpu_task) for _ in range(4)] # Создаем 4 потока
for t in threads: t.start()
for t in threads: t.join()
print(f"Многопоточность: {time.time() - start_threading:.2f}s")
# Ожидаемый результат: время выполнения с потоками будет лишь немного меньше или даже больше,
# чем последовательное выполнение одной задачи, но не в N раз быстрее, где N - количество потоков.

В приведенном примере, несмотря на использование нескольких потоков, общее время выполнения CPU-зависимой задачи не сократится пропорционально количеству потоков, а может даже увеличиться из-за накладных расходов на переключение контекста между потоками, которые все равно конкурируют за один и тот же GIL.

Ответ 18+ 🔞

А, вот эта тема про многопоточность в Питоне! Ну, слушай, сейчас я тебе такую простыню правды выложу, что ты офигеешь, как от хорошего анекдота.

Так вот, представь себе: у тебя есть суперкомпьютер, ядер дохуя, а Питон подходит к ним и говорит: "Ребят, а можно только один из вас будет работать, а остальные постоят? А то у меня тут Global Interpreter Lock (GIL) — глобальная блокировка интерпретатора, понимаешь ли". И все, пиздец, параллелизму конец.

В чём же, блядь, собака зарыта?

GIL — это такой занудный охранник. Он разрешает в каждый момент времени работать только одному потоку Питона, даже если у тебя процессор на 128 ядер. Остальные сидят, куролесят, ждут своей очереди. Получается не параллель, а какая-то очередь в столовую, ебать. Весь смысл многоядерности накрывается медным тазом для чисто вычислительных задач.
Зачем его, этого урода, придумали? Да чтобы память не пиздели и чтобы с Си-библиотеками не было геморроя. Упростили жизнь себе, а нам теперь расхлёбывай.

Но не всё так хуёво! Есть же свет в окошке.

Многопоточность выручает, когда задача I/O-bound — то есть когда она не процессор жрёт, а ждёт чего-то: ответа от сервера, чтения с диска, скачивания файла. Пока один поток спит и ждёт, GIL говорит: "Окей, свободен!" и отдаёт управление другому потоку. Получается иллюзия параллелизма, и в этом случае — овердохуища пользы.

А что делать, если задача CPU-bound и надо реально всё загрузить?

Модуль multiprocessing — наш спаситель. Он создаёт отдельные, блядь, процессы. У каждого свой интерпретатор, свой GIL, своя песочница. Вот они уже могут на разных ядрах пахать как проклятые, не мешая друг другу. Настоящий параллелизм, ёпта!
Внешние библиотеки на C/C++ (типа NumPy). Они хитрожопые: внутри себя GIL отпускают, делают свои тёмные дела на всех ядрах, а потом GIL обратно возвращают. Красота!

Смотри, какой наглядный пиздец (пример):

import threading
import time
import os

def cpu_task():
    # Интенсивная CPU-операция
    sum(range(10**7))

print(f"Количество ядер CPU: {os.cpu_count()}")

# Последовательное выполнение (для сравнения)
start_sequential = time.time()
cpu_task()
print(f"Последовательно: {time.time() - start_sequential:.2f}s")

# Многопоточность (неэффективно для CPU-задач из-за GIL)
start_threading = time.time()
threads = [threading.Thread(target=cpu_task) for _ in range(4)] # Создаем 4 потока
for t in threads: t.start()
for t in threads: t.join()
print(f"Многопоточность: {time.time() - start_threading:.2f}s")
# Ожидаемый результат: время выполнения с потоками будет лишь немного меньше или даже больше,
# чем последовательное выполнение одной задачи, но не в N раз быстрее, где N - количество потоков.

Запустишь этот код — и обоссёшься со смеху. Вместо того чтобы в 4 раза быстрее отработать, потоки будут толкаться локтями у одного GIL, и время будет как у уставшего удава. Может, чутка быстрее, а может, и медленнее из-за лишних телодвижений по переключению между ними. Вот такая, блядь, печальная история.

Ответ

Ответ 18+ 🔞

Оформление подписки

Международная оплата

Вход на сайт

Введите код

Оформление подписки