Как совмещать потоки и асинхронность в Python?

Question

Как совмещать потоки и асинхронность в Python?

Тип вопроса: Асинхронность Вероятность: 10% Категория: Python Разработчик

Ответ

Да, совмещать потоки (threading) и асинхронность (asyncio) в Python возможно, но требует понимания их различий и осторожности. Они решают разные задачи конкурентности:

asyncio: Однопоточная конкурентность, идеальна для I/O-bound задач (сетевые запросы, чтение/запись файлов), где ожидание внешних операций не блокирует выполнение других задач.
threading: Многопоточная конкурентность, полезна для CPU-bound задач (интенсивные вычисления), хотя в CPython GIL (Global Interpreter Lock) ограничивает истинный параллелизм для таких задач, позволяя выполнять только один поток Python-кода одновременно.

Основные сценарии совмещения:

Запуск блокирующего кода в асинхронном приложении: Если в asyncio приложении необходимо выполнить блокирующую (синхронную) операцию, которая может "заморозить" весь цикл событий, её следует вынести в отдельный поток. Для этого используется loop.run_in_executor() с ThreadPoolExecutor.

Пример:

import asyncio
import time
from concurrent.futures import ThreadPoolExecutor

def blocking_io_task(duration):
    """Имитация блокирующей I/O операции."""
    print(f"[Thread {time.time():.2f}] Начинаю блокирующую задачу на {duration} сек...")
    time.sleep(duration) # Блокирующая операция
    print(f"[Thread {time.time():.2f}] Блокирующая задача завершена.")
    return f"Результат блокирующей задачи ({duration}s)"

async def non_blocking_async_task(name):
    """Неблокирующая асинхронная задача."""
    for i in range(3):
        print(f"[Async {time.time():.2f}] {name} работает... ({i+1}/3)")
        await asyncio.sleep(0.5)
    print(f"[Async {time.time():.2f}] {name} завершена.")

async def main():
    loop = asyncio.get_running_loop()
    executor = ThreadPoolExecutor(max_workers=2)

    # Запускаем неблокирующие асинхронные задачи
    task1 = asyncio.create_task(non_blocking_async_task("Task A"))
    task2 = asyncio.create_task(non_blocking_async_task("Task B"))

    # Запускаем блокирующие задачи в отдельных потоках через ThreadPoolExecutor
    # Это предотвращает блокировку основного цикла событий asyncio
    blocking_result1 = await loop.run_in_executor(executor, blocking_io_task, 2)
    blocking_result2 = await loop.run_in_executor(executor, blocking_io_task, 1)

    print(f"[Main {time.time():.2f}] Получен результат блокирующей задачи 1: {blocking_result1}")
    print(f"[Main {time.time():.2f}] Получен результат блокирующей задачи 2: {blocking_result2}")

    await asyncio.gather(task1, task2) # Ожидаем завершения асинхронных задач

if __name__ == "__main__":
    asyncio.run(main())

Запуск цикла событий asyncio в отдельном потоке: Менее распространенный сценарий, когда необходимо запустить asyncio цикл в фоновом потоке и взаимодействовать с ним из основного потока. Используются функции типа asyncio.run_coroutine_threadsafe() или loop.call_soon_threadsafe() для безопасной отправки корутин или колбэков в цикл событий из другого потока.

Важные соображения:

GIL (Global Interpreter Lock): В CPython GIL не позволяет нескольким потокам выполнять Python-байткод одновременно. Это означает, что threading не дает истинного параллелизма для CPU-bound задач. Для таких задач лучше использовать multiprocessing.
Синхронизация: При совмещении потоков и асинхронности необходимо тщательно управлять общими ресурсами и использовать соответствующие механизмы синхронизации (мьютексы, очереди, семафоры) для предотвращения состояний гонки и ошибок.
Выбор инструмента: Всегда старайтесь использовать наиболее подходящий инструмент для конкретной задачи. Для I/O-bound задач предпочтительнее чистый asyncio. Для CPU-bound задач — multiprocessing.

Ответ 18+ 🔞

О, слушай, тут такой вопрос подъехал — можно ли в Python скрестить ежа с ужом, то есть threading с asyncio? Да, блядь, можно, но это как пытаться одновременно жарить шашлык и читать стихи — нужно понимать, что где и зачем, а то получится пиздец.

Вот смотри, у них задачи вообще разные, как у молотка и скальпеля:

asyncio — это для I/O-bound задач, где ты просто ждёшь, пока сеть или файлы отзовутся. Всё работает в одном потоке, но не блокируется, пока ждёт. Красота, ёпта!
threading — это для CPU-bound задач, где нужно считать, считать и ещё раз считать. Хотя в CPython есть эта хуйня под названием GIL (Global Interpreter Lock), который не даёт потокам работать по-настоящему параллельно. Так что для тяжёлых вычислений лучше multiprocessing использовать, а то будет как в анекдоте: "Много шума из ничего".

А теперь главное — зачем это совмещать?

Когда в твоём асинхронном приложении нужно выполнить блокирующую операцию. Представь: у тебя всё летает на asyncio, и тут тебе нужно прочитать файл или сделать запрос к старой библиотеке, которая работает синхронно. Если запустить это прямо в основном потоке, весь твой красивый асинхронный мир встанет колом, блядь! Чтобы этого не случилось, выносим эту блокирующую хуйню в отдельный поток через ThreadPoolExecutor.

Вот, смотри пример, как это делается:

import asyncio
import time
from concurrent.futures import ThreadPoolExecutor

def blocking_io_task(duration):
    """Имитация блокирующей I/O операции."""
    print(f"[Thread {time.time():.2f}] Начинаю блокирующую задачу на {duration} сек...")
    time.sleep(duration) # Блокирующая операция
    print(f"[Thread {time.time():.2f}] Блокирующая задача завершена.")
    return f"Результат блокирующей задачи ({duration}s)"

async def non_blocking_async_task(name):
    """Неблокирующая асинхронная задача."""
    for i in range(3):
        print(f"[Async {time.time():.2f}] {name} работает... ({i+1}/3)")
        await asyncio.sleep(0.5)
    print(f"[Async {time.time():.2f}] {name} завершена.")

async def main():
    loop = asyncio.get_running_loop()
    executor = ThreadPoolExecutor(max_workers=2)

    # Запускаем неблокирующие асинхронные задачи
    task1 = asyncio.create_task(non_blocking_async_task("Task A"))
    task2 = asyncio.create_task(non_blocking_async_task("Task B"))

    # Запускаем блокирующие задачи в отдельных потоках через ThreadPoolExecutor
    # Это предотвращает блокировку основного цикла событий asyncio
    blocking_result1 = await loop.run_in_executor(executor, blocking_io_task, 2)
    blocking_result2 = await loop.run_in_executor(executor, blocking_io_task, 1)

    print(f"[Main {time.time():.2f}] Получен результат блокирующей задачи 1: {blocking_result1}")
    print(f"[Main {time.time():.2f}] Получен результат блокирующей задачи 2: {blocking_result2}")

    await asyncio.gather(task1, task2) # Ожидаем завершения асинхронных задач

if __name__ == "__main__":
    asyncio.run(main())

Видишь? Пока блокирующие задачи спят в своих потоках, асинхронные задачи продолжают работать. Ничего никого не ждёт, всё летает. Красота, в рот меня чих-пых!

Запуск цикла asyncio в отдельном потоке. Это уже более извращённый сценарий, когда тебе нужно, чтобы асинхронный цикл крутился где-то на фоне, а ты из основного потока ему команды кидал. Для этого есть специальные функции вроде asyncio.run_coroutine_threadsafe(). Но это уже для особых ценителей, честно говоря.

На что обратить внимание, чтобы не обосраться:

GIL, ёпта! Помни про него. Он не даст твоим потокам считать по-настоящему параллельно. Для вычислений — multiprocessing, точка.
Синхронизация. Как только начинаешь тасовать потоки и асинхронность, сразу возникает риск состояния гонки. Общие ресурсы нужно защищать мьютексами, семафорами или очередями. Иначе будет "кто в лес, кто по дрова", и приложение упадёт с невнятной ошибкой в три часа ночи.
Выбирай инструмент с умом. Не нужно везде пихать и то, и другое. Если задача чисто I/O — бери asyncio. Если нужно много считать — multiprocessing. А совмещение — это как раз для тех самых гибридных случаев, когда без этого реально никак.

В общем, совмещать можно, но осторожно, с пониманием дела. А то получится не "лучшее из двух миров", а "пиздец на постном масле". Удачи!

Ответ

Ответ 18+ 🔞

Оформление подписки

Международная оплата

Вход на сайт

Введите код

Оформление подписки