В чем разница между Dataclass и Namedtuple в Python?

Ответ

И dataclasses, и namedtuple предназначены для создания простых классов-хранилищ данных, но они имеют ключевые различия в изменяемости, гибкости и производительности.

collections.namedtuple

Неизменяемый (immutable): После создания экземпляра его атрибуты нельзя изменить. Это делает его похожим на кортеж.
Легковесный: Потребляет мало памяти, так как реализован на основе кортежей.
Ограниченная функциональность: Сложно добавлять методы или логику.

dataclasses.dataclass

Изменяемый (mutable) по умолчанию: Атрибуты можно свободно изменять после создания. Можно сделать неизменяемым с помощью декоратора @dataclass(frozen=True).
Гибкий: Легко добавлять методы, значения по умолчанию, логику после инициализации (__post_init__).
Поддержка типов: Нативно использует аннотации типов, что улучшает читаемость и помогает статическим анализаторам.

Сравнительная таблица:

Характеристика	`namedtuple`	`dataclass`
Изменяемость	Неизменяемый	Изменяемый (по умолч.)
Память	Низкое потребление	Выше, чем у `namedtuple`
Гибкость	Низкая	Высокая
Типизация	Ограниченная	Встроенная

Пример:

from collections import namedtuple
from dataclasses import dataclass

# 1. namedtuple - неизменяемый
PointNT = namedtuple('PointNT', ['x', 'y'])
p_nt = PointNT(10, 20)
# p_nt.x = 30  # Вызовет AttributeError: can't set attribute
print(f"NamedTuple: {p_nt}")

# 2. dataclass - изменяемый по умолчанию
@dataclass
class PointDC:
    x: int
    y: int

p_dc = PointDC(10, 20)
p_dc.x = 30  # Работает без ошибок
print(f"DataClass: {p_dc}") # Выведет: PointDC(x=30, y=20)

Когда что выбрать:

namedtuple: Когда нужны простые, неизменяемые структуры данных с минимальным потреблением памяти (например, для возврата нескольких значений из функции).
dataclass: Когда нужна гибкость: изменяемые поля, значения по умолчанию, проверка типов и возможность легко добавлять собственную логику.