Какие знаешь методы визуализации данных

«Какие знаешь методы визуализации данных» — вопрос из категории Визуализация и дашборды, который задают на 33% собеседований Аналитик Данных. Ниже — развёрнутый ответ с разбором ключевых моментов.

Ответ

Вот основные методы визуализации данных с примерами использования в Python (библиотека matplotlib/seaborn):

  1. Гистограмма – для распределения числовых данных:
import seaborn as sns
sns.histplot(data=df, x='age', bins=20)
  1. Boxplot – для отображения медиан, квантилей и выбросов:
sns.boxplot(data=df, x='category', y='price')
  1. Scatter plot – зависимость между двумя числовыми переменными:
plt.scatter(df['income'], df['spending'])
  1. Bar chart – сравнение категориальных данных:
df['category'].value_counts().plot(kind='bar')
  1. Line chart – тренды во времени:
df.groupby('year')['sales'].sum().plot()
  1. Heatmap – матричные данные (корреляции, частотности):
sns.heatmap(df.corr(), annot=True)
  1. Pie chart – доли категорий (используется редко из-за проблем с восприятием)

Дополнительно: violin plots, pair plots, treemaps, географические карты (geopandas), интерактивные визуализации (plotly).

Ключевой принцип: выбирать график, который наилучшим образом передает конкретный insight.