Используем средства визуализации встроенные в библиотеку Pandas. Кроме того, сегодня нам понадобится использование библиотеки NumPy для генерирования случайных чисел (np.random). Для начала попробуем построить простейший столбчатый график:
В случае наложения столбиков друг на друга:
В случае, когда необходимо расположить графики горизонтально:
Для построения гистограммы данных используем функцию (hist):
Для раздельного рисования:
Для построения усиковой диаграммы:
Линии с областями:
Точечный график:
Круговая диаграмма:
Визулизация методами matplotlib
Загрузим библиотеку matplotlib и обращаясь к ней отобразим простейшие данные и подписи осей:
Для того, что отобразить значения 2 измерений зададим данные по оси X и по оси Y:
Для шкалирования графики используется функция нормировки осей:
Стиль отображения данных формируется путем совместного указания цвета и типа точек: например красный звездочки будут задаваться следующей записью «r*»
Приводим таблицу возможных вариантов цветов:
Возможных вариантов стилей:
Испробуем на практике:
Для добавления сетки на графике достаточно использовать команду grid:
Если же мы хотим, чтобы точки соединялись линиями необходимо указать это путем добавления обозначения линий:
Рассмотрим как обозначать название рядов:
Можно изменять толщину линий:
Попробуем совместить полученные знания
Создание одновременно нескольких графиков: для этого указывается команда plt.figure(1), которая указывает, что график будет составной. После этого указываются подграфики, которые нумеруются в соответствии с тем, как они будут расположены и сколько графиков будет отображаться (количество графиков по вертикали — количество графиков по горизонтали — порядковый номер графика). Так обозначение 312 означает, что по вертикали будет находиться 3 графика, по горизонтали 1 график и порядковый номер графика, который рисуется является 2.
Теперь попробуем «перевернуть» графики:
Лог-шкала
Другие варианты графики с помощью Matplotlib смотрите в официальной документации:
https://matplotlib.org/tutorials/introductory/sample_plots.html
Задание:
Использую предыдущий источник данных по Титаник:
1. Постройте самостоятельно гистограмму распределения стоимости билета среди выживших и умерших на одном графике
2. Постройте усиковую диаграмму стоимости билета в зависимости от класса
3. Тепловую карту — хитмап возраст, класс, стоимость билетов
S