Используем средства визуализации встроенные в библиотеку Pandas. Кроме того, сегодня нам понадобится использование библиотеки NumPy для генерирования случайных чисел (np.random). Для начала попробуем построить простейший столбчатый график:

Снимок экрана 2019-02-04 в 15.57.44

В случае наложения столбиков друг на друга:

Снимок экрана 2019-02-04 в 15.57.49

В случае, когда необходимо расположить графики горизонтально:

Снимок экрана 2019-02-04 в 15.57.54

Для построения гистограммы  данных используем функцию (hist):

Снимок экрана 2019-02-04 в 15.57.59

Для раздельного рисования:

Снимок экрана 2019-02-04 в 15.58.15

Для построения усиковой диаграммы:

Снимок экрана 2019-02-04 в 15.58.20

Линии с областями:

Снимок экрана 2019-02-04 в 15.58.23

Точечный график:

Снимок экрана 2019-02-04 в 15.58.27

Круговая диаграмма:

Снимок экрана 2019-02-04 в 15.58.36

 

Визулизация методами matplotlib

Загрузим библиотеку matplotlib и обращаясь к ней отобразим простейшие данные и подписи осей:

Снимок экрана 2019-02-04 в 15.58.41

Для того, что отобразить значения 2 измерений зададим данные по оси X и по оси Y:

Снимок экрана 2019-02-04 в 15.58.46

Для шкалирования графики используется функция нормировки осей:Снимок экрана 2019-02-04 в 15.58.50

Стиль отображения данных формируется путем совместного указания цвета и типа точек: например красный звездочки будут задаваться следующей записью «r*»

Приводим таблицу возможных вариантов цветов:

Снимок экрана 2019-02-04 в 15.48.19

Возможных вариантов стилей:

Снимок экрана 2019-02-04 в 13.40.56

Испробуем на практике:

Снимок экрана 2019-02-04 в 16.09.05

Для добавления сетки на графике достаточно использовать команду grid:

Снимок экрана 2019-02-04 в 16.11.59

Если же мы хотим, чтобы точки соединялись линиями необходимо указать это путем добавления обозначения линий:

Снимок экрана 2019-02-04 в 16.15.09

Рассмотрим как обозначать название рядов:
Снимок экрана 2019-02-04 в 16.24.01

Можно изменять толщину линий:

Снимок экрана 2019-02-04 в 16.23.17

Попробуем совместить полученные знания
Снимок экрана 2019-02-04 в 16.20.28

Создание одновременно нескольких графиков: для этого указывается команда plt.figure(1), которая указывает, что график будет составной. После этого указываются подграфики, которые нумеруются в соответствии с тем, как они будут расположены и сколько графиков будет отображаться (количество графиков по вертикали — количество графиков по горизонтали — порядковый номер графика). Так обозначение 312 означает, что по вертикали будет находиться 3 графика, по горизонтали 1 график и порядковый номер графика, который рисуется является 2.

Снимок экрана 2019-02-04 в 17.15.40

Теперь попробуем «перевернуть» графики:

Снимок экрана 2019-02-04 в 17.15.36

Лог-шкала

Снимок экрана 2019-02-04 в 16.50.16

Другие варианты графики с помощью Matplotlib смотрите в официальной документации:
https://matplotlib.org/tutorials/introductory/sample_plots.html

Задание:
Использую предыдущий источник данных по Титаник:
1. Постройте самостоятельно гистограмму распределения стоимости билета среди выживших и умерших на одном графике
2. Постройте усиковую диаграмму стоимости билета в зависимости от класса
3. Тепловую карту — хитмап возраст, класс, стоимость билетов

 

Python. Основы визуализации

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *