Рассмотрим методы визуализации, которые используются в R по умолчанию:

Снимок экрана 2018-10-17 в 17.55.01

Особой популярностью в среде пользователей R  пользуется пакет ggplot2. Рассмотрим подробнее: подключим пакет, посмотрим какие переменные есть в данных mtcars и создадим объем в котором будет храниться основная информация для построения графиков. geom_point() добавляет слой графики для визуализации в виде точек.

Снимок экрана 2018-10-17 в 17.57.01

Можно задать цвет для всех точек, а можно использовать цвет в качестве переменной. Параметр color и colour идентичны.

Снимок экрана 2018-10-17 в 17.57.07

С использованием параметра size можно задать размер точек или использовать размер для визуализации еще одной переменной.

Снимок экрана 2018-10-17 в 17.57.11

Прозрачность является еще одним параметром, которые можно использовать для визуализации еще одного дополнительного измерения.

Снимок экрана 2018-10-17 в 17.57.15

Тип точек можно использовать в качестве еще одной переменной. Правда таким видом визуализации можно отобразить качественные переменные.

Снимок экрана 2018-10-17 в 17.57.19

Разделение на разные графики по типу переменной хорошо ложится в логику бинарных переменных.

Снимок экрана 2018-10-17 в 17.57.23

Визуализируем сразу несколько измерений:

Снимок экрана 2018-10-17 в 17.57.30

Добавим подписи на каждый график

Снимок экрана 2018-10-17 в 17.57.38

Добавим подписи на оси и заголовок:

Снимок экрана 2018-10-17 в 17.57.45

Подпишем и отнормируем дополнительные измерения

Снимок экрана 2018-10-17 в 17.57.55

Самостоятельное задание: используя  данные diamonds визуализируйте все возможные измерения.

 

Занятие 4. Продвинутая графика с ggplot2

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *