Занятие 9. HPC in R

Иногда скорость вычислений играет значительную роль при анализе данных. В данном занятии собраны различные примеры того, с использованием каких функций и методов возможно ускорять вычисления в десятки раз. Для начала начнем с чтения данных стандартной командой read.table: Существует значительное количество

Занятие 8. Веб-приложения с R

R дает возможности не только статистического анализа данных, но и создания интерактивных веб-приложений. Для этого используется пакет shiny Для того, чтобы создать веб-приложение необходимо будет создать папку для этого приложения (например shiny_app) и внутри этой папки создать 2 файла: ui.R и

Занятие 7. Временные ряды и финансовые данные с R

Простейшие операции с датами в R: Формат POSIXlt: Класс объекта временной ряд: Финансовые данные и временные ряды: Пакет xts для работы с временными рядами: Загрузка финансовых данных: Работа с финансовыми данными: Трансформация финансовых данных: Вычисление и добавление индикаторов технического анализа

Занятие 6. Машинное обучение с R

Основным пакетом для построения моделей машинного обучения является caret. Сперва установим данный пакет. В качестве исходных данных будем использовать встроенный массив данных по кредитам. Удалим объясняемую переменную: Удалим показатели, которые имеют нулевую вариацию Удалим показатели с высокой линейной зависимостью: Первичная

Занятие 5. vkR

        Скачать последнюю версию пакета 2. Авторизоваться: гдеclient_id – id standalone приложение https://vk.com/dev/standalone 3. Справочники 4. Друзья 5. Группы 6. Прочее 7. Состав групп Самостоятельные задания: Загрузить список постов участника и найти запись с наибольшим количеством репостов

Контрольная точка №2

Построить гистограмму на основе случайного распределения Стьюдента Выбрать 5 столбец, 3 строку из набора данных mtcars Удалить 7 столбец из набора данных mtcars Удалить 1 строку из набора данных mtcars Экспортировать данные mtcarsв txtфайл, а затем импортировать обратно Отсортировать автомобили

Занятие 4. Продвинутая графика с ggplot2

Рассмотрим методы визуализации, которые используются в R по умолчанию: Особой популярностью в среде пользователей R  пользуется пакет ggplot2. Рассмотрим подробнее: подключим пакет, посмотрим какие переменные есть в данных mtcars и создадим объем в котором будет храниться основная информация для построения графиков.

Сравниваем источники ценовых данных: Finam, mfd, alor

Одним из важнейших моментов связанных с анализом финансовых рынков, является достоверность и корректность анализируемых данных. Сегодня мы сравним наиболее используемые источники внутридневных цен на российском фондовом рынке. Для этого воспользуемся пакетом rusquant. library(rusquant) В качестве тестового инструмента мы выберем цены

Занятие 3. Введение в machine learning

Используя данные с сайта kaggle.com из соревнования House Prices: Advanced Regression Techniques, построить следующие модели: Logistic Regression ?glm(Survived ~.,family=binomial(link=’logit’),data=train) K-Means Clustering ?kmeans Hierarchical clustering d <- dist(mydata, method = «euclidean») # distance matrix fit <- hclust(d, method=»ward») groups <- cutree(fit,