Занятие 6. Машинное обучение с R

Основным пакетом для построения моделей машинного обучения является caret. Сперва установим данный пакет. В качестве исходных данных будем использовать встроенный массив данных по кредитам. Удалим объясняемую переменную: Удалим показатели, которые имеют нулевую вариацию Удалим показатели с высокой линейной зависимостью: Первичная

Занятие 5. vkR

        Скачать последнюю версию пакета 2. Авторизоваться: гдеclient_id – id standalone приложение https://vk.com/dev/standalone 3. Справочники 4. Друзья 5. Группы 6. Прочее 7. Состав групп Самостоятельные задания: Загрузить список постов участника и найти запись с наибольшим количеством репостов

Контрольная точка №2

Построить гистограмму на основе случайного распределения Стьюдента Выбрать 5 столбец, 3 строку из набора данных mtcars Удалить 7 столбец из набора данных mtcars Удалить 1 строку из набора данных mtcars Экспортировать данные mtcarsв txtфайл, а затем импортировать обратно Отсортировать автомобили

Занятие 4. Продвинутая графика с ggplot2

Рассмотрим методы визуализации, которые используются в R по умолчанию: Особой популярностью в среде пользователей R  пользуется пакет ggplot2. Рассмотрим подробнее: подключим пакет, посмотрим какие переменные есть в данных mtcars и создадим объем в котором будет храниться основная информация для построения графиков.

Сравниваем источники ценовых данных: Finam, mfd, alor

Одним из важнейших моментов связанных с анализом финансовых рынков, является достоверность и корректность анализируемых данных. Сегодня мы сравним наиболее используемые источники внутридневных цен на российском фондовом рынке. Для этого воспользуемся пакетом rusquant. library(rusquant) В качестве тестового инструмента мы выберем цены

Занятие 3. Введение в machine learning

Используя данные с сайта kaggle.com из соревнования House Prices: Advanced Regression Techniques, построить следующие модели: Logistic Regression ?glm(Survived ~.,family=binomial(link=’logit’),data=train) K-Means Clustering ?kmeans Hierarchical clustering d <- dist(mydata, method = «euclidean») # distance matrix fit <- hclust(d, method=»ward») groups <- cutree(fit,

Занятие 2. Базовый уровень статистики

Язык программирования R обладает широким спектром различный статистических методов. Рассмотрим в первую очередь описательную статистику на примере данных об автомобилях, встроенных в среду R. attach(mtcars) summary(mtcars) Данная команда позволяет основные статистические характеристики, такие как среднюю, медиану, квартили, минимальное и максимальное

Занятие 1. Первое знакомство с R.

R — язык программирования для статистической обработки данных. R славится своей графикой и производительностью в обработке данных. Кроме того, он является свободным ПО и по факту считается стандартом в научных исследованиях. Существуют различные IDE для работы с R. Наиболее популярная из