1. Попробуйте выяснить, какие признаки наиболее важные и какие именно значения признаков различают три вида ирисов из данных iris  (макс. 2 б.).
  2. Скачать данные по любой ценной бумаге (акциям) (пакет quantmod), разделить на подвыборки train и test (60/40). На основе train посчитать модель ARIMA с наилучшими параметрами, спрогнозировать динамику на период test и сравнить с реальными данными (макс. 6 б.)
  3. На основе данных из социальной сети vk.com, найдите среди своих друзей:
    a. девушку, с наибольшей долей друзей мужского пола (от общего количества друзей)
    b. мужчину, с наибольшей долей друзей женского пола (от общего количества друзей)
    в. какие факторы среди ваших друзей влияют на количество поставленных лайков к записям (каждый значимый фактор +1 балл) (используйте регрессионный анализ)  (макс. 6 б.)
  4. Скачать данные по 3 любым ценным бумагам (акциям) (пакет quantmod) и вычислить их доходность и риск (стандартное отклонение). Не прибегая к симплекс-методу и методам оптимизации, численно вычислить веса этих 3 инструментов в портфеле (перебором), которые бы обеспечивали портфелю минимальный уровень риска при условии, что минимальный вес для каждого инструмента составляет 20%. Оптимизировать расчеты так, чтобы за приемлемое время получить оценки весов в портфеле (оценки весов можно брать с точностью до сотых) (макс. 6 б.)
  5. Используя набор данных о бриллиантах (diamonds из пакета ggplot2) случайным образом разделите выборку на обучающую и тестовую (10 000 наблюдений в тестовой выборке). Постройте 1 линейную модель и 3 модели машинного обучения (пакет caret), где объясняемой переменной является цена бриллианта. Как зависит качество модели на тестовой выборке в зависимости от объема обучающей выборки (1 000, 5 000, 10 000, 20 000, 30 000, 40 000 наблюдений в обучающей выборке) и от типа модели. Визуализируйте эти зависимости (макс. 8 б.)
  6. Вычислить методом Монте-Карло решение следующей задачи:
    Вы собрались купить себе автомобиль на вторичном рынке и заранее знаете необходимые вам характеристики (марку, модель, цвет, год выпуска, цену, объем двигателя, коробку передач и т.д.) На данный момент продается лишь 8 автомобилей, которые удовлетворяют вашим требованиям и все они находятся в разных городах на большом расстоянии друг от друга (Челябинск, Киров, Екатеринбург, Уфа и т.д.). Все автомобили имеют одинаковые технические характеристики и цену, но каждый их них имеет разное техническое состояние, которое можно определить только лично. Вы выезжаете в города для осмотра и оценки состояния автомобиля в случайном порядке и лишь один раз (города находятся на значительном расстоянии друг от друга и поэтому нет возможности вернуться в город второй раз и купить понравившийся автомобиль). При осмотре автомобиля вы однозначно можете определить лучше он или хуже любого из предыдущих осмотренных авто. В результате осмотра Вы покупаете этот автомобиль или едите в следующий город. Цель — приобрести наилучший автомобиль. Какова оптимальная стратегия выбора автомобиля? С какой вероятностью будет выбран наилучший автомобиль?   (макс. 8 б.)
Контрольная точка №3

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *