Институт вычислительной математики и информационных технологий, кафедра анализа данных и исследования операций

Курс выполнен в поддержку преподавания дисциплин, входящих в учебные планы следующих направлений (программ подготовки):


Направление
 : 01.04.02.  Прикладная математика и информатика (Анализ данных и его приложения) (магистратура, 1 год обучения)

Дисциплина : "Введение в машинное обучение" 

Количество часов :  252 (в том числе : лекции - 26, лабораторные занятия - 16, самостоятельная работа - 210).


Ключевые слова : Data Mining, Machine Learning, визуализация данных,  регрессионная модель, мультиколлинеарность, метод LASSO, нейронные сети.

Темы : 1. Обучение с учителем (supervised learning). 2.Обучение без учителя (unsupervised learning). 3. Нейронные сети: основные понятия, применение нейронных сетей в задачах машинного обучения. 

Дата начала эксплуатации : 10 февраля  2020 года 

Авторы :
  • Миссаров Мукадас Дмухтасибович, зав. кафедрой анализа данных и исследова-ния операций КФУ, д.ф.-м.н., профессор, email: Moukadas.Missarov@ksu.ru
  • Шустова Евгения Петровна, к.ф.-м.н., доцент кафедры анализа данных и исследования операций, email: evgeniyashustova@yandex.ru
opisanie_kursa.pdfopisanie_kursa.pdf

Институт вычислительной математики и информационных технологий, кафедра анализа данных и исследования операций

Курс выполнен в поддержку преподавания ряда дисциплин, входящих в учебные планы нескольких направлений (программ подготовки):
Магистерская программа :
01.04.02 "Прикладная математика и информатика" 

Учебный план: "Анализ данных и его приложения" (очное обучение, 2013 г.)
Дисциплина : "Программирование в среде R"
Количество часов : 72 (в том числе : лабораторные занятия – 28, самостоятельная работа - 44); форма контроля - экзамен.


Направление : 050800.62 "Бизнес-информатика"
Дисциплина : "Анализ данных"
Учебный план: "Очное обучение, 2013 г."
Количество часов : 72 (в том числе : лекции - 12, лабораторные занятия – 20, самостоятельная работа - 40); форма контроля - зачёт.


Магистерская программа : 010400.68 "Прикладная математика и информатика" 

Учебный план: "Анализ данных и его приложения" (очное обучение, 2014 г.)

Дисциплина : "Машинное обучение"

Количество часов : 72 (в том числе : лабораторные занятия – 42, самостоятельная работа - 30); форма контроля - экзамен.


Ключевые слова : Data Mining, Machine Learning, regression, classification, clusterization, support vector, SVM, artificial neutron, neural network, recommendation system, анализ данных, машинное обучение, модель, выборка, переменная отклика, обучение выборки, переобучение выборки, обучение с учителем, обучение без учителя, пакет R, язык программирования R, статистика, случайная величина, с.в., закон распределения, нормальное распределение, выборка, статистика, метод максимального правдоподобия, доверительный интервал, распределение Хи-квадрат, распределение Стьюдента, распределение Фишера, статистическая гипотеза, область принятия гипотезы, уровень значимости, ошибки первого и второго рода, сравнение выборок, критерии согласия, таблица сопряженности признаков, корреляция, регрессия, линейная регрессия, нелинейная регрессия, фактор, предиктор, однофакторная регрессия, множественная регрессия, классификация, логистическая регрессия, однофакторный дискриминантный анализ, Байесовский подход, наивный Байес, метод опорных векторов, разделяющая гиперплоскость, деревья решений, нейронная сеть, нейрон, функция активации, рекомендательная система, кластеризация, функционал качества.
Темы :
1. Cреда разработки R: сведения из истории. установка и запуск пакета.
2. Программируем в R. первые шаги.
3. Построение графиков в среде R.
4. Ввод данных и работа с файлами в среде R.
4.1. Работа с одномерными массивами данных.
4.2. Работа с матрицами и таблицами данных.
5. Проверка статистических гипотез в среде R.
5.1. Проверка гипотезы о законе распределения вероятностей случайной величины (критерий Хи-квадрат Пирсона).
5.2. Проверка гипотезы о независимости признаков с качественной группировкой (критерий Хи-квадрат Пирсона).
5.3. Проверка гипотезы о равенстве математических ожиданий нормальных генеральных совокупностей (критерий Стьюдента).
5.4. Проверка гипотезы о равенстве дисперсий нормальных генеральных совокупностей (критерий Фишера).
6. Задача построения модели однофакторной линейной регрессии. Прогнозирование.
7. Задача многожественной линейной регрессии.
7.1. Задача однофакторной линейной регрессии как частный случай множе-ственной регрессии.
7.2. Исследование зависимости переменной отклика от фактора в регресси-онной модели.
8. Задача классификации, подходы к её решению.
8.1. Логистическая регрессия.
8.2. Линейный дискриминантный анализ.
8.3. Деревья решений - принцип "разделяй и властвуй" ("divide and con-quer").
9. Нейронные сети (neural networks) и их применение в машинном обучении.
10. Опорные векторы, метод опорных векторов ("support vector machines", SVM) в машинном обучении.
11. Рекомендательные системы ("recommendation system"), их назначение, построение, применение.
12. Специальные задачи машинного обучения.
Дата начала эксплуатации : 1 сентября 2014 года
Авторы :
  • Миссаров Мукадас Дмухтасибович, зав. кафедрой анализа данных и исследова-ния операций КФУ, д.ф.-м.н., профессор, email: Moukadas.Missarov@ksu.ru
  • Кашина Ольга Андреевна, к.ф.-м.н., доцент кафедры анализа данных и исследования операций, email: olga.kashina@mail.ru
  • Шустова Евгения Петровна, к.ф.-м.н., доцент кафедры анализа данных и исследования операций, email: evgeniyashustova@yandex.ru

Введение в анализ данных и исследование операций

Институт вычислительной математики и информационных технологий, кафедра анализа данных и исследования операций

Направление : 01.03.02 "Прикладная математика и информатика" (бакалавриат, очное обучение, 2 курс)

Дисциплина : "Введение в анализ данных и исследование операций" 

Количество часов : 51 (в том числе : лабораторные занятия – 36, контрольные работы – 15). 


Ключевые слова : Анализ данных, Исследование операций, оптимизация, линейное программирование, выпуклое множество, выпуклая функция, выпуклое программирование, дискретная оптимизация, целочисленное линейное программитрование, задача планирования производства, задача о диете, транспортная задача, задача о назначении, задача о ранце, одномерная задача раскроя, задача минимизации отходов раскроя, задача коммивояжёра, задача классификации, задача кластеризации, R, RStudio, Data Mining, Operation Research, Optimization, Linear Programming, convex set, convex function, Convex Programming, Integer Linear Programming, Discrete Optimization, Production Optimization Problem, Diet Problem, Transportation Problem, Assignment Problem, Knapsack problem, 1D Cutting-Stock problem, Waste Minimization Cutting-stock problem, Travelling Salesman Problem, Classification Problem, Clasterization Problem.

Аннотация : Цель изучения дисциплины "Введение в анализ данных и исследование операций" состоит в том, чтобы выработать у студентов:

  • способность выполнить математические описание проблемы в виде задачи оптимизации (из одного из изученных классов);
  • понимание теоретических подходов к решению проблемы;
  • умение найти подходящий численный метод решения задачи;
  • навыки численного решения задач в среде R;
  • способность визуализовать (если позволяет) размерность и проанализировать исходные данные и/или полученные результаты;
  • способность изложить проблему, метод её решения и полученные результаты.


Темы
: 1. Введение. Сведения из истории возникновения и развития Исследования операций и Анализ данных. Основные определения. 2. Cреда разработки R: сведения из истории, установка и запуск пакета. Интерфейс RStudio. 3. Основы работы в среде R: построение графиков, ввод и простейшие операции с одномерными массивами данных, списками, матрицами и таблицами. 4. Основные понятия теории экстремальных задач. 4.1. Выпуклые множества и их свойства. 4.2. Выпуклые (вогнутые) функции и их свойства. 4.3. Задача выпуклого программирования. 5. Линейное программирование. 5.1. Графическое решение задач линейного программирования в R. 5.2. Численное решение задач линейного программирования в R. 5.3. Специальные случаи задачи линейного программирования: задача о диете, транспортная задача, задача о назначении. 6. Целочисленное линейное программирование (задача о ранце, задача одномерного раскроя, задача минимизации отходов раскроя). 7. Дискретная оптимизация. Задача коммивояжера. 8. Основные классы задач анализа данных: регрессия, классификация, кластеризация.


Дата начала эксплуатации : 1 сентября 2014 года

Авторы :

  • Миссаров Мукадас Дмухтасибович, зав. кафедрой анализа данных и исследова-ния операций КФУ, д.ф.-м.н., профессор, email: Moukadas.Missarov@kpfu.ru
  • Кашина Ольга Андреевна, к.ф.-м.н., доцент кафедры анализа данных и исследования операций, email: olga.kashina@mail.ru

Институт вычислительной математики и информационных технологий, кафедра анализа данных и исследования операций

Направление : 020100.68 "Химия".

Учебный план : Хемоинформатика и молекулярное моделирование (очное, 2013).

Дисциплина : Веб-технологии в химии (магистратура, 1 курс; форма контроля - зачёт).

Количество часов : 72 (в том числе : лекции - 18, практические занятия – 10, , самостоятельная работа - 44).

Темы
: 1. Введение. Сведения из истории возникновения и развития Интернет. Основные понятия. 2. Основы языка HTML: основные теги и их атрибуты. Гиперссылки, таблицы, изображения, сенсорные изображения. 3. Стилевые классы, каскадные таблицы стилей (CSS), динамическое управление стилем. 4. Язык клиентских сценариев JavaScript. Document Object Model (DOM) - объектная модель документа. Обработка клиентских событий. Динамическое изменение свойств документа. 5. Основы технологии HTML5. Объект холст (Canvas). Рисование на холсте и работа с изображениями. 6. ChemDoodle Web Components - библиотека веб-компонент для визуализации химической информации. «Дочерние» объекты холста: ViewerCanvas, View3D Canvas, Transformer3D Canvas, PeriodicTableCanvas, SketcherCanvas.

Ключевые слова : Интернет, браузер, сервер, HTML, HTTP, WWW, веб-сервер, гипертекст, языки разметки гипертекста, HTML, XHTML, протокол передачи данных, сервер, клиент, построители сайтов, валидаторы, каскадные таблицы стилей, CSS, XML, XML-схемы, DTD, XSL, CMS, системы управления контентом.

Дата начала эксплуатации
: 1 сентября 2013 года

Автор : Кашина Ольга Андреевна, к.ф.-м.н., доцент кафедры анализа данных и исследования операций, email: olga.kashina@mail.ru

Институт вычислительной математики и информационных технологий, кафедра анализа данных и исследования операций

Направление подготовки : "080500 Бизнес-информатика" (бакалавриат, очное обучение) 
Дисциплины : 
- Теория вероятностей и математическая статистика (2 курс)

количество часов : 108 (в том числе : лекции - 18, практические занятия – 28, самостоятельная работа – 62); форма контроля - экзамен (4 семестр)
Специальные главы математической статистики - (3 курс
количество часов : 108 (в том числе : лекции - 18, практические занятия – 28, самостоятельная работа – 62); форма контроля - экзамен (5 семестр) 
Ключевые слова : случайная величина (с.в.), закон распределения, нормальное распределение, выборка, статистика, метод максимального правдоподобия, доверительный интервал, распределения Хи-квадрат, Стьюдента и Фишера, статистическая гипотеза, область принятия гипотезы, уровень значимости, ошибки первого и второго рода, сравнение выборок,критерии согласия , проверка сопряженности признаков, корреляция, регрессия, контрольные карты
Темы : Вероятностные распределения. Дескриптивная статистика. Точечное оценивание. Доверительные интервалы. Проверка гипотез. Корреляция и регрессия. Статистический контроль качества.
Дата начала эксплуатации : 1 сентября 2013 года 
Авторы : 
- Миссаров Мукадас Дмухтасибович, зав. кафедрой анализа данных и исследования операций КФУ, д.ф.-м.н., профессор, email: Moukadas.Missarov@ksu.ru
- Кашина Ольга Андреевна, к.ф.-м.н., доцент кафедры анализа данных и исследования операций, email: olga.kashina@mail.ru

Теория экстремальных задач

Институт вычислительной математики и информационных технологий, кафедра анализа данных и исследования операций

Дисциплины :

- "Математические методы и модели исследования операций" (специальность – 061800 «Математические методы в экономике»), 2 курс (3 и 4 семестры)
   Количество часов : 157, в том числе : 70 – лекции, 87 –практика; форма контроля: зачет, экзамен
- "Методы оптимизации" (специальность – 010400.62 «Прикладная математика и информатика», направление – 010500.62 «Прикладная математика и информатика»), 3 курс (6 семестр)
   Количество часов : 68, в том числе : 50 – лекции, 18 –практика; форма контроля - экзамен
- "Методы оптимизации" (направление – 080500.62 «Бизнес-информатика»), 2 курс (4 семестр)
   Количество часов : 94, в том числе : 36 – лекции, 58 –практика; форма контроля - экзамен
- "Дополнительные главы оптимизации" (магистерская программа 010500.68 «Прикладная математика и информатика»), 5 курс (10 семестр)
   Количество часов : 48, в том числе : 24 – лекции, 24 –практика; форма контроля - экзамен.

Темы :
Условный экстремум. Задача нелинейного программирования.
Выпуклый анализ. Выпуклые множества. Выпуклые функции.
Условия экстремума первого порядка.
Выпуклые многогранные множества.
Опорные векторы. Конусы опорных векторов.
Выпуклое программирование.
Теорема Куна-Таккера.
Линейное программирование. Симплексный метод. Метод искусственного базиса.
Транспортная задача. Метод потенциалов.
Методы безусловной минимизации. Метод покоординатного спуска. Градиентные методы. Метод Ньютона.
Методы нелинейного программирования. Метод проекции градиента. Метод условного градиента. Методы штрафных и барьерных функций. Метод центров.
Методы одномерного поиска. 
Ключевые слова : математическая модель, задача оптимизации, экстремум, локальные и глобальные экстремумы, минимум, максимум, задача нелинейного программирования, выпуклое множество, выпуклый конус, выпуклая функция, задача выпуклого программирования, задача линейного программирования, метод последовательного улучшения плана, симплексный метод, базис, опорное решение, опорный план, методы оптимизации
Авторы
- Кашина Ольга Андреевна, к.ф.-м. наук, доцент кафедры экономической кибернетики Института вычислительной математики и информационных технологий, E-mail : olga.kashina@mail.ru 
- Кораблёв Анатолий Иванович, к.ф.-м. наук, доцент кафедры экономической кибернетики Института вычислительной математики и информационных технологий, E-mail : pananatol@mail.ru


Институт вычислительной математики и информационных технологий, кафедра анализа данных и исследования операций

Курс выполнен в поддержку преподавания ряда дисциплин, входящих в учебные планы нескольких направлений (программ подготовки):
Магистерская программа :
01.04.02 "Прикладная математика и информатика" 

Учебный план: "Анализ данных и его приложения" (очное обучение, 2013 г.)
Дисциплина : "Программирование в среде R"
Количество часов : 72 (в том числе : лабораторные занятия – 28, самостоятельная работа - 44); форма контроля - экзамен.


Направление : 050800.62 "Бизнес-информатика"
Дисциплина : "Анализ данных"
Учебный план: "Очное обучение, 2013 г."
Количество часов : 72 (в том числе : лекции - 12, лабораторные занятия – 20, самостоятельная работа - 40); форма контроля - зачёт.


Магистерская программа : 010400.68 "Прикладная математика и информатика" 

Учебный план: "Анализ данных и его приложения" (очное обучение, 2014 г.)

Дисциплина : "Машинное обучение"

Количество часов : 72 (в том числе : лабораторные занятия – 42, самостоятельная работа - 30); форма контроля - экзамен.


Ключевые слова : Data Mining, Machine Learning, regression, classification, clusterization, support vector, SVM, artificial neutron, neural network, recommendation system, анализ данных, машинное обучение, модель, выборка, переменная отклика, обучение выборки, переобучение выборки, обучение с учителем, обучение без учителя, пакет R, язык программирования R, статистика, случайная величина, с.в., закон распределения, нормальное распределение, выборка, статистика, метод максимального правдоподобия, доверительный интервал, распределение Хи-квадрат, распределение Стьюдента, распределение Фишера, статистическая гипотеза, область принятия гипотезы, уровень значимости, ошибки первого и второго рода, сравнение выборок, критерии согласия, таблица сопряженности признаков, корреляция, регрессия, линейная регрессия, нелинейная регрессия, фактор, предиктор, однофакторная регрессия, множественная регрессия, классификация, логистическая регрессия, однофакторный дискриминантный анализ, Байесовский подход, наивный Байес, метод опорных векторов, разделяющая гиперплоскость, деревья решений, нейронная сеть, нейрон, функция активации, рекомендательная система, кластеризация, функционал качества.
Темы :
1. Cреда разработки R: сведения из истории. установка и запуск пакета.
2. Программируем в R. первые шаги.
3. Построение графиков в среде R.
4. Ввод данных и работа с файлами в среде R.
4.1. Работа с одномерными массивами данных.
4.2. Работа с матрицами и таблицами данных.
5. Проверка статистических гипотез в среде R.
5.1. Проверка гипотезы о законе распределения вероятностей случайной величины (критерий Хи-квадрат Пирсона).
5.2. Проверка гипотезы о независимости признаков с качественной группировкой (критерий Хи-квадрат Пирсона).
5.3. Проверка гипотезы о равенстве математических ожиданий нормальных генеральных совокупностей (критерий Стьюдента).
5.4. Проверка гипотезы о равенстве дисперсий нормальных генеральных совокупностей (критерий Фишера).
6. Задача построения модели однофакторной линейной регрессии. Прогнозирование.
7. Задача многожественной линейной регрессии.
7.1. Задача однофакторной линейной регрессии как частный случай множе-ственной регрессии.
7.2. Исследование зависимости переменной отклика от фактора в регресси-онной модели.
8. Задача классификации, подходы к её решению.
8.1. Логистическая регрессия.
8.2. Линейный дискриминантный анализ.
8.3. Деревья решений - принцип "разделяй и властвуй" ("divide and con-quer").
9. Нейронные сети (neural networks) и их применение в машинном обучении.
10. Опорные векторы, метод опорных векторов ("support vector machines", SVM) в машинном обучении.
11. Рекомендательные системы ("recommendation system"), их назначение, построение, применение.
12. Специальные задачи машинного обучения.
Дата начала эксплуатации : 1 сентября 2014 года
Авторы :
  • Миссаров Мукадас Дмухтасибович, зав. кафедрой анализа данных и исследова-ния операций КФУ, д.ф.-м.н., профессор, email: Moukadas.Missarov@ksu.ru
  • Кашина Ольга Андреевна, к.ф.-м.н., доцент кафедры анализа данных и исследования операций, email: olga.kashina@mail.ru

 

Институт вычислительной математики и информационных технологий, кафедра анализа данных и исследования операций

Направление подготовки: 38.03.05 «Бизнес-информатика» (бакалавриат, 2 курс, 4 семестр, очное обучение; форма контроля - )
Дисциплина: : «Методы оптимизации»
Количество часов: ?? (в том числе, лекции - ??, практические занятия - ??, самостоятельная работа - ??, индивидуальная работа - ??).

Темы: выпуклые множества, выпуклые конусы, сопряжённые конусы, выпуклые функции, линейное программирование

Ключевые слова: выпуклая комбинация точек евклидова пространства, выпуклое множество, выпуклый конус, выпуклая функция, сопряжённый конус
Дата начала эксплуатации : 08 февраля 2017 г.
Авторы :
- Кораблёв Анатолий Иванович, к.ф.-м. наук, доцент кафедры анализа данных и исследования операций Института вычислительной математики и информационных технологий, E-mail : pananatol@mail.ru
- Кашина Ольга Андреевна, к.ф.-м. наук, доцент кафедры анализа данных и исследования операций Института вычислительной математики и информационных технологий, E-mail : olga.kashina@mail.ru


Институт вычислительной математики и информационных технологий, кафедра анализа данных и исследования операций

Направление подготовки:38.03.05 «Бизнес-информатика» (бакалавриат, 3 курс, 6 семестр, очная форма обучения)
Учебный план : (очное, 2011) Дисциплина: : В.2. «>Интернет-технологии»
Количество часов: - 108 (в том числе - лабораторные занятия – 62, самостоятельная работа – 46); форма контроля - экзамен

Темы : 1. Сведения из истории развития Интернет. WWW как основная компонента Интернет. 2. Основные понятия: сервер, клиент, протокол, веб-сервер, браузер, языки разметки. 3. Программное обеспечение для веб-разработок. 4. Основы языка HTML. Основные тэги и их атрибуты. Основные особенности спецификации HTML5. 5. Принципы взаимодействия клиента и сервера. Понятие клиентских и серверных сценариев. Краткий обзор серверных технологий. 6. Технология PHP. Основные понятия. 7. Разработка простейшего электронного магазина средствами технологии PHP.

Ключевые слова: Интернет, Всемирная паутина, веб, WWW, сервер, веб-сервер, HTML, HTML5, HTTP, URL, тег, гиперссылка, гипертекст, стилевой класс, стилевая таблица, клиентский сценарий, серверный сценарий, PHP, электронный магазин, регистрация, авторизация, ключики (cookies), система заказа.

Аннотация : курс предназначен для студентов направления 080500.62 "Бизнес-информатика" в поддержку дисциплин "Интернет-технологии" и "Электронный бизнес". Студенты получают базовые теоретические знания об истории возникновения и развития Интернет, о существующих технологиях для разработки веб-приложений и использования их конечными потребителями (пользователями Интернет), выработают практические навыки использования технологии PHP. Изучение технологий подчинено цели создания простейшего электронного магазина. Сферу применения электронного магазина, его специализацию, ассортимент товаров и услуг студенты определяют самостоятельно. Работа ведётся поэтапно. Каждый этап характеризуется набором задач, которые предстоит выполнить студенту, сроками и максимальным баллом. Результатом изучения курса должна стать "действующая модель" электронного магазина.
Авторы:

- Кашина Ольга Андреевна, доцент кафедры анализа данных и исследования операций Института вычислительной математики и информационных технологий КФУ, e-mail: olga.kashina@mail.ru
- Пинягина Ольга Владиславовна, доцент кафедры анализа данных и исследования операций Института вычислительной математики и информационных технологий КФУ, e-mail: olga.piniaguina@kpfu.ru
Дата начала использования : 7 февраля 2014 г.