Участник:Konstantin Vorontsov
Материал из Википедии — свободной энциклопедии
Участник из Москвы. |
к.ф.-м.н. по специальности 01.01.09 — математическая кибернетика c 1999 года |
Delphi |
Участник когда-то много программировал |
Участник — математик |
Участник — статистик |
Зам. директора по науке ЗАО Форексис.
Научный сотрудник Вычислительного центра РАН.
Зам. зав. каф. «Интеллектуальные системы» МФТИ.
Научные интересы: всё, что скрывается за терминами «интеллектуальный анализ данных» (data mining) и «машинное обучение» (machine learning): распознавание образов, прогнозирование, математическая статистика, дискретная математика, численные методы оптимизации. Практический анализ данных в разнообразных областях (экономика, медицина, техника, интернет).
Содержание |
[править] Мои планы
Пополнить Википедию математическими и популярными статьями об интеллектуальном анализе данных. Ввести общеупотребительные понятия и термины. Показать наиболее яркие, наглядные примеры прикладных задач и методов их решения.
В настоящее время вся моя вики-деятельность сосредоточена на страницах нового научного вики-ресурса MachineLearning.ru
MachineLearning.ru — это профессиональный информационно-аналитический ресурс, посвященный машинному обучению и интеллектуальному анализу данных. В отличие от Википедии, MachineLearning.ru допускает статьи о незавершённых исследованиях, полемические и учебные материалы, коды программ и алгоритмов. Поощряется использование страниц MachineLearning.ru для организации совместной работы учёных и обмена информацией по текущим исследованиям.
Cтатьи, создаваемые там, могут свободно переноситься в Википедию (когда это не противоречит соглашениям об авторских правах, принятым в Википедии и MachineLearning.ru). |
[править] Новые категории
- Категория:Машинное обучение — (создана 2007.02.01)
- Категория:Википедия:Участники, окончившие МФТИ — (создана 2007.02.01)
[править] Новые статьи
Основные понятия:
- Информационное моделирование
- Обработка данных или анализ данных или интеллектуальный анализ данных
- Обучение по прецедентам = машинное обучение = Machine Learning — (создана 2007.01.28)
- Обучение с учителем — (создана 2007.01.30)
- Обучение без учителя — (создана 2007.02.01)
- Статистическая теория обучения = Вычислительная теория обучения = COLT
- Алгоритм обучения
- Модель алгоритмов
- Корректный алгоритм
- Функция потерь
- Эмпирический риск = Минимизация эмпирического риска = ERM
- Переподгонка = переобучение = оверфиттинг
- Обобщающая способность
- Информационный критерий
- Байесовский информационный критерий = BIC
- Информационный критерий Акаике = Критерий Акаике = AIC
- Скользящий контроль = Кросс-валидация
- Временной ряд
- Эмпирическое предсказание
- Логическая закономерность
- Статистическая закономерность
- Уровень значимости
- Информативность
Методы корреляционного и регрессионного анализа:
- Регрессия (математическая статистика)
- Регрессионный анализ
- Корреляционный анализ
- Метод наименьших квадратов
- Мультиколлинеарность
- Обобщенная линейная модель = GLM
- Коррелограмма
Методы классификации или распознавания образов:
- Классификация (машинное обучение) — (создана 2007.02.12)
- Байесовский классификатор
- Наивный байесовский классификатор
- Метод максимума правдоподобия
- Линейный дискриминант Фишера
- Смесь вероятностных распределений
- Гипотеза компактности
- Метод ближайшего соседа = kNN
- Метод потенциальных функций
- Метод радиальных базисных функций = Сеть радиальных базисных функций = RBF
- Метод парзеновского окна
- Проклятие размерности
- Машина опорных векторов = SVM
- Персептрон
- Многослойный персептрон
- Нейронная сеть
- Байесовская сеть
- Метод стохастического градиента
- Метод обратного распространения ошибки = Backpropagation = Backprop
- Индукция правил
- Ассоциативные правила = правила ассоциации
- Решающий список
- Решающее дерево
- Дерево регрессии
- Критерий ветвления
- Решающий лес
- Редукция решающего дерева
- Алгоритм вычисления оценок
- Тестовый алгоритм
- Принцип частичной прецедентности
Кластерный анализ:
- Кластеризация — (создана 2007.02.01)
- Кластер (Математическая статистика)
- Графовые алгоритмы кластеризации
- Статистические алгоритмы кластеризации
- Алгоритм ФОРЕЛЬ
- Алгоритм k средних = k-means
- Иерархическая кластеризация
- Таксономия
- Дендрограмма
- Нейронная сеть Кохонена
- Ансамбль кластеризаторов
- Многомерное шкалирование
- Карта сходства
- Сегментация
Методы преобразования пространства признаков и выбора моделей:
- Селекция признаков
- Синтез признаков
- Метод главных компонент
- Метод независимых компонент
- Метод группового учета аргументов = МГУА
- Самоорганизация моделей
- Внутренний критерий
- Внешний критерий
- Структурная минимизация риска
- Принцип минимума длины описания = MDL
- Байесовский вывод
- Генетический алгоритм
- Эволюционный алгоритм
- Случайный поиск
- Стохастический локальный поиск
- Случайный поиск с адаптацией
- Локальный случайный поиск
- Комбинаторный взрыв
Алгоритмические композиции:
- Алгоритмическая композиция = Ансамбль алгоритмов
- Метод комитетов
- Бустинг
- Бэггинг
- Смесь экспертов
- Алгебраический подход (машинное обучение)
- Алгоритмический оператор
- Корректирующая операция
- Решающее правило
Предварительный анализа данных:
- Понимание данных
- Визуализация данных
Теории, научные школы:
- Статистическая теория обучения
- Теория Вапника-Червоненкиса
- Алгебраический подход к проблеме распознавания
- Теория универсальных и локальных ограничений
- Теория возможности
- Теория нечётких множеств
Прикладные задачи интеллектуального анализа данных:
- Кредитный скоринг
- Предсказание ухода клиентов
- Обнаружение мошенничества
- Прогнозирование продаж
- Анализ клиентских сред
- Анализ рыночной корзины
- Персонализация
[править] Уже существующие разделы, требующие доработки
- Информационные технологии
- Математическая статистика
- Искусственный интеллект
- Data mining, он же Извлечение информации
- Данные
- Нейронные сети
- Распознавание образов
- Аппроксимация
- Сглаживание
- Прогнозирование
[править] Список алгоритмов
Большой раздел Список алгоритмов уже имеется, но для многих алгоритмов статей ещё нет. Есть предложение создать раздел «Анализ данных». Структура там могла бы быть такая:
- Проверка статистических гипотез
- Факторный анализ
- Регрессионный анализ
- Кластерный анализ
- Дисперсионный анализ
- Корреляционный анализ
- Многомерный анализ
- Дискриминантный анализ или Классификация
- Распознавание образов
- Распознавание изображений
- Распознавание речи
- Прогнозирование временных рядов
- Нейронные сети
- Алгоритмические композиции
- Предварительная обработка данных
- Визуализация данных
[править] Персоналии
- академик РАН Журавлёв, Юрий Иванович (структурировать, добавить публикации)
- чл.-корр. РАН Рудаков, Константин Владимирович
[править] Поправлено по ходу дела
- Базовые кафедры МФТИ — (2007.01.28)
- Разделяй и властвуй (программирование) — (создана 2007.02.04)
- Разделяй и властвуй (разрешение неоднозначности) — (создана 2007.02.04)
- Интеллектуальные системы (кафедра МФТИ)