Интеллектуальный анализ данных

Интеллектуальный анализ данных (англ. Data Mining) — выявление скрытых закономерностей или взаимосвязей между переменными в больших массивах необработанных данных. Подразделяется на задачи классификации, моделирования и прогнозирования и другие. Термин «Data Mining» введен Григорием Пятецким-Шапиро в 1989 году.^{[источник не указан 5803 дня]}

Английский термин «Data Mining» не имеет однозначного перевода на русский язык (добыча данных, вскрытие данных, информационная проходка, извлечение данных/информации) поэтому в большинстве случаев используется в оригинале. Наиболее удачным непрямым переводом считается термин «интеллектуальный анализ данных» (ИАД).

ИАД включает методы и модели статистического анализа и машинного обучения, дистанцируясь от них в сторону автоматического анализа данных. Инструменты ИАД позволяют проводить анализ данных предметными специалистами (аналитиками), не владеющими соответствующими математическими знаниями.

Задачи, решаемые ИАД

Классификация — отнесение входного вектора (объекта, события, наблюдения) к одному из заранее известных классов.
Кластеризация — разделение множества входных векторов на группы (кластеры) по степени «похожести» друг на друга.
Сокращение описания — для визуализации данных, лаконизма моделей, упрощения счета и интерпретации, сжатия объемов собираемой и хранимой информации.
Ассоциация — поиск повторяющихся образцов. Например, поиск «устойчивых связей в корзине покупателя» (англ. market basket analysis) — вместе с пивом часто покупают орешки.
Прогнозирование
Анализ отклонений — Например, выявление нетипичной сетевой активности позволяет обнаружить вредоносные программы.
Визуализация

В литературе можно встретить еще ряд классов задач. Базовыми задачами являются первые три. Остальные задачи сводятся к ним тем или иным способом.

Также можно использовать сводные задачи под основу

Алгоритмы обучения

Для задач классификации характерно «обучение с учителем», при котором построение (обучение) модели производится по выборке содержащей входные и выходные векторы.

Для задач кластеризации и ассоциации применяется «обучение без учителя», при котором построение модели производится по выборке, в которой нет выходного параметра. Значение выходного параметра («относится к кластеру …», «похож на вектор …») подбирается автоматически в процессе обучения.

Для задач сокращения описания характерно отсутствие разделения на входные и выходные векторы. Начиная с классических работ К. Пирсона по методу главных компонент, основное внимание здесь уделяется аппроксимации данных.

Этапы обучения

Можно выделить типичный ряд этапов решения задач методами ИАД:

Формирование гипотезы;
Сбор данных;
Подготовка данных (фильтрация);
Выбор модели;
Подбор параметров модели и алгоритма обучения;
Обучение модели (автоматический поиск остальных параметров модели);
Анализ качества обучения, если неудовлетворительный переход на п. 5 или п. 4;
Анализ выявленных закономерностей, если неудовлетворительный переход на п. 1, 4 или 5.

См. также

Литература

Паклин Н.Б., Орешков В.И. Бизнес-аналитика: от данных к знаниям (+ СD).. — СПб: Изд. Питер, 2009. — 624 с.

Айвазян С.А., Бухштабер В.М., Енюков Е.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. — М.: Финансы и статистика, 1989. — 608 с.

Дюк В., Самойленко А. Data Mining: учебный курс (+CD).. — СПб: Изд. Питер, 2001. — 368 с.

Журавлёв Ю.И., Рязанов В.В., Сенько О.В. "РАСПОЗНАВАНИЕ.Математические методы.Программная система.Практические применения", к книге прилагается компакт-диск с демоверсией программной системы «РАСПОЗНАВАНИЕ». — М.: Изд. «Фазис», 2006. — 176 с. — ISBN 5-7036-0106-8

Зиновьев А. Ю. Визуализация многомерных данных. — Красноярск: Изд. Красноярского государственного технического университета, 2000. — 180 с.

Чубукова И. А. Data Mining: учебное пособие. — М.: Интернет-университет информационных технологий: БИНОМ: Лаборатория знаний, 2006. — 382 с. — ISBN 5-9556-0064-7

Ссылки

Гистограмма

Это незавершённая статья по статистике. Вы можете помочь проекту, исправив и дополнив её.

Искусственный интеллект

Это незавершённая статья об искусственном интеллекте. Вы можете помочь проекту, исправив и дополнив её.

ar:تنقيب في البيانات bg:Извличане на знания от данни ca:Mineria de dades cs:Data mining da:Data mining de:Data Mining en:Data mining es:Minería de datos eu:Datu-meatzaritza fa:داده‌کاوی fi:Tiedonlouhinta fr:Exploration de données he:כריית מידע hi:डाटा माइनिंग hu:Adatbányászat id:Penggalian data it:Data mining ja:データマイニング kn:ದತ್ತಾಂಶ ಗಣಿಗಾರಿಕೆ ko:데이터 마이닝 lt:Duomenų išgavimas lv:Datizrace nl:Datamining no:Data mining pl:Eksploracja danych pt:Mineração de dados ro:Exploatarea datelor simple:Data mining sk:Hĺbková analýza dát sl:Podatkovno rudarjenje su:Data mining sv:Informationsutvinning ta:தரவுச் செயலாக்கம் th:การทำเหมืองข้อมูล tr:Veri madenciliği uk:Добування даних vi:Khai phá dữ liệu zh:数据挖掘

Если вам нравится SbUP.com Сайт, вы можете поддержать его - BTC: bc1qppjcl3c2cyjazy6lepmrv3fh6ke9mxs7zpfky0 , TRC20 и ещё....

→

Интеллектуальный анализ данных

Содержание

Задачи, решаемые ИАД

Алгоритмы обучения

Этапы обучения

См. также

Литература

Ссылки

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

SEO сервисы

Инструменты

Главные категории