Интеллектуальный анализ данных — это процесс обнаружения полезной информации в больших наборах данных. Интеллектуальный анализ данных использует математический анализ для выявления закономерностей и тенденций в ваших данных. Как правило, такие закономерности невозможно найти при традиционном просмотре данных, потому что отношения слишком сложны или из-за чрезмерного количества данных.

Эти закономерности и тенденции можно объединить и определить как модель интеллектуального анализа данных. Модели интеллектуального анализа данных могут применяться к конкретным сценариям, а именно:

  • Прогнозирование: оценка продаж, прогнозирование нагрузки на сервер или времени простоя сервера.
  • Риск и вероятность: выбор наиболее подходящих клиентов для адресной рассылки, определение точки равновесия для рискованных сценариев, определение вероятностей диагнозов или других результатов
  • Рекомендации: определение продуктов, которые, вероятно, будут продаваться вместе, предоставление рекомендаций
  • Последовательный поиск: анализ выбора покупателя при совершении покупок, прогнозирование следующего возможного события.
  • Группировка: разделение клиентов или событий на кластеры связанных элементов, анализ и прогнозирование общих характеристик.

Построение модели интеллектуального анализа данных является частью более крупного процесса, который включает в себя все: от формулирования вопросов о данных и создания модели для ответов на эти вопросы до развертывания модели в производственной среде. Этот процесс можно представить как последовательность следующих шести основных шагов:

  1. постановка задачи;
  2. подготовка данных;
  3. изучение данных;
  4. строительные модели;
  5. исследование и проверка моделей;
  6. развертывание и обновление моделей.

ОБЛАСТИ ПРИМЕНЕНИЯ МЕТОДОВ DATA MINING

Методы Data Mining активно используются в сфере электронной коммерции, финансах, IT. Владение инструментами интеллектуального анализа данных дает аналитикам возможность решать широкий спектр задач, например:

  • определение потребностей и желаний клиентов;
  • выявление клиентов, приносящих максимальную прибыль;
  • повышение лояльности, привлечение и удержание клиентов;
  • анализ эффективности затрат на продвижение товаров и услуг.

ЦЕЛИ ТЕХНОЛОГИИ ДОБЫЧИ ДАННЫХ

Технология Data Mining выполняет следующие задачи:

  • классификационная задача — определение категории для каждого объекта исследования. В  такой задачей будет оценка кредитоспособности потенциальных заемщиков. Это поможет снизить риски потери средств при работе с неплатежеспособными клиентами;
  • задача прогнозирования, то есть определение новых возможных значений в определенной числовой последовательности. В электронной коммерции эта проблема решается путем предварительной установки цен в зависимости от сезонов и тенденций. Благодаря этому можно прогнозировать уровень продаж;
  • задача кластеризации (сегментации) — разделение множества объектов на группы по некоторым критериям. Так, например, сегментация данных о покупателях интернет-магазина по возрасту, полу или предпочтениям помогает формировать специальные предложения для каждой группы;
  • задача определения отношений — определение частоты встречаемости наборов объектов среди множества наборов. Этот метод помогает, в частности, определить состав потребительской корзины и оптимизировать размещение информации о сопутствующих товарах в интернет-магазине;
  • задача анализа последовательностей — выявление закономерностей в последовательностях событий. Этот анализ можно использовать для отслеживания страниц, на которых посетители с наибольшей вероятностью прерывают просмотр. Такой способ работы с данными позволяет устранить недостатки сайта и увеличить его посещаемость;
  • Задача анализа отклонений — выявить данные, существенно отличающиеся от нормы. Этот анализ используется  для выявления мошеннических транзакций с банковскими картами. Это позволяет обеспечить надежную защиту ваших клиентов.

Таким образом, анализ данных с использованием технологии Data Mining является одним из навыков, необходимых для ведения управленческой деятельности, поэтому он широко используется в бизнесе, науке, технологиях, медицине, телекоммуникациях и т. Д., Анализ данных по операциям с кредитными картами, анализ данных утилит, лояльность. карточные программы в магазинах, основанные на предпочтениях покупателей, национальная безопасность (обнаружение вторжений), исследование генома человека — это лишь небольшая часть возможных приложений интеллектуального анализа данных.