Интеллектуальный анализ данных — это процесс обнаружения полезной информации в больших наборах данных. Интеллектуальный анализ данных использует математический анализ для выявления закономерностей и тенденций в ваших данных. Как правило, такие закономерности невозможно найти при традиционном просмотре данных, потому что отношения слишком сложны или из-за чрезмерного количества данных.
Эти закономерности и тенденции можно объединить и определить как модель интеллектуального анализа данных. Модели интеллектуального анализа данных могут применяться к конкретным сценариям, а именно:
- Прогнозирование: оценка продаж, прогнозирование нагрузки на сервер или времени простоя сервера.
- Риск и вероятность: выбор наиболее подходящих клиентов для адресной рассылки, определение точки равновесия для рискованных сценариев, определение вероятностей диагнозов или других результатов
- Рекомендации: определение продуктов, которые, вероятно, будут продаваться вместе, предоставление рекомендаций
- Последовательный поиск: анализ выбора покупателя при совершении покупок, прогнозирование следующего возможного события.
- Группировка: разделение клиентов или событий на кластеры связанных элементов, анализ и прогнозирование общих характеристик.
Построение модели интеллектуального анализа данных является частью более крупного процесса, который включает в себя все: от формулирования вопросов о данных и создания модели для ответов на эти вопросы до развертывания модели в производственной среде. Этот процесс можно представить как последовательность следующих шести основных шагов:
- постановка задачи;
- подготовка данных;
- изучение данных;
- строительные модели;
- исследование и проверка моделей;
- развертывание и обновление моделей.
ОБЛАСТИ ПРИМЕНЕНИЯ МЕТОДОВ DATA MINING
Методы Data Mining активно используются в сфере электронной коммерции, финансах, IT. Владение инструментами интеллектуального анализа данных дает аналитикам возможность решать широкий спектр задач, например:
- определение потребностей и желаний клиентов;
- выявление клиентов, приносящих максимальную прибыль;
- повышение лояльности, привлечение и удержание клиентов;
- анализ эффективности затрат на продвижение товаров и услуг.
ЦЕЛИ ТЕХНОЛОГИИ ДОБЫЧИ ДАННЫХ
Технология Data Mining выполняет следующие задачи:
- классификационная задача — определение категории для каждого объекта исследования. В такой задачей будет оценка кредитоспособности потенциальных заемщиков. Это поможет снизить риски потери средств при работе с неплатежеспособными клиентами;
- задача прогнозирования, то есть определение новых возможных значений в определенной числовой последовательности. В электронной коммерции эта проблема решается путем предварительной установки цен в зависимости от сезонов и тенденций. Благодаря этому можно прогнозировать уровень продаж;
- задача кластеризации (сегментации) — разделение множества объектов на группы по некоторым критериям. Так, например, сегментация данных о покупателях интернет-магазина по возрасту, полу или предпочтениям помогает формировать специальные предложения для каждой группы;
- задача определения отношений — определение частоты встречаемости наборов объектов среди множества наборов. Этот метод помогает, в частности, определить состав потребительской корзины и оптимизировать размещение информации о сопутствующих товарах в интернет-магазине;
- задача анализа последовательностей — выявление закономерностей в последовательностях событий. Этот анализ можно использовать для отслеживания страниц, на которых посетители с наибольшей вероятностью прерывают просмотр. Такой способ работы с данными позволяет устранить недостатки сайта и увеличить его посещаемость;
- Задача анализа отклонений — выявить данные, существенно отличающиеся от нормы. Этот анализ используется для выявления мошеннических транзакций с банковскими картами. Это позволяет обеспечить надежную защиту ваших клиентов.
Таким образом, анализ данных с использованием технологии Data Mining является одним из навыков, необходимых для ведения управленческой деятельности, поэтому он широко используется в бизнесе, науке, технологиях, медицине, телекоммуникациях и т. Д., Анализ данных по операциям с кредитными картами, анализ данных утилит, лояльность. карточные программы в магазинах, основанные на предпочтениях покупателей, национальная безопасность (обнаружение вторжений), исследование генома человека — это лишь небольшая часть возможных приложений интеллектуального анализа данных.