Руководство
крупной американской сети супермаркетов Osco несколько лет назад
поставило перед службой информационных технологий задачу разработать
систему, способную анализировать огромные объемы данных, генерируемых
ежедневно. Предполагалось, что в результате анализа станут понятны рыночные тенденции. Сразу
после заверения работы над системой была обнаружена удивительная
тенденция: в период с 17:00 до 19:00 существенно возрастали совокупные
продажи подгузников и пива. Иными словами, масса клиентов, приобретавших
в это время подгузники, включали в свою продуктовую корзину и пиво. Эта
тенденция сначала обеспокоила исследователей, однако вскоре нашлось и
объяснение: клиенты с маленькими детьми не могут отправиться на футбол,
баскетбол или бейсбол, поэтому они покупали пиво, чтобы пить его во
время телевизионной трансляции матчей. Как
компания Osco использовала эту информацию? Полки с подгузниками и пивом
были переставлены ближе друг к другу, и совокупные продажи обеих групп
товаров значительно возросли. Этот пример использования информационных
систем получил известность, и сегодня все крупные торговые сети
используют хранилища данных и средства интеллектуального анализа для
изучения тенденций рынка и запуска новых продуктов. О
том, что такое интеллектуальный анализ данных и хранилище данных, мы
расскажем чуть позже. Пока лишь отметим, что анализ данных — это
дисциплина, в которой изучаются способы извлечения информации из
систематически собираемых сведений. В силу растущей сложности данных
среды проводить подобный анализ с каждым разом становится все труднее, и
сегодня интеллектуальный анализ данных выделяют в отдельную дисциплину
на стыке искусственного интеллекта и статистики. Анализ
данных возник в XVIII веке одновременно с появлением первых современных
государств, осуществлявших систематический сбор информации о населении и
состоянии экономики. Интеллектуальный анализ данных появился
значительно позже, в конце XX века, когда вычислительные мощности и
новые методы искусственного интеллекта достигли уровня, достаточного для
того, чтобы извлекать информацию из огромных объемов данных.
|