Data Discovery укореняется в России

11 Августа 2014

АВТОР: Андрей Арсентьев

Алексей Попович, главный специалист управления по работе с производителями «Астерос Консалтинг», эксперт по продуктам Oracle, объясняет разницу между Business Intelligence и Data Discovery для портала CNews.

Системы Data Discovery постепенно завоевывают внимание мирового бизнеса, которому нужны гибкие и простые решения в условиях разнообразия неструктурированных данных. Специалисты говорят, что в России спрос на подобные решения будет расти «осторожно».

Термин «data discovery» впервые отмечен как обозначающий тренд на ИТ-рынке в 2010 г. С тех пор ряд компаний (QlikTech, Tibco Software, Tableau Software, Oracle и другие) оформили свою маркетинговую стратегию и вывели на рынок перспективные продукты, отличающиеся вычислениями в оперативной памяти, наличием дэшбордов, средствами самообслуживания. Решения Data Discovery позволяют оперативно анализировать широкий спектр данных: транзакционные (из различных информационных систем, например из ERP и CRM), сведения из документов, автоматически сгенерированные данные (например, из потоков RSS), а также работают с огромными массивами информации из социальных сетей.

BI или DD?

До сих пор многие специалисты не выделяют Data Discovery (DD) как отдельное направление или рыночную нишу, считая его частным случаем Business Intelligence. Согласно Gartner, инструменты DD обеспечивают пользователям высокую степень удобства, гибкость управления процессом моделирования и создания контента. Также они поддерживают высокую степень интерактивности и расширенные возможности визуализации интерфейса, который базируется на архитектуре in-memory. В компании Forrester отмечают, что такие средства быстро развертываются и отвечают быстро меняющимся требованиям бизнеса.

«И Data Discovery, и BI-платформы по сути призваны решать одни и те же задачи: предоставлять пользователям инструменты для решения аналитических задач. Однако если основными покупателями и владельцами BI-систем являются ИТ-службы, заказчиками Data Discovery становятся бизнес-подразделения», – говорит Сергей Шестаков, заместитель генерального директора по развитию бизнеса компании «Прогноз». Бизнес-пользователи (менеджмент и аналитики) стремятся работать с программными продуктами напрямую. Они отдают предпочтение простым и быстрым инструментам для анализа данных, поддерживающим совместную работу, интерактивной и яркой визуализации, присущей решениям Data Discovery. Но достоверность данных и результатов их анализа в полной мере по-прежнему могут обеспечить только промышленные BI-системы, подчеркивает Сергей Шестаков.

Алексей Попович, главный специалист управления по работе с производителями группы «Астерос», эксперт по продуктам Oracle, полагает, что противопоставлять инструменты Business Intelligence и Data Discovery не вполне правильно, поскольку их математический аппарат, в первую очередь, предназначен для отражения и исследования процессов и механизмов, с помощью которых осуществляется контроль и управление организованной и неорганизованной деятельностью групп людей. «И хотя в настоящее время аппарат Business Intelligence ориентирован на производство, а продукты Data Discovery часто применяют для извлечения информации социальных сетей, вероятно, корректнее говорить, что средства BI и DD являются самостоятельными замкнутыми реализациями методов анализа – они могут использоваться независимо друг от друга и предназначены для работы в одинаковых предметных областях, хотя и с моделями данных разного типа», – поясняет специалист.

Data Discovery – это алгоритмы для обнаружения информации в совокупности сведений, которая может быть неструктурированной. В то же время BI – это не столько инструменты для получения, обработки и отображения уже имеющихся сведений, сколько для их организации и интеграции, для пластичного преобразования одних структур данных в другие, благодаря чему появляется новая информация, которой в исходной совокупности не было совсем, такая, к примеру, как финансовый итог деятельности транснациональной корпорации за год.

И хотя по сути термины BI и DD охватывают достаточно близкие области, сегодня специалисты рассматривают решения Data Discovery как оснащение аналитических процессов альтернативными средствами по сравнению с комплектованием инструментальной палитры традиционных информирующих систем. Соответственно, есть более или менее похожие определения для этих понятий, а также самые разные математические и программные инструменты для работы, причем – и довольно часто – у каждого изготовителя еще и свое собственное понимание того, что это такое. Тем не менее, если не вдаваться в детали, различия становятся не такими существенными, и в итоге выявляется то, что является общим.

Вендоры, стремясь полностью соответствовать запросам клиентов, усложняют самостоятельные Data Discovery-решения. Однако такие решения все же не могут быть полностью интегрированы с основной платформой для выполнения всего спектра функций (многомерного контроля достоверности данных, выполнения сложных вычислений и других). Промышленные BI-платформы постепенно в полной мере реализуют подходы Data Discovery, замечает Сергей Шестаков.

На пороге спроса

Сегмент Data Discovery в России начал формироваться сравнительно недавно, но спрос на такие решения постепенно растет, запросы на подобные решения поступают от представителей всех секторов и отраслей экономики. Активными пользователями Data Discovery становятся представители среднего бизнеса, которых привлекают аналитические решения, не требующие увеличения штата ИТ-специалистов или расходов на консультантов. Доступность DD в использовании импонирует и менеджерам высшего и среднего звена крупных корпораций, которым порой не требуется углубленная аналитика, а нужно «на лету» построить тренд, сформировать отчет, подготовиться к презентации.

На российском рынке заметны решения компаний QlikTech, Oracle, а также «Прогноз», которая развивает направление Data Discovery в рамках единой платформы бизнес-аналитики Prognoz Platform. Развитие промышленной технологии в направлении удобства работы бизнес-пользователей позволяет сохранить все преимущества целостной системы (платформы), включая широкие возможности для работы с данными и их высокое качество, объясняет Сергей Шестаков.

Ближайшие перспективы

Интерес к решениям Data Discovery довольно высок в отраслях с большим уровнем проникновения ИТ – телеком, банки, ритейл. За рубежом это еще и транспорт, отмечает Алексей Попович. По его словам, на некоторых предприятиях подобные решения уже используются довольно широко, затрачены существенные средства для приобретения соответствующих инструментов. Например, это происходит в банках, которые традиционно находятся на переднем крае информатизации.

В других отраслях DD представлена довольно фрагментарно. Заказчиков сдерживают разные причины – главным образом необходимость экономии. «Наличие инструментов для моделирования производственных и управленческих процессов дает возможность эксплуатации вычислительных комплексов с минимальным участием персонала ИТ, а передача соответствующих ресурсов в «облако» в перспективе позволит отказаться от дорогостоящих специалистов в собственном штате. Однако здесь появляется одно «но». Это опасение за безопасность коммерческой информации, которая должна передаваться компании, предлагающей соответствующий сервис. За границей переход в «облака» идет с ускорением, а Россия пока не торопится и наблюдает.

Специалисты в ближайшее время ожидают осторожный рост спроса на решения Data Discovery. Удовлетворить соответствующие потребности ряд заказчиков сможет с помощью сервисов SaaS (Software as a Service), DaaS (Data as a Service) или KaaS (Knowledge as a Service). Это позволит предприятиям с выгодой для себя заказывать выполнение соответствующих услуг компаниям, которые помимо аренды оборудования в режиме и на условиях On-Demand, а также готовой информационной среды, адаптированной к отражению производственной специфики заказчика, предлагают услуги дорогостоящих специалистов с высоким профессиональным уровнем на условиях оплаты частичной занятости. Таким образом, клиент сможет отказаться от расходов на эксплуатацию и поддержку собственной инфраструктуры с необходимостью содержания у себя полного штата непрофильных сотрудников.

НАВЕРХ