суббота, 14 декабря 2013 г.

моя статья о концепции data activation для журнала Connect

Data Activation RoadMap

Я думаю не надо лишний раз говорить о томчто тема Big Data является темой на текущий момент более чем актуальной  популярной и ее упоминание в различных материалов на текущий момент просто зашкаливаетне надоДействительнов мире ИТ часто появляются терминыберущие свое начало в области технологийи казалось бы имеющие четкое и однозначное определениено по мере тогокак данная технология получает распространениетермин начинает приобретать больше маркетинговое значениепод соусом которого самыми разными поставщиками и производителями подаются все более и более широкий спектр продукцииИменно в такой ситуации находиться и Big Dataтермин,  ставший одновременно и трендом развития ИТ систем и технологийи брендомкоторый помогает в продвижении и маркетингеПри этомна мой взгляднесмотря на обилие материалов и перенасыщенность информационного пространства по этой теметрактовка данного термина очень сильно разница и зачастую под ним подразумевают самые разные понятияПоэтому прежде чем говорить о применимости данного термина для финансовых организациейдавайте договоримсячто такое Big Data в контексте именно этого материала.
Прежде всегоБольшие данные это инфраструктурное понятиеподразумевающее под собой стек технологийкоторый позволяет быстро обрабатывать очень большие объемы информацииДанный стек на текущий момент чрезвычайно широкВ него входят и компоненты хранения данных и обработки и визуализацииПри этом отсутствие четкого определениякакой же объем данных является большимсильно размывает границы применения данного терминаНо технология сама по себе интересна только самим ИТ специалистам.
Очень важно не только иметь хорошую технологиюно и найти ей правильное применение.  И вот тут тоесли посмотреть на Big Data через призму прикладных задачможно обнаружитьчто примеры применения данной технологии зачастую очень разные и неожиданныеВедь умение обработать большой массив позволяет находить ответы на самые неожиданные вопросыкоторые раньше просто физически не могли быть обработаныЭто и предсказание эпидемий гриппа по данным запросов поисковых систем (Google Flu)и данные анализа активностей пользователей социальных сетейпозволяющих определитьнапримерпотоки миграции людей и тд.
Поэтому главное сейчас это умение задавать правильные вопросыответы на которые позволят вашему бизнесу развиваться и достигать новых выдающихся результатовBig Data сейчас это креативностьа не технологияЭто умение находить новые неожиданные  связи между разными массивами информацииУмение исследовать эти массивы и умение превращать информацию в знанияа значит умение извлекать пользу из большого массива информацииВот что следует понимать под термином Big Data в его современной интерпретации.
Поэтому в вопросе развития ИТ инфраструктуры предприятияпрежде всегонужно определить основные прикладные направлениятребующие технологической поддержки по обработке большого объема данных.
В финансовом секторе уже можно выделить несколько прикладных задачахдля решения которых уже успешно применяются инновационные технологии.
Прежде всего это системы по борьбе с мошенничествомВ этойчрезвычайно важной для финансовой организации областиуспех в которой не только позволяет сократить операционные расходы и повысить качество услуг для конечного клиентано и зачастую является вопросом выживания компанииновые технологические возможности оказались востребованными в самую первую очередьВ качестве примера можно привести компанию Visa (http://blogs.wsj.com/cio/2013/03/11/visa-says-big-data-identifies-billions-of-dollars-in-fraud/), которая недавно опубликовала информацию о томчто использование технологий Big Data позволило ей значительно улучшить процент определения мошеннических транзакций по пластиковым картамТакв 2005 годукомпания анализировала только 2всех операцийи на основании данного анализа строила модели определения мошеннических транзакцийкоторые уже применялись для проверки каждой транзакцииСейчас же компания способна анализировать все транзакцииа так же провела расширение количества анализируемых атрибутов по каждой транзакции с 40 до 200, добавила новые типы анализируемой информации (например данные геолокации).
Другой пример корпорация CitiGroup использует технологии анализа данных для мониторинга состояния рынка путем анализа информационных сообщений новостных лент и сообщений в социальных сетях (http://www.economist.com/node/21554743). Это позволяет компании предсказывать вероятность дефолта по кредитам и выявлять факты мошенничестваВсе это позволило компании значительно улучшить свой инвестиционный портфель.
Огромные возможности технологии Big Data дают финансовым институтам и для улучшения их собственных продуктовКонечно в первую очередь тут идет речь о персонификации продукта под нужды каждого конкретного клиентачто позволяет повысить продажиа значить дать бизнесу реальную отдачу от применения технологий.
Технологии анализа накопленных организацией исторических данных о действиях клиента позволяют правильным образом спозиционировать финансовый продуктчто бы он максимально заинтересовал клиентаАнализируянапримеристорию операций по счету можно определитьнапримересть ли у клиента автомобилькак часто он ремонтируется и предложить клиенту не просто кредита покупку нового автомобиляПо информации компании McKinseyиспользование накопленных исторических данных для позиционирования продуктовпозволяет в раза повысить уровень принятия клиентами таких предложений.
Вообщерешении задачи накопления данныхгенерируемых компаниейявляется первоочередной на этапе перехода к использованию технологий Big DataИ важно начать их накапливать как можно раньшепотому что эти данные чрезвычайно важныИменно они являются отражением всей деятельности именно вашей компанииее клиентовее бизнес-модели и являются уникальнымиЭтими данными могут быть не только точто мы имеем ввиду в традиционном смыслекогда говорим о данным компании (данные транзакционных системCRM систем и тд), но и такие данныекак история просмотра сайта компании в сети интернетистория посещений клиентом офиса компании и тд.
Что бы дать бизнесу преимущество использования этих данных в перспективе двух-трех летуже сейчас надо организовывать сбор и хранение всей возможной информацииТехнологии для автоматизации этой функции в линейки решенийотносящихся к Big Dataнаверное наиболее развитыСуществуют и специализированные базы данныхи распределенные системы хранения неструктурированных данных и специализированные программно-аппаратные решения ведущих вендоровНельзя исключить из этого списка и традиционные системы построения хранилищ данных.
Таким образомв качестве первого шагана пути развития инфраструктуры компании в сторону Big Data является шаг Накапливатьна котором необходимо идентифицировать все необходимые источники данныхорганизовать  их сбор и хранение.
Далее все эти данные можно объединять с внешнимипо отношению к организацииданнымиДело в томчто если посмотреть на ситуацию с данными в глобальном масштабето можно увидетьчто данные имеет кластеризацию по различным бизнес-областямилидругими словамиинформационными доменамиМожно выделить домен данных финансовых организациейЭто примерно одни и те же по структуре и наполнению данные (списки клиентовсписки транзакций и тдс общепринятыми внутри домена правилами структуризацией и атрибутамиНо существуют и другие такие информационные доменыНапример сфера здравоохраненияВ ней так же происходит накопление большого объема специфичной для данного направления данныхМы можем активировать данныепутем установления соответствия между данными из одного информационного домена и данными другого информационного доменаполучив таким образом новый массив информации,  в котором скрыт новыйнедоступный ранее пласт знаний.
Сейчас в мире формируется новый рынок рынок данныхДанные становятся ценностьюине только текоторые уже привычно являются предметом широкого распространениятипа информация по стоимости финансовых инструментовно и информациякоторая накапливается в интернете сотнями сайтовсоциальных сетей и прочих площадок с высокой посещаемостью.
Сейчас информациякоторая может быть собрана об активности пользователя в интернетеактивно используется в сегменте сетевого маркетингаПутем обработки данных о поисковых запросах и истории просмотра страниц сайтов возможно извлечь информацию не только о социально-демографическом профиле пользователяно и понять сферу его интересовточто интересует его в настоящий момент.
Объединив эту информацию с данныминакопленными внутри компаниидает финансовой организации уникальные возможности.
Поэтому в качестве второго шага можно однозначно зафиксировать Активировать данныето есть определить информационные доменыданные которых могут принести дополнительную пользу организациии построить механизмы установления соответствия между этими информационными пространствами.
Новые знания о клиенте позволяют вывести на новый уровень механизмы скоррингаИнтересен пример американской компании ZestCashкоторая занимается кредитованием физических лицВ отличии от традиционных моделей принятия решения о кредитекоторые основывались на данных кредитного бюро о кредитной истории заемщикакомпания использовала данные о поведении клиента в сети интернетЭто позволило построить скоринговую модель для оценки кредитных рисков для клиентов без кредитной истории или даже с отрицательной кредитной историейОперирование в области данного клиентского сегментаот которого отказываются многие банкииспользующие более традиционную модельпозволило компании занять лидирующее положение на рынке.
Так же похожий бизнес-кейс есть и у страховых компанийДополнительные знанияполученные о клиентепозволяют выявить факты мошенничества при оформлении страховкиа так же более точно определить риск.
Ну и конечно возвращаясь к теме маркетингановые знания дают неограниченные возможности для формирования продуктовых предложенийПонимаю нужд клиентав момент его контакта с банкомявляется заветной мечтой маркетологов и именно сейчас технологии позволяют ее осуществить.
Использование технологий анализа данных с помощью современных инструментов из стека Big Data (инструменты статистической обработки данныхвизуализации данныхинтеллектуального анализа данныхмашинного обученияпозволяет найти в информации знаниякоторые так необходимы нашим бизнес-заказчикамСейчас эта дисциплина только зарождаетсяБольшинство из этих навыков не хватает во многих организациях и на рынке в целом.
Тем не менее третьим шагом можно зафиксироватьИзвлечь знания.

Таким образомкак и было обозначено в начале данной статьиBig Data - это использование творческой комбинации различных типов данных и человеческого знания.