Геймификация в банковской сфере. Привлечь новых пользователей

Финансовый симулятор помогает людям взглянуть на работу банка изнутри

В закладки

Представители банка «Хоум Кредит» рассказали редакции сайт о том, как компания разработала онлайн-игру «Сам себе банкир», которая позволяет игрокам почувствовать себя в роли директора банка. Благодаря симулятору, аудитория может понять, как именно работает финансовая организация, что позволяет вовлечь ее в бренд.

Идея разработать финансовую онлайн-игру появилась в банке в 2015 году. Компания поставила перед собой цель заинтересовать людей банковским делом, вовлечь в бренд, и в игровой форме рассказать об основных принципах работы банка.

«Опыт показывает, что люди охотнее взаимодействуют с тем, что они понимают. А наша игра дает людям возможность взглянуть на банк изнутри: игроки сами определяют, как работал бы "их" банк, а потом система автоматически высчитывает прибыль или убыток», - рассказывает директор департамента маркетинга и маркетинговых коммуникаций банка «Хоум Кредит» Мария Бурак.

Управление банком разделено на девять сфер (кредитные продукты, риски, клиентский сервис и так далее). Выбирая пункт меню, игрок должен либо ответить на вопрос, либо установить значения финансовых показателей.

После того, как пользователь определит политику организации, система рассчитает, насколько успешным окажется банк, и как много игроку удастся заработать (или потерять).

Игра запустилась в середине 2016 года. С момента открытия в ней поучаствовали более 32 тысяч человек. «Изначально мы рассчитывали, что к концу 2016 года игру пройдут не менее 10 тысяч человек. В итоге мы превысили наши изначальные планы более чем в три раза», - отмечает Бурак.

По словам директора департамента маркетинга, около 20% игроков сыграли несколько раз, пытаясь улучшить свой результат. Аудиторию составили клиенты банка, подписчики его групп в соцсетях, люди, которые пришли по репосту других игроков, а также сотрудники банка.

«У онлайн-игры нет призового фонда и компания не платила за продвижение. Игроки привлекались через сайт и официальные сообщества банка в соцсетях. Еще мы делали рассылку с предложением сыграть в "Сам себе банкир" клиентам и сотрудникам нашего банка», - отмечает она.

По словам Бурак, таким образом банк решает сразу несколько важных задач: привлекает интерес к бренду, повышает информированность и финансовую грамотность игроков, а также вовлекает их в игровой процесс.


Мария Бурак директор департамента маркетинга и маркетинговых коммуникаций банка «Хоум Кредит»

У нас не было задачи рекламировать продукты банка. Мы хотели поменять отношение людей к банковскому бизнесу в целом - рассказать о целях и задачах, объяснить, как банки достигают своих результатов. Это больше относится к имиджевой стороне вопроса, чем к продажам продуктов.

Идея, модель, визуальная концепция игры - все было придумано и разработано внутри банка. Привлеченное агентство только нарисовало и запрограммировало квест. Прототипом создания онлайн-квеста стала настольная игра-тренинг, также созданная сотрудниками нашего банка.

Она тоже называется «Сам себе банкир». Ее игровая механика гораздо сложнее: играть нужно командами в несколько раундов. Полное прохождение настольной игры-тренинга занимает от нескольких часов до целого дня. В онлайн-версии добиться результата можно гораздо быстрее: за несколько минут. Стоит отметить, что внутри игры мы никак не продвигаем продукты банка «Хоум Кредит».

Кстати, за время существования игры у нее появились и собственные рекордсмены. Игру можно проходить неограниченное количество раз. Один человек сыграл 127 раз, получал и прибыль, и убыток. Он установил абсолютный рекорд - 42 209 768 000 рублей, который пока не побит, хотя несколько человек смогли приблизиться к нему вплотную и «заработали» 42 135 451 000 рублей.

В этой статье я поделюсь с вами нашим опытом решения интересной аналитической задачи с помощью нестандартных визуальных инструментов. Статья будет интересна людям, занимающимся анализом данных, а также банковским менеджерам, которые специализируются на мониторинге и анализе кредитного портфеля банка.

Приложение, про которое, собственно, буду писать ниже, выполнено на базе платформы iDVP (Interactive Data Visualization Platform).

Итак, начнем!

Задача, которую мы решали и которую я собираюсь описать в этой статье, была сформулирована следующим образом:
Банк выдает кредиты крупным юридическим лицам – заемщикам. Количество крупных заемщиков в один момент времени не превышает 1 000. Руководству банка необходим удобный инструмент, с помощью которого можно было бы видеть (выполнять мониторинг) целостную картину кредитного портфеля банка. При этом должна быть возможность переходить от взгляда на кредитный портфель в целом до детальной информации по каждому из заемщиков.

В каких условиях находится руководитель и что ему необходимо?
  1. Руководство хочет тратить минимум усилий на работу с приложением, на трактовку визуальной информации, на анализ данных.
  2. Руководство хочет видеть состояние кредитного портфеля сразу, просто открыв приложение, не совершая ни одного клика мышью.
  3. Информация должна быть представлена «максимально» - на одном экране, без необходимости скроллинга. Уже на первом экране пользователь должен увидеть, какие заемщики «проблемные», насколько «проблемные» и какова их доля в портфеле в количественном и стоимостном выражении.
  4. Инструменты фильтрации и группировки данных должны быть удобными и интуитивно понятными.
  5. Экраны приложения должны быть «красивыми», чтобы руководство с помощью него могло «эффектно» презентовать свои отчеты перед учредителями и акционерами.
Аналитики банков, а также вендоры BI-инструментов пытаются создать решения, которые соответствовали бы всем указанным требованиям, но не все требования удается выполнить в полной мере, и в итоге созданные программные решения не всегда нравятся руководству. Мы решили пойти своим путем и спроектировать такое решение, которое удовлетворяло бы всем требованиям с максимально возможным качеством.

О нашем подходе к задачам по анализу данных я уже рассказывал в предыдущей статье, если есть желание – можете ее почитать .

Основные тезисы этой статьи

  1. При обследовании заказчика мы всегда стараемся выявить ту боль (проблему) заказчика, которую можно решить с помощью анализа данных. И создаем такое приложение, которое полностью решает эту проблему.
  2. Для анализа данных мы используем не «обычные» BI-отчеты, а трехмерные приложения. В этих приложениях визуализация аналитической информации выполняется в виде 3D-объектов, объединенных в тематические интерактивные сцены (экранные формы), связанные между собой логическими переходами.
  3. Создаваемые нами решения имеют в своем фундаменте три принципа:
  • Наглядное представление картины бизнеса заказчика. Уже при первом знакомстве с приложением, на первом же экране, пользователь должен увидеть все интересующие его части своего бизнеса.
  • Раскрытие причин проблемы. Выбрав проблемную точку, пользователь должен иметь возможность воспользоваться функцией drill down, которая позволяет провалиться глубже в проблемную зону, и на следующих экранных формах увидеть причины возникновения проблем.
  • Техническая эстетика. Приложение должно вызывать wow-эффект, т.е. должно быть привлекательным, интуитивно понятным и удобным.
Эти принципы, по нашему убеждению, должны занимать равноправную позицию при формировании требований к решению, наряду с функциональными требованиями.
Именно в соответствии с перечисленными тезисами прошлой статьи мы и приступили к созданию нашего решения.

Напомню наши этапы проектирования приложений:

  1. Постановка задачи и начало работы;
  2. Обследование заказчика и работа с открытыми источниками;
  3. Анализ, формирование требований и документирование;
  4. Формирование итогового документа «Описание приложения».
Дальнейшее описание структурировано по этим этапам.

Постановка задачи и начало работы

В рамках этого этапа совместно со специалистами банка мы определили, что главная «боль» заказчика заключается в отслеживании состояния кредитного портфеля, при этом должна быть возможность drill down до конкретного заемщика.

Естественно, приложение должно удовлетворять всем специфическим требованиям руководства банка, перечисленным выше.

Обследование заказчика и работа с открытыми источниками

В ходе обследования была получена следующая картина данного направления бизнеса банка.
Основной заработок большинства банков состоит в предоставлении кредитов компаниям и населению.

Некоторые банки специализируется на кредитовании населения, другие на кредитовании юридических лиц.

В данном банке особенно остро стояла задача мониторинга кредитов, которые выдаются крупным компаниям-заемщикам. Компании-заемщики относятся к различным отраслям промышленности, в связи с этим необходим анализ портфеля как по компаниям, так и по отраслям промышленности.

В банке на каждого заемщика составляется и постоянно обновляется его профиль, в котором содержится информация о надежности заемщика, о его финансовых показателях.

Аналитики банка также собирают информацию о движение денежных средств (cash flow) заемщика и другие показатели, строят cash flow – модели. Информация собирается из нескольких информационных систем банка.

По итогам анализа собранной информации производится выявление проблем у заемщика и отнесение заемщика к одной из 5-ти «зон проблемности», используемых в банке для группировки заемщиков:

  1. Зеленая зона – к этой зоне относят заемщика, у которого не выявлено проблем, которые могут повлиять на возврат кредита;
  2. Желтая зона – у заемщика выявлены некоторые проблемы;
  3. Красная зона – у заемщика выявлены существенные проблемы;
  4. Черная зона – заемщик с вероятностью, близкой к 100 процентам, не выплатит кредит;
  5. Белая зона – проблемность заемщика еще не рассчитана.
В зависимости от проблемности заемщика банк обязан размещать на специальных счетах резервы на возможные потери, сумма которых зависит от суммы кредита и надежности заемщика. В связи с этим необходимо контролировать размер этих резервов и не допускать их разрастания, т.к. резерв – это «мертвые» для банка деньги, которыми он не может пользоваться.

Также аналитики банка выполняют анализ просроченной задолженности заемщика (NPL – Non-performing loans). По итогам анализа заемщика относят к одной из 4-х зон NPL:

  1. Зеленая зона - выплаты по кредиту заемщиком не просрочены или просрочены на срок до 4-х дней;
  2. Желтая зона – просрочка составляет от 5 до 29 дней;
  3. Красная зона - от 30 до 89 дней;
  4. Черная зона - от 90 дней и выше.
В результате рассмотрения всех показателей заемщика, банк рассчитывает его суммарный рейтинг, который показывает, насколько данный заемщик надежен.

По каждому кредиту отслеживается своевременность платежей и выполнение других условий кредитного договора.

В случае просрочки очередного платежа банк выясняет причины просрочки и предпринимает действия в отношении компании-заемщика. Это могут быть штрафы или ужесточения условий кредитного договора.

В кредитных договорах также указываются «ковенанты» - это специальные условия договора, которые запрещают компании-заемщику предпринимать действия, отрицательно влияющие на возможность заемщика выплачивать кредит. Примерами ковенантов являются: обязанность заемщика предоставлять в банк финансовую отчетность, закрытие счетов в других банках, запрет на получение кредитов в других банках, предоставление залогового обеспечения кредита.

Анализ, формирование требований и документирование

Основными функциями приложения, обеспечивающими мониторинг этой предметной области, были: контроль объемов кредитов, надежности или проблемности заемщиков, а также других показателей.

Чем больше «плохих» кредитов в денежном выражении у банка, тем хуже качество кредитного портфеля. Поэтому руководству банка необходимо сразу видеть «плохие» кредиты и «плохих» заемщиков, иметь возможность посмотреть подробную ситуацию по проблемному заемщику и принять решение по дальнейшим действиям в его отношении.

Мы решили, что работа пользователя-руководителя с приложением в итоге должна быть похожа на игру «найди проблемного заемщика и выясни, в чем его проблема».

Также, чтобы приложение было удобным для руководства банка, мы решили сделать не только десктопную версию для Windows, но и для Mac OS, iOS и Android. Тем более, что платформа, на которой мы разрабатываем эти приложения, позволяет это делать, что называется, «в одно касание».

По итогам анализа были определены следующие показатели, которые необходимо отслеживать по каждому заемщику:

  1. Объем задолженности
  2. Зона проблемности
  3. Зона NPL
  4. Сумма резерва
  5. Рейтинг заемщика
Приложение должно позволять пользователю:
  1. Увидеть всех заемщиков на одном экране; при этом необходимо помнить, что одновременно банк обслуживает до 1000 крупных заемщиков;
  2. Отфильтровать заемщиков по объему задолженности;
  3. Отфильтровать заемщиков по зонам проблемности;
  4. Отфильтровать заемщиков по зонам NPL;
  5. Отфильтровать заемщиков по филиалам банка, выдавшим им кредиты;
  6. Отфильтровать заемщиков по отраслям промышленности;
  7. Отфильтровать заемщиков по проблемностям, выявленным у них.
Попробуйте представить себе отчет (или несколько отчетов), которые будут соответствовать этим требованиям, а также требованиям, указанным в самом начале статьи. Представили? А теперь я предлагаю вам ознакомиться с нашим решением.

Как я уже говорил выше, удобству и красоте приложения у нас отводится очень большое значение. Поэтому к работе над экранами приложения привлекаются не только аналитики, но и 3D-дизайнеры, и юзабилисты.

В результате у нас получился вот такой главный экран приложения iDVP.Банки.Кредитные процессы (см. рисунок ниже).

С первого взгляда экран кажется довольно насыщенным, но при этом вся информация распределена по зонам, что облегчает восприятие. Какие же зоны получились в итоге?

В этой зоне в виде разноцветных планет (шаров) представлены заемщики банка. Размер планеты соответствует объему задолженности по кредиту у данного заемщика. Цвет планеты соответствует зоне проблемности заемщика. При этом заемщики одного цвета сгруппированы вместе, чтобы можно было визуально оценить их долю (количественно и по сумме задолженности) в кредитном портфеле. Таким образом, мы решили задачу «увидеть всех заемщиков на одном экране».

В этой же зоне присутствует фильтр по размеру планет (обратите внимание на шкалу и круг, расположенные справа от планет). С помощью этого фильтра можно указать минимальный и максимальный размер задолженности для отображаемых заемщиков. Можно оставить на экране только крупных заемщиков, например. Задача «отфильтровать заемщиков по объему задолженности» решена.

При клике на любой планете происходит переход к экрану «Карточка заемщика» (см. картинку ниже), на нем представлена детальная информация по показателям, характеризующим этого заемщика и его кредит.

Задача «переход от общей картины кредитного портфеля к конкретному заемщику" для разбора ситуации должен производиться с минимальным количеством кликов» решена.

В начальном состоянии экрана планеты малого размера не всегда удобно кликать – в них просто трудно попасть мышью илив случае с touch-интерфейсами - пальцем. Чтобы компенсировать эту трудность, в центральной зоне имеется возможность приблизить и отдалить (zoom-in и zoom-out) любую часть планетной системы. Это делается либо с помощью колеса мыши, либо, если используется touch-экран, с помощью действия «pinch».

В этой зоне содержится фильтр по цветовым зонам проблемности заемщиков. Можно нащелкать/отщелкать нужные/ненужные зоны проблемности. В результате в центральной зоне останутся только планеты-заемщики нужных пользователю цветов. Задача «отфильтровать заемщиков по зонам проблемности», «отфильтровать заемщиков по зонам NPL» решена. Внимательный читатель наверняка спросит, как мы фильтруем заемщиков по зонам NPL с помощью этого инструмента, ведь он фильтрует только зоны проблемности. Все просто: в верхней левой части экрана присутствует текст «ОСТАТОК ЗАДОЛЖЕННОСТИ» – это, на самом деле, выпадающий список выбора режимов отображения заемщиков. Для выбора доступны следующие режимы:

  1. ОСТАТОК ЗАДОЛЖЕННОСТИ – в этом режиме размер планет определяется размером задолженности, а цвет планет – зоной проблемности;
  2. ОБЪЕМ NPL – в этом режиме размер планет определяется размером просроченной задолженности, а цвет планет – зоной NPL;
  3. РЕЗЕРВ – в этом режиме размер планет определяется размером резерва, а цвет планет – зоной проблемности;
  4. РЕЙТИНГ – в этом режиме размер планет определяется значением рейтинга, а цвет планет – зоной проблемности.
Вот в режиме «Объем NPL» фильтр слева и становится фильтром по цветовым зонам NPL.

Зона фильтров справа


В этой зоне содержится элемент фильтрации «аккордеон», в котором содержится три фильтра:

  1. ЦА+ТБ (центальный аппарат + территориальные банки) – с помощь этого фильтра можно оставить на экране только заемщиков, кредиты которым выдал центральный аппарат (головной офис банка) или территориальные банки (филиалы).
  2. ОТРАСЛИ – позволяет фильтровать заемщиков определенных отраслей промышленности.
  3. ПРОБЛЕМНОСТИ – этот фильтр позволяет оставить на экране только тех заемщиков, у которых аналитиками банка были выявлены те или иные проблемности.
Особенностью элемента «аккордеон» является то, что в один момент времени развернут только один фильтр (на эскизе развернут фильтр «ПРОБЛЕМНОСТИ»). Остальные фильтры при этом находятся в свернутом состоянии.

Задача «отфильтровать заемщиков по филиалам банка, по отраслям промышленности, по проблемностям» решена.

Зона нижнего графика


В этой зоне размещен график, в котором отображается изменение соотношения зон проблемности или зон NPL во времени. Для этого используется тип графика «линейный график с накоплением». Цвета графика соответствуют зонам проблемности или зонам NPL.

Пользователь имеет возможность установить ползунок на любую дату на графике, и в центральной зоне отобразятся только те заемщики, которые были у банка на тот момент. Размеры планет и их цвета будут соответствовать тому объему задолженности и той зоне проблемности, которые были у каждого заемщика на выбранную дату.

Ниже прикрепляю остальные экраны приложения: эскизы и названия. А у вас будет возможность их изучить, проанализировать самостоятельно. Если будут вопросы по содержимому – задавайте их в комментариях, обязательно отвечу.


Главный экран с включенным отображением круговой диаграммы распределения цветовых зон проблемности


Главный экран с отфильтрованными по объему задолженности заемщиками (на шкале слева от планет нижняя граница отображения установлена на уровне 20% от максимума)


Главный экран. Приближение планет (zoom-in)


Карточка заемщика

Продвижение банковских продуктов и формирование потребности в них.

“ Геймификация – один из самых популярных на данный момент в маркетинге трендов. И нам, как банку с активной и продвинутой аудиторией, было логично его поддержать, предложив клиентам акцию, где игровая механика реализована на должном технологическом уровне и в значительной степени персонифицирована.”
— Кирилл Бобров, вице-президент Тинькофф Банка по привлечению клиентов

В результате, многие пользователи получают первый опыт заработка процента на деньгах, которые просто лежат в банке. Клиенты на собственном опыте понимают, что накопительный счет – это простой и выгодный продукт. А это - первый шаг к открытию депозита или вклада, и к расширению представления о банковских продуктах в целом.

Косвенным результатом также является регулярное использование пользователем онлайн-банка, так как только там можно увидеть свой прогресс.

Причем, результат достигается косвенно с помощью игровых механик, подается в виде истории про активный образ жизни, что намного интереснее определенной аудитории, чем возможность копить и получать проценты (это предлагает любой банк) или призыв пользоваться онлайн-банком.

“ Геймификация - это супер тема. Это всё - вовлечение. Скучно делать транзакции в банке, скучно пользоваться банковскими продуктами. А люди любят конкурировать, люди любят соперничать. Это сидит внутри и очень глубоко. И можно эксплуатировать эти качества людей. Как это сделать в банке? Кейсов мало. Но моё глубокое убеждение - тот, кто научится активно вовлекать своих клиентов, в том числе используя геймификацию, тот cможет заработать много денег.”
— Иван Пятков, Директор департамента дистанционного обслуживания и продаж Банка Москвы
  • Повышение финансовой грамотности пользователей, чтобы упростить восприятие сложных банковских продуктов: депозитов, инвестиций и т.д.
  • Типичные подходы:

    1. Программы лояльности с начислением баллов, миль и кеш-бека в качестве наград.
    2. Интерактивное контекстное обучение новым функциям. Велком-сценарии.
    3. Квесты и конкурсы для клиентов.
    4. Создание простых полезных сервисов с элементами игры: PFM, накопление на цели.
    5. Вирусные промо-игры, сообщающие о новых продуктах в развлекающей форме.

    На прошедшем в пятницу первом форуме FinMachine директор департамента моделирования рисков Сбербанка Максим Еременко и глава R&D в области Data Science Андрей Черток рассказали как в крупнейшем банке страны с помощью машинного обучения среди прочего генерируют исковые заявления и находят бизнес-парнеров своим клиентам.

    Кейс 1. Умные советы: генерация на основе анализа карточных транзакций клиентов
    Максим Еременко : На данный момент мы вполтную подошли к проблеме детектирования и последующего прогноза паттернов поведения владельцев карт. Анализируя активность кардхолдеров, мы эти паттерны научились определять.

    Андрей Черток : В рамках участия в одном из проектов банка мы детектируем паттерны поведения клиентов банка по его транзакциям. Первые модели были связаны с дескриптивным анализом транзакционного поведения. Например, у клиента не было покупок, связанных с авто - они появились. Значит, он купил машину, и теперь можно, например, предлагать такому клиенту продукты или услуги, полезные для автовладельцев.

    Следующая задача - предсказывать те или иные события, в том числе сам факт покупки. В дополнение к паттернам, с появлением тех или иных MCC-кодов становится возможным вытаскивать из данных достаточно интересные истории, в том числе связанные с накопительной деятельностью владельцев карт. То есть мы видим, кто из клиентов банка копит деньги и предупреждаем те или иные крупные покупки. Это может значительно усиливать модели. Банк может дать больший спектр предложений. Вместе с тем это означает, что такие модели должны постоянно адаптироваться.

    На слайде мы видим три достаточно понятных кейса: покупка авто, ремонт в квартире/покупка мебели и затраты на лечение. Особенно ценно, если от клиента возможна обратная связь по предлагаемым ему продуктам. Потому необходимо делать модели, способные учитывать эту обратную связь. Во многом это тот же принцип, что лежит в основе моделей reinforcement learning, которые мы сейчас начинаем разрабатывать.

    Reinforcement learning или обучение с подкреплением, которое сейчас развивают, в том числе, OpenAI и DeepMind - это предвестник ИИ, каким его хотят видеть. В систему заранее не закладывают какой-либо модели мира, и о нем система фактически ничего не знает. Система начинает взаимодействовать с миром, получать обратную связь, так называемые reward’ы. После чего система корректирует свое поведение на основании того, насколько хорошие или плохие reward’ы получены. В случае с банковскими продутками reward - это, например, то, насколько интересным или неинтересным для клиентов оказывается то или иное предложение банка.

    Используя методы с определенными свойствами, обеспечивающими применение reinforcement learning, мы можем адаптировать эти алгоритмы в режиме реального времени. Из новых подходов можно ещё отметить, что буквально недавно в Nature выходила статья того же DeepMind, где они рассказывают о том, как в нейросеть внедрили элементы машины Тьюринга. В результате нейросеть получила возможность обладать памятью, которой нейросетям на данном этапе не хватает.

    Кейс 2. Оптимизация воронки продаж
    Андрей Черток : В этом кейсе мы анализируем транзакционную активность, ищем кластеры клиентов с определенными паттернами поведения. Но в этом случае не связываем их с предсказанием каких-либо событий. Мы, например, можем найти клиентов, которые часто совершают перелеты, поездки за границу и часто конвертируют валюты. Исходя из этого, эффективнее делаем предложения таким клиентам.

    На слайдах показано, какие паттерны мы можем находить и какие продукты в этом случае можем предлагать. В целом понятная история - здесь предполагаются определенные методы, связанные с кластеризацией. Проекция данных, например.

    Кейс 3. Оптимизация наличного денежного обращения
    Андрей Черток :Сбербанк имеет широкую сеть банкоматов, отделений, и схему по работе с корпоративными клиентами. Соответственно, возникает задача спрогнозировать завтрашний спрос на наличность. Чем точнее мы сделаем этот прогноз, тем, скажем так, аккуратнее сможем распределить эти деньги. С одной стороны, важно, чтобы деньги не лежали без дела в банкоматах, а вместо этого мы могли разместить их на краткосрочном депозите. С другой стороны, мы стремимся избежать репутационных потерь - деньги заканчиваются раньше, чем планировалось, и банкомат перестает работать, а клиент остается недовольным.

    Здесь нужны модели, способные работать с несимметричными ошибками. Первые модели очень простые и основаны на классических методах анализа временных рядов, связанных с их сглаживанием. Сейчас же требуются более точные подходы и уже активно используются методы машинного обучения. Естественно подобные методы должны быть адаптивными, так как спрос зависит как от макроэкономических факторов, так и от таких параметров, как расположение банкоматов в городе и прогноза погоды. Объединение разнородных фич дает более существенный результат, чем использование прочих моделей машинного обучения.

    Кейс 4. Моделирование вероятности дефолта для малого бизнеса в режиме реального времени
    Максим Еременко : В 2014 году все говорили по Big Data. В 2015 году disruptive и on the edge стало машинное обучение. В этом году главным трендом было глубинное обучение. В следующем году, очевидно, будут говорить про reinforcement learning.

    В отличие от трех предыдущих трендов, reinforcement learning легко попробовать на открытых платформах. Open artificial intelligence, финансируемая Элоном Маском, и платформа DeepMind обучаются на компьютерных играх с помощью открытыго API по которому можно влезть в код игры.

    Мы получаем битву двух алгоритмов. Если в 80-90-х мы играли в Пакмена, то теперь машина управляет им и этот алгоритм можно модифицировать. DeepMind по этому пути пошли несколько дальше и совместно с Blizzard построили алгоритм для StarCraft.яя

    Алгоритмы тренируют таким образом, чтобы рационализировать их для вполне прикладных задач. В дальнейшем их можно будет эффективно натравливать на задачи, связанные, к примеру, с переводом текстовой информацией в вектора.

    Подобные задачи - это основа движка Google Word2vec, осуществляющий перевод из текстовой информации в вектор, поиск и весь семантический разбор текста, на котором он базируется.

    Но сам кейс немного о другом. Мы просмотрели активных клиентов нашего портфеля в сегментах B2B и B2C, обращая особенное внимание на представителей малого бизнеса, активно обменивающихся платежами. И при работе с ними попробовали отказаться от классического кредитного скоринга, от анализа финансовой отчетности и проведения качественной экспертизы рисков относительно репутации бенефициара, менеджеров и тому подобных параметров. Вместо этого мы начали использовать некую агрегированную метрику, опираясь исключительно на транзакции, - по сути, делать аналитический скоринг, на основе данных, имеющихся в распоряжении банка.

    В результате выяснилось, что модель, базирующаяся на кредитном скоринге, ранжирующем клиентов по вероятности дефолта, практически ничем не отличается по количественной метрике точности от классических моделей. Gini у нее практически такой же на уровне 60-65%. Но если собственную информацию банка обогатить внешними данными, скажем, из соцсетей и использовать их для ранжирования, то можно дополнительно повысить точность.

    На практике это означает, что не надо тратить время на оценку рисков с точки зрения классического анализа. Можно обработать те данные, которые есть в системе, и получить статистически столь же релевантную метрику качества.

    Такую модель сейчас можно использовать только для формирования перечня предодобренных предложений. Если же клиент говорит: «ок, я согласен», - то процесс более сложный. Со временем, если мы увидим, что качество потока сохранялось на текущем или более высоком уровне, а модель покажет более предсказательную точность, то ее можно будет использовать как некую альтернативу.

    Кейс 5. Natural Language Processing алгоритмы для анализа и генерации исковых заявлений
    Максим Еременко : В рамках применения инструментов работы с текстом или Natural Language Processing мы столкнулись с тем, что Сбербанк достаточно большое количество человеческих и временных ресурсов тратит на анализ исковых заявлений и подготовку ответной части. Вместе с тем разбор большей часть информации истцов, и самих исковых заявлений в адрес Сбербанка, можно автоматизировать. Не использовать труд людей, которые вбивают информацию о паспортных данных в резолютивной части искового заявления, а можно все это: дату рождения, паспортные данные, реквизиты и резолютивную часть экстрагировать. На втором этапе, для подготовки ответной части исков, в качестве оптимизации мы предложили использовать определенный шаблон.

    Кейс 6. Определение B2 B- и B2 B-цепочек
    Максим Еременко : Для активных B2B-пользователей можно делать не только оценку кредитного риска, но и подбирать типовые паттерны его партнера. Если мы видим в портфеле компании со схожей профилем экономической деятельности, при этом обе относятся примерно к одной и той же когорте, то есть это не крупный инвестиционный и малый бизнесы, то мы, основываясь на этих паттернах, подбираем партнеров и рекомендуем какие именно отношения могут быть им интересны.

    Кейс 7. Алгоритмы для чатбота @SberbankML_Bot
    Максим Еременко : Наш чат-бот пока только учится, но какие-то вещи, которые уже многие умеют делать, например, проброс через API, к открытым источникам типа «Википедии», он также выполняет. Если вы спросите его, кто такой Греф или Путин, он ответит.

    У нас есть внутреннее обязательство перед нашими боссами, что к лету 2017 года бот будет в состоянии вести беседу на банковскую тематику, плюс будет иметь базовые когнитивные способности и сможет поддерживать общение на отвлеченные темы. На данный момент бот базируется в Telegram, но мы уже ведем разработку собственного мессенджера [куда он будет перемещен].



    Кейс 8. Наши алгоритмы могут не только самообучаться, но и писать стихи
    Максим Еременко: Это более развлекательный проект. Мы взяли рекуррентную нейронную сеть, основанную на стихах Пушкина, Лермонтова и немного на Jira-чате самих разработчиков, и обучили систему писать стихи. Сначала она не хорошо справлялась даже с четырехстопным ямбом, но потом даже рифма стала появляться есть. Сейчас ему удается писать стихи даже про Сбербанк.