Слияние данных из разных источников — технология и настоящего, и будущего

ForbesБизнес

«Цифровой след оставляют все»

Слияние данных из разных источников — технология и настоящего, и будущего. Сегодня она дает возможность работать с big data, завтра будет способствовать появлению множества новых продуктов. О том, как технология помогает в достижении бизнес-результатов и о чем будут говорить участники первой международной конференции Data Fusion — в интервью Максима Коновалихина, главы департамента анализа данных и моделирования ВТБ

Инвестиционный портфель соберет робот

— В начале марта 2021 года Министерство цифрового развития заявило о планах ужесточить требования к обороту информации, приравняв обезличенные данные к персональным. Соответственно, использовать такую информацию без согласия человека станет невозможно. Ставку на работу с обезличенными данными ВТБ делает в последние полтора года. Не придется ли что-то менять?

— Не думаю, что инициатива министерства будет реализована именно в таком формате. Если данные обезличены, какой вред они могут нанести? Не говоря о том, что просить согласия гражданина на обработку его обезличенных данных априори невозможно. Вопрос использования персональных данных действительно очень чувствительный: все мы страдаем от навязчивых звонков, предлагающих ненужные сервисы и услуги. Однако подходить к решению следует, не создавая избыточных требований, а встав на сторону и граждан, и бизнеса.

Цифровизация — повседневная реальность нашей жизни.

Нужно не игнорировать этот факт, а искать новый путь, который всех устроит.

— Как может выглядеть этот путь для ВТБ, располагающего гигантским объемом данных?

— Чем шире поле данных, тем интереснее будут результаты обработки, детальнее картина знания о клиентах и больше новых граней для партнерства. Соответственно, выше и градус интереса бизнеса. Согласно законодательству, банк не может передавать данные для обработки третьему лицу. Но и, располагая такими гигантскими массивами, не пользоваться ими было бы неправильно. Поэтому наша главная задача — найти решение, устраивающее всех участников. Концепция Data Fusion, предлагающая объединение массивов обезличенных данных и глубокую синергию в процессе машинного обучения моделей, способна решить эту задачу максимально эффективно.

— Подобный же принцип know your costumer — знай своего клиента появился на мировом рынке больше двадцати лет назад, он давно и активно используется глобальными компаниями, например, Amazon. В чем заключаются ключевые отличия технологии Data Fusion? 

— Действительно, идея Data Fusion не нова. Однако для перечисленных концепций важен сбор данных и способы регулирования этих процессов, в то время как Data Fusion не ограничивается простым объединением клиентских данных. С этого все только начинается: когда у вас есть все возможные данные, которые сегодня можно получить, «в игру» вступают алгоритмы машинного обучения. Для начала персональные данные преобразуются в обезличенные вектора, которые, что крайне важно, не поддаются расшифровке, и поэтому дальнейшая работа с ними безопасна. Преобразованные данные отлично подходят для формирования моделей. Следующий шаг — обучение моделей при помощи различных технологий, от криптографии до атипичных граф и сложных алгоритмов нейросетей. Модели могут быть помещены в разные массивы данных, не только наши, но и наших партнеров, или могут обучаться на отдельных зашифрованных фрагментах. При этом цифровые следы есть не только у физических, но и у юридических лиц, их тоже можно задействовать в алгоритмах машинного обучения.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Открыть в приложении