Любому бизнесу необходимы надежные и безопасные инструменты, которые позволят оптимизировать процессы и одновременно повысят лояльность клиентов. Какие решения уже сегодня помогают банку обрабатывать сотни тысяч звонков ежедневно, что находится «под капотом» у виртуальных ассистентов Салют и какое будущее ожидает эти технологии, «Ленте.ру» рассказал Денис Афанасьев, директор дивизиона В2В-продуктов Салют Сбербанка.
В марте 2022 года Сбер поставил абсолютный рекорд — принял более одного миллиона клиентских звонков за день. Какие технологические решения способствовали достижению таких результатов?
Пандемия уже сформировала у людей привычку решать вопросы дистанционно, поэтому многие наши клиенты в первую очередь обращаются в контакт-центр банка. На помощь нашим операторам приходит голосовой помощник Сбера, в основе которого лежат две технологические платформы. Платформа речевых сервисов SmartSpeech, обеспечивающая распознавание речи в телефонии, а также платформа процессинга естественного языка SmartNLP, которая, зная контекст, в котором сейчас находится пользователь, определяет его потребности и выбирает релевантный навык ассистента, решающий поставленную задачу. Для определения потребности пользователя внутри платформы происходит семантический анализ запроса, в том числе с помощью нейронных сетей. Платформы являются частью наших виртуальных ассистентов Салют и размещены на нашем портале SmartMarket.
Получается, что виртуальные ассистенты уже стали одним из ключевых инструментов общения с клиентами. Насколько они продвинулись вперед с точки зрения технологий и понимания клиента?
Семейство виртуальных ассистентов Салют состоит из трех персонажей, каждый из которых имеет свой характер. По номеру 900 вам отвечает виртуальный ассистент Афина, а в других сервисах вы можете общаться еще с Джой и Сбером. Ассистенты доступны как в мобильных приложениях СберБанк Онлайн и Салют, так и в смарт-устройствах Sber, равно как и в устройствах под управлением операционной системы Салют ТВ. Их общая задача заключается в том, чтобы помогать пользователям самым удобным и простым способом использовать все возможности сервисов Сбера.
Разумеется, мы постоянно работаем над развитием ассистентов, дообучаем их модели, экспериментируем с новыми архитектурами нейронных сетей. Обучение виртуальных ассистентов проходит сразу по двум осям: полезности и эмпатичности.
Ось полезности, или IQ — это как раз то, что мы привыкли называть навыками ассистентов: они могут перевести деньги, сообщить баланс карты или адрес ближайшего банкомата и так далее. Ассистенты постоянно учатся новому, чтобы решать все больше задач наших клиентов.
Ось эмпатичности — это эмоциональный интеллект, или EQ. Мы работаем над тем, чтобы ассистент был не только полезным, но и эмпатичным. В этом нам помогают нейросети. Джой и Афина стали первыми в России виртуальными ассистентами, которые разговаривают при помощи генеративной модели естественного языка от Сбера с 760 миллионами параметров — ruGPT-3. Это самая большая AI-модель для русского языка, которая умеет писать тексты и понимать естественную речь. Чтобы пообщаться с этой нейросетью, достаточно сказать: «Салют, давай поболтаем». Переход к использованию новой нейросетевой модели позволил ассистентам лучше понимать пользователей, давать оригинальные и неожиданные ответы на самые разные запросы.
А вот если предложить поболтать третьему ассистенту семейства Салют — Сберу, то ответит другая современная языковая модель, основанная на архитектуре SBERT. У нее иной принцип действия: она не генерирует ответную реплику, а использует огромную базу заранее заготовленных фраз, из которой выбирает самую подходящую.
Идентифицировать эмоции пользователей ассистентам помогает и технология распознавания речи SmartSpeech. Для каждого произнесенного предложения она распознает три эмоции — нейтральную, позитивную и негативную. Модель определяет вид эмоции одновременно с содержанием речи.
И все-таки как ассистентам удается настолько хорошо понимать речь человека?
Виртуальные ассистенты понимают людей благодаря качественному распознаванию речи в телефонном канале, которое обеспечивает как раз платформа речевых сервисов SmartSpeech, а точнее — технология Automatic Speech Recognition (ASR), лежащая в ее основе. Она позволяет фильтровать фоновые шумы, определять конец высказывания и эмоции спикера. В ней также предусмотрены подсказки, которые помогают правильно понять речь пользователя в определенный момент и ускорить реакцию системы.
И, конечно, огромную роль играет тот факт, что SmartSpeech — один самых быстрых сервисов речевых технологий на рынке. А именно скорость важнее всего, когда данные поступают потоково, как в случае контакт-центров.
Какие технологии, на ваш взгляд, будут востребованы в будущем?
Разработка виртуальных ассистентов стремится к тому, чтобы построить для человека так называемый ассистируемый опыт, то есть создать возможность максимально эффективно распоряжаться своим временем. Для того чтобы этого достичь, ассистенты должны быть максимально интегрируемыми: уметь встраиваться во все возможные системы пользователя и «дружить» с ними. В разработке и обучении виртуальных ассистентов важно использовать диалоговую модель, ведь только тогда они смогут стать не только помощниками, но и собеседниками.
Эти факторы позволят ассистентам из пассивной фазы перейти в активную и качественно изменить взаимодействие с пользователем. Виртуальные ассистенты смогут анализировать все задачи, бизнес-процессы и даже повседневные привычки человека и на основании этого предлагать решения, избавляющие нас от рутины. Так они станут нашими двойниками и даже друзьями в цифровом мире.