Речевые
технологии


Распознавание голоса, анализ и синтез речи, голосовая биометрия, извлечение информации,
синтез текстов, анализ тональности, вопросно-ответные системы

Что такое речевые технологии?

Речевые технологии – это прежде все набор методов, которые решают задачи анализа аудиосигнала, содержащего человеческую речь. Эти методы позволяют работать с аналоговым и цифровым сигналом и анализировать, содержащиеся в них данные.

В широком смысле источниками сигналов для обработки могут быть данные, которые собираются в цифровом канале 16kHz (например, микрофон мобильного телефона) или аналоговым (телефонном) канале 8kHz.

Бизнес все чаще обращает внимание на информацию, которые можно получить благодаря анализу этих данных, это могут быть обращения в колл-центр, аудио дорожек из видео или телепередач, работа с музыкой и т.д.

караоке

Задачи, которые решают речевые технологии

Распознавание голоса

Автоматический процесс преобразования голоса в цифровую информацию, например в текст. Это задача ASR/STT, например, для транскрибации звонков отдела продаж в текстовый документ для анализа

Синтез речи

Процесс преобразования цифрового текста в его голосовой вариант (задача обратная распознаванию речи), данная задача может быть использовано для автоматической озвучки статей или книг в формат подкаста

Анализ речи

Алгоритмы анализа речи используют для понимание эмоционального состояния говорящего, правильность работы сотрудника контакт-центра (перебивание, молчание, слова “паразиты”). Пример работы системы -- автоматическая проверка сотрудников колл-центра службы доставки сети ресторанов на соблюдение "скрипта" при общении с клиентом во время заказа

Верификация и идентификация по голосу

Данные сервисы голосовой биометрии широко распространены в сфере обеспечения безопасности, например для подтверждения доступа в банковское приложение. Верификация - это сравнение эталонного отпечатка голоса со спикером, например для разблокировки телефона, а идентификация - процесс, когда с помощью голоса определяется человек из базы отпечатков

Антифрод

Сервис, вытекающий из задач безопасности. Главная задача алгоритма -- противодействие мошенническим действия. Пример работы антифрод системы: допустим банк имеет базу голосов мошенников. Когда мошенник пытается завладеть данными пользователя, его голос идентифицируются как голос мошенника и службе безопасности подается сигнал

Антиспуфинг

Также сервис, решающий задачи безопасности. Это инструмент для предотвращения несанкционированного использования голоса, использование поддельного (синтезированного голоса) или использование голоса записанного заранее. Подобные решения выявляют подозрительные сигналы и передают оповещение системе безопасности
industry single

Область применения технологии

Использование речевых технологий весьма обширно и все больше и больше отраслей пользуются новыми возможностями. Основная группа задач речевых технологий связана с безопасностью.

Голосовая биометрия активно используется в банковской сфере, предприятиями обеспечивающих безопасность (контроль доступа на режимные объекты), в последнее время набирают популярность решения для маркетинга, например, голосовые чат-бот, голосовые помощники, анализ информации полученной их контакт-центров при общении с клиентами. 

Estesis - призер профильных конкурсов

ASVspoof 2019

Модуль анти-спуфинга вошел в топ-10 международного профессионального конкурса в области анализа данных (верификации речи), организованного ведущими университетами мира (Япония, Сингапур, Франция, Финляндия и т.д.).

SdSV Challenge 2020

Решение по верификации дикторов по коротким фразам стало одним из лучших в международном профессиональном конкурсе в области анализа данных, организованном ведущими университетами мира (Сингапур, Канада).

Программа СТАРТ

Досрочное завершение программы СТАРТ-1. Выполнены все технические требования к инновационному продукту в области голосовой биометрии. Успешно получено финансирование в рамках второго этапа программы «Страт».

Конкурс инновационных проектов НТИ-2018

Победа в конкурсе НТИ-2018 с проектом верификации пользователей с помощью голосовой биометрии.

Акселерационная программа ФРИИ и банка УБРИР

Продукт Estesis Voice ID - Голосовая биометрическая платформа вошла в 11 лучших проектов из 400 заявленных

Open Data Science Organized Award 2019

Участник крупнейшего комьюнити в области машинного обучения и призер премии Organized Award

Проекты

Разработка интеллектуальных систем для решения Ваших задач

Заполните форму и менеджер проконсультирует о том как реализовать проект. Ваша идея для нас ценность, а партнерство превращается в дружбу

    Заполните форму для связи с нами

    В течении суток с Вами свяжется менеджер