ATREX.RU
Пресс релизы коммерческих компаний и общественных организаций
ATREX.RU
» Пресс релизы сегодняшнего дня
» Архив пресс-релизов
» Авторам от редакции
» Добавить пресс-релиз

Самое-самое //
Пресс-релизы // » Добавить пресс-релиз

Новая технология «Наносемантики» повышает точность распознавания голосовых запросов в 12 раз

Новая технология для определения ключевой фразы Keyword Spotter (KWS) от «Наносемантики» способна в разы улучшить работу голосового помощника. Разработка основана на нейросетевой модели KWS с архитектурой CNN-Transformer, обученной на собранных компанией датасетах общей продолжительностью более 100 часов аудио. За счет такого подхода, технология демонстрирует высокие показатели метрик точности и полноты активаций ассистента на аудио, полученных, в том числе, в шумных условиях.

Разработанная «Наносемантикой» технология KWS в связке с детектором голосовой активности - Voice Activity Detection (VAD) может повысить точность распознавания голосовых запросов и улучшить качество работы цифровых помощников - «умных» колонок и цифровых ассистентов на онлайн-платформах и в приложениях. Результаты тестирования, проведенного для коммерческого заказчика, показали, что точность распознавания ключевой фразы цифровым помощником выросла в 12 раз по сравнению с предыдущей моделью благодаря внедрению связки технологий VAD и KWS, разработанных «Наносемантикой».

Качественно лучшего результата удалось добиться за счет выбранной архитектуры модели CNN-Transformer, логики обработки потокового аудио, а также объемного и разнообразного датасета. Технология VAD может «отличить» речь человека от других шумов, после чего направить нужные отрывки со смещениями на дальнейшее распознавание моделью определения ключевой фразы - KWS.

Модель обучается определять выбранную ключевую фразу, на которую активируется цифровой помощник. Для обучения используются созвучные фразы-мимики и большое количество различных искажений (аугментаций) - они позволяют достичь устойчивости модели к помехам и похожим на ключевую фразу словам.

При разработке под ключ для повышения показателей метрик качества KWS команда сборщиков и разметчиков данных «Наносемантики» собрала базу данных аудио с записанной ключевой фразой женскими и мужскими голосами в разных вариантах: нейтрально, громко, шепотом, медленно, отвернувшись от устройства и так далее. Кроме того, делается разбивка по качеству звучания: часть аудиозаписей записывают в идеальном «студийном» качестве, другую часть – с посторонними шумами в различных помещениях и уличных условиях. Общая продолжительность данных для датасета превысила 100 часов.

VAD и KWS почти не разряжают батарею, а также могут быть запущены на большинстве смартфонов, в том числе оффлайн, за счет своего небольшого объема - вес VAD на базе модели CNN BilSTM составляет 0,5 МБ, а KWS - 4 МБ.

«За счет качественной работы с данными и использования оптимальных нейросетевых архитектур связка модулей VAD и KWS ‘’Наносемантики’’ способна существенно улучшить качество работы ассистента в распознавании ключевой фразы, что важно для активации голосовых помощников. Это популярное решение интегрируют в приложения и платформы во всех сегментах – от ритейла до банков, а также используют самостоятельно в ‘’умных’’ колонках. От точности работы технологии KWS зависит, насколько хорошо вас будет ‘’понимать’’ голосовой помощник, включаясь в тот момент, когда вы его действительно об этом просили», - комментирует Павел Сухачев, директор по Data Science компании «Наносемантика».

Справка:
«Наносемантика» — ведущий российский производитель решений и продуктов на основе нейросетей. За 18 лет на рынке ИТ-компания разработала более 12 собственных интеллектуальных продуктов и платформ, реализовала свыше 130 проектов для бизнеса. Команда из научных сотрудников и разработчиков обладает обширной базой знаний и практик в области машинного обучения.

Контактное лицо: Татьяна Алексеева (написать письмо автору)
Компания: Наносемантика (все новости этой организации)
Добавлен: 22:17, 14.11.2023
Количество просмотров: 248
Страна: Россия

В Utrace Analytics расширены функции определения фармролей, Utrace, 22:45, 23.06.2025, Россия
163
Utrace, российский разработчик решений для управления цифровой маркировкой, расширил функциональность облачной платформы Utrace Analytics. Теперь пользователям доступна функция более точного определения и группировки фармролей.


N3.Health организовала «Цифровой диалог» разработчиков медицинских информационных систем, Нетрика, 22:41, 23.06.2025, Россия
160
5 июня 2025 года компания «ЭлНетМед», разработчик платформы N3.Health, провела в Санкт-Петербурге первую собственную конференцию-воркшоп «Цифровой диалог» для разработчиков информационных систем для медицинского бизнеса


НКК представила концепцию комплексного обеспечения безопасности (КОБ) Комитету Совета Федерации по обороне и безопасности, НКК, 22:40, 23.06.2025, Россия
147
17 июня состоялось заседание Экспертного совета при Комитете Совета Федерации по обороне и безопасности на тему «Комплексное обеспечение безопасности промышленных и инфраструктурных объектов Российской Федерации» с участием представителей органов власти, научного и бизнес-сообщества.


CorpSoft24 создал систему управления контейнерным терминалом для компании «Транс Синергия», CorpSoft24, 22:39, 23.06.2025, Россия
148
Специалисты CorpSoft24 разработали и внедряют решение по управлению контейнерным терминалом на базе инструментария платформы 1С для терминально-логистического центра компании «Транс Синергия». Спроектированная система включает в себя учетную систему, гибкую систему биллинга и поддержку мобильного клиента.


«НЕКСТБИ» представляет интеграционную платформу для автоматизации и бизнес-аналитики в реальном времени, Некстби, 22:39, 23.06.2025, Россия
145
ИТ-компания «НЕКСТБИ» выводит на рынок суверенную интеграционную платформу нового поколения, совмещающую функции продуктов различных классов – ETL, BI, ERM. Решение ориентировано на цифровую трансформацию, автоматизацию бизнес-процессов и задачи импортонезависимости.


Компания «ПрограмБанк» предоставила заказчикам возможность учета самозапретов на выдачу кредита, Компания ПрограмБанк, 22:39, 23.06.2025,
146
Связанное с самозапретами обновление модуля «Кредитный конвейер» предоставляется в рамках заключенных договоров на сопровождение.


Генеральный директор «Группы Астра» предложил проработать вопрос перехода субъектов критической информационной инфраструктуры на доверенные российские ИТ-продукты, "Группа Астра", 22:13, 23.06.2025, Россия
146
Генеральный директор «Группы Астра» Илья Сивцев в ходе делового завтрака «Зрелость ИТ-отрасли: от внутренних побед к международному технологическому сотрудничеству», проведенного в рамках ПМЭФ, внес ряд предложений в законодательство, которые были поддержаны Максутом Шадаевым и экспертами отрасли.


«Билайн» и «Инфомаксимум» заключили соглашение о сотрудничестве в области генеративного искусственного интеллекта и процессной аналитики, Инфомаксимум, Вымпелком (билайн), 22:01, 23.06.2025, Россия
47
Соглашение предусматривает долгосрочное сотрудничество в области генеративного искусственного интеллекта и процессной аналитики, направленное на развитие отечественных технологий и укрепление технологического суверенитета России.


Nord Clan представил ИИ-решения для фармацевтики на стратегической сессии Ozon, Nord Clan, 21:46, 23.06.2025, Россия
97
Компания Nord Clan приняла участие в стратегической сессии, организованной Ozon и посвященной применению технологий искусственного интеллекта в фармацевтической отрасли. Мероприятие объединило ведущие компании, занимающиеся цифровизацией производственных процессов в России.


«Телфин» обновил сервис «Мониторинг» для колл-центров, Телфин, 15:20, 21.06.2025, Россия
207
Провайдер коммуникационных решений «Телфин» расширяет функциональность сервиса «Мониторинг» для колл-центров. Теперь пользователям данного решения доступны новые настройки для оценки эффективности и загруженности операторов с помощью отчетов по часам за любой день: сколько вызовов произошло в колл-центре в определенный час, и как они были обработаны.


Разделы //


Новости по странам //
Сегодня у нас публикуются //
Разработано AVart.Стуdия © 2008-2025 atrex.ru
  Rambler's Top100