|
|
 |
|
|
 |
Компания BSS в 10 раз сократила требования к объему аудиоматериалов для создания нового голоса бота
Компания BSS создала новый мужской голос для интеллектуального помощника, используя аудиоматериалы общей длительностью 2 часа. Ранее необходимое количество аудио составляло не менее 15–20 часов. Голосовой робот BSS успешно консультирует клиентов максимально естественным голосом с человеческими интонациями. Новый мужской голос создан на основе голоса профессионального диктора, озвучившего необходимые для ведения диалогов с клиентами фразы. Озвучивание переменных данных (ФИО, улица, дата, номер и т.д.) производится на основе синтеза голоса этого диктора. Такой гибридный подход позволяет существенно сократить время на обучение модели, при этом обеспечить естественность, плавность и незаметность всех переходов и вставок. В процессе создания нового голоса команда BSS отобрала целевую лексику, которую использует робот при общении с абонентами в реальных проектах. Это помогло отобрать необходимые фразы и, тем самым, сократить количество используемых для обучения модели аудиоматериалов. Более того, команда подобрала специальный фонетический корпус, в котором обеспечено максимальное разнообразие трезвучий (включая редкие), что обеспечивает естественное и приятное звучание голоса. Собранные фразы были озвучены диктором. Для обучения модели, отвечающей за синтез голоса, понадобились 2 часа аудиозаписей вместо 15-20 часов, как было ранее. Синтезированный голос получился естественным, поскольку модель улавливала и учитывала интонации диктора. Такой способ обучения модели позволяет минимизировать разницу между ранее записанным голосом и синтезированным. «Мы смогли сократить длительность требуемых материалов с 15-20 часов до 2 часов, что позволяет нам выполнять проекты в более короткие сроки. Модель синтеза речи реализовали на новой архитектуре Conformer — это более современная архитектура нейронной сети, которая лучше справляется с синтезом длинных фраз. Если раньше мы сталкивались с «зажевыванием» в конце предложений, то теперь эта проблема минимизирована и длинные фразы звучат корректно. Естественность и качество нового голоса, скорость его создания – важные преимущества для любого проекта по внедрению и развитию виртуального ассистента», — прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.
Контактное лицо: Вадим Прищепа (написать письмо автору)
Компания: BSS (все новости этой организации)
Добавлен: 03:27, 11.06.2024
Количество просмотров: 211
Страна: Россия
| Жижи перешёл на SSE-стриминг для повышения стабильности ИИ-поиска в реальном времени, ЖИЖИ, 20:57, 13.12.2025, Россия |
52 |
| Компания Жижи внедрила технологию SSE (Server-Sent Events) в архитектуру своего одноименного ИИ-поиска, обеспечив более устойчивый обмен данными и точную синхронизацию пользовательских сессий. Обновление нацелено на повышение надежности интерфейса, в случаях, когда пользователи работают одновременно с несколькими чатами или их интернет-соединение нестабильно. |
 |
| Умная касса «1С-Рарус» распознает блюда и ускоряет обслуживание, 1С-Рарус, 20:55, 13.12.2025, Россия |
50 |
| «1С-Рарус AI Касса» с технологией машинного зрения мгновенно распознает блюда на подносе и автоматически формирует заказ. Система сокращает время обслуживания и увеличивает пропускную способность линий раздачи в столовых и кафе. Технология успешно апробирована на пилотных проектах и отраслевых выставках, что подтверждает ее эффективность для цифровой трансформации предприятий общественного питания. |
|
| «Телфин» подключает автозаполнение комментариев к звонку в amoCRM, Телфин, 20:47, 13.12.2025, Россия |
51 |
| Провайдер коммуникационных сервисов «Телфин» расширяет возможности интеграции АТС «Телфин.Офис» с amoCRM и предлагает к подключению функцию автозаполнения комментариев к звонку в CRM. Это избавляет менеджеров от рутины, обеспечивает объективную информацию для контроля и повышает качество данных в CRM. |
|
|
 |
|
 |
|
|
Разделы //
Новости по странам //
Сегодня у нас публикуются //
|
|