|
|
 |
|
|
 |
BSS повысила качество распознавания речи за счет улучшения диаризации
Улучшение технологии определения спикеров в монозаписях, позволяет получать более качественную транскрибацию разговоров для последующего анализа. В ходе анализа аудиозаписей могут возникать проблемы с путаницей источника речи – кто и что говорит. Это влияет на результаты речевой аналитики, и в целом на эффективность работы виртуальных помощников. Диаризация позволяет разделить аудиопотоки при общении и определить, кто именно говорит в конкретный момент диалога. Применяется для анализа монозаписей и записей с аудиобеджей, а также для улучшения качества распознавания записи с направленных стереомикрофонов при проникновении посторонних звуков. Сейчас разработчики BSS сконцентрировались на трех основных направлениях по улучшению диаризации, которые позволят устранить недочеты при распознавании речи и повысить эффективность речевой аналитики. Во-первых, добавили классификатор каналов. Диалоги с клиентами обычно начинают операторы. Поэтому первый канал, как правило, присваивается оператору, что раньше приводило к путаницам, так как не всегда разговор начинал оператор. Теперь записи речи клиента и оператора определяются двумя моделями. Первая разделяет реплики говорящих по биометрическим признакам (голосу). Вторая – по характерной лексике понимает кто из говорящих оператор, а кто клиент. В результате принадлежность канала определяется корректно. Во-вторых, аудиозаписи проходят через верификацию каналов. Например, курьер в течение дня развозит заказы, и все это время ведется аудиозапись. Для анализа важны только те фрагменты, где курьер разговаривает с клиентами. Именно эти части записи с помощью технологии верификации каналов вычленяются из всего аудиопотока для диаризации. Это позволяет существенно снизить нагрузку на ИТ-инфраструктуру и сократить время обработки и анализа аудио. В-третьих, существенно улучшено качество работы технологии по исключению дублирования реплик. Обычно консультации в банках записываются с помощью двух направленных микрофонов: один записывает клиента, другой – консультанта. Но нередко речь клиента записывается микрофоном консультанта и наоборот. Это приводит к дублированию информации в текстовой расшифровке и усложняет анализ диалога с помощью речевой аналитики. Добиться исключения дублей реплик в аудиофайле удалось за счет соединения обеих звуковых дорожек в одну стереозапись. Только после этого проводится транскрибация аудиофайла. Этот инструмент уже показал свою эффективность в нескольких банках. «Диаризация повышает качество текстов при транскрибации и значительно улучшает качество речи при использовании с системой распознавания. Этой технологией пользуются многие разработчики, но мы смогли ее существенно улучшить и продолжаем постоянно развивать. Она широко востребована, так как делает речевые технологии более доступными. Многие компании записывают разговоры с клиентами на устаревшем оборудовании в формате моно. Диаризация позволяет таким заказчикам внедряет ту же речевую аналитику без необходимости замены дорогостоящего оборудования», – прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.
Контактное лицо: Вадим Прищепа (написать письмо автору)
Компания: BSS (все новости этой организации)
Добавлен: 18:54, 02.03.2024
Количество просмотров: 116
Страна: Россия
| Приложение ПрограмБанк «XBRL-CSV 2.0» идет в банки, Компания ПрограмБанк, 23:41, 20.02.2026, |
244 |
| Компания «ПрограмБанк» предлагает банкам с лицензией ПУРЦБ промышленное решение по формированию и передаче учетно-операционных данных в формате XBRL-CSV 2.0. |
|
| Продукты EvaTeam под защитой Индид, Индид, 23:36, 20.02.2026, Россия |
183 |
| Компании Индид и EvaTeam объявляют об успешном тестировании на совместимость системы многофакторной аутентификации Indeed Access Manager (Indeed AM) и программных продуктов EvaTeam для управления проектами, задачами, знаниями и услугами. |
|
| Nexign: телеком-рынок в России превысит 3,3 трлн рублей к 2030 году, Nexign, 23:34, 20.02.2026, Россия |
180 |
| По результатам исследования Nexign и TelecomDaily, в 2025 году российский телеком-рынок вырос на 6,5%, до 2,3 трлн рублей. В 2024 году показатель прироста составлял 7,8%. |
 |
| «Аэродиск» представляет новую модель в линейке СХД ENGINE AQ 460, Аэродиск, 23:34, 20.02.2026, Россия |
180 |
| Компания «Аэродиск» (входит в ГК «Аквариус»), российский разработчик решений для хранения данных и виртуализации, представляет новую систему хранения данных ENGINE AQ 460, рассчитанную на высокие нагрузки и масштабируемость, в том числе, за счет реализованной поддержки NVMe-накопителей. |
 |
| Unicon Outsourcing выстроила системное обучение сотрудников с помощью iSpring, iSpring, 23:19, 13.02.2026, Россия |
777 |
| ГК Unicon Outsourcing внедрила платформу корпоративного обучения iSpring Learn для развития распределенной команды. С помощью LMS компания объединила обучение и оценку сотрудников в одном цифровом пространстве, систематизировала обязательные курсы и обеспечила единый уровень компетенций специалистов, работающих с клиентами по всей России. |
 |
|
 |
|
 |
|
|
Разделы //
Новости по странам //
Сегодня у нас публикуются //
|
|