|
Физики АлтГУ работают над проектом по использованию нейросетей
РНФ поддержал проект ученого АлтГУ по очистке голосовых сообщений от посторонних шумов Российский научный фонд поддержал проект доцента кафедры информационной безопасности Института цифровых технологий, электроники и физики, кандидат физико-математических наук Андрея Александровича Лепендина по очистке голосовых сообщений от посторонних шумов. Проект под названием «Разработка новых методов улучшения качества речевых сигналов с использованием глубоких нейронных сетей» вошел в число победителей конкурса 2021 года на получение грантов Российского научного фонда по приоритетному направлению деятельности РНФ «Проведение фундаментальных научных исследований и поисковых научных исследований малыми отдельными научными группами». «Мы берем запись речи человека, сделанную в реальных условиях, – на фоне может что-то шуметь, кричать, петь – и стараемся очистить запись от ненужных фоновых искажений. Из зашумленной, «грязной» речи мы получаем чистую и красивую запись, которую потом можно будет использовать в дальнейшем, - поясняет А.А. Лепендин. – Подобные методы улучшения качества речевых сигналов уже применяются в современных программах, например в видеочатах. Однако они справляются с однородным фоновым шумом, который не меняется во времени: таким как гудение машин или техники. Стоит появиться резкому звуку, и система не успевает на него отреагировать, отчего шум проникает в запись. Поэтому наша задача – модифицировать данные методы, чтобы они могли справляться со всеми посторонними звуками и оставлять только речь человека». По словам ученого, чистый звук требуется во многих сферах: в системе распознавания речи, которая синтезирует слова в текст, для голосовых сообщений и видеочатов, наподобие Zoom и Skype, для создания аудио- и видеоконтента. А также качественная запись звука необходима при решении задач информационной безопасности. «Проект находится на стадии активных работ. У нас уже есть некоторые результаты, которые мы и продемонстрировали в заявке на получение гранта. Наша команда сделала хорошую модель, которая улучшает качество речевых сигналов в реальном времени – то есть успевает обрабатывать речь синхронно с тем, как говорит человек. Также у нас есть несколько интересных идей, как доработать эту модель и сделать лучший вариант. Но пока рано говорить о завершении нашего исследования», - уточняет разработчик проекта. Над проектом ученые АлтГУ работают уже пару лет, и, по словам А.А. Лепендина, впереди им предстоит еще два года усиленной работы. Кстати, в стране не так много специалистов, занимающихся разработками в этой области, утверждает исследователь. Их можно пересчитать по пальцам: это центр речевых технологий в Санкт-Петербурге и несколько групп, работающих в крупных компаниях, например в «Яндексе» и «Сбербанке».
Контактное лицо: Алексей Григорьевич Козерлыга (написать письмо автору)
Компания: Алтайский государственный университет (все новости этой организации)
Добавлен: 18:17, 13.12.2021
Количество просмотров: 371
Страна: Россия
DION занял второе место в рейтинге лучших ВКС-платформ, ИТ-холдинг Т1, 04:28, 18.12.2024, Россия |
26 |
Платформа корпоративных коммуникаций DION (ИТ-холдинг Т1) заняла второе место в рейтинге российских ВКС-решений, опубликованном ИТ-маркетплейсом Market.CNews. Рейтинг был сформирован на основе балльной системы оценки по ряду критериев. К ним относятся функциональные возможности, максимальное число участников видеоконференции и аудиозвонка, продолжительность тестового периода, общее количество пользователей и стоимость лицензии на решение. |
|
Вышло обновление 5.1 платформы «Триафлай», Триафлай, 04:20, 18.12.2024, Россия |
22 |
В новой версии конструктора прикладных аналитических решений компания «Триафлай», продолжает развивать подход self-service, снижая зависимость бизнес-аналитиков от ИТ-отделов. |
|
|
|