|
|
|
|
Компания «Наносемантика» синтезирует «голос Победы» Юрия Левитана к юбилею диктора
Разработчик нейросетевых решений «Наносемантика» в год 110-летия со дня рождения знаменитого советского диктора Юрия Левитана представит синтез его голоса. К юбилею человека, чей голос объявлял по Всесоюзному радио о победе в Великой Отечественной войне, компания представит голосовую модель, созданную на базе платформы NLab TTS и обученную на редких записях, из архива Левитана.
В 2024 году со дня рождения Юрия Левитана исполнится 110 лет. С предложением о разработке голосовой модели всесоюзного диктора в компанию обратился его правнук Артур Левитан-Судариков. Идея проекта заключается в том, чтобы увековечить в цифровом формате голос, который объявлял в Советском Союзе о самых значимых событиях XX века. Голос Левитана звучал из репродукторов и радиоточек, когда в СССР передавали сводки с фронтов Великой Отечественной войны, именно Левитан на всю страну зачитывал новость о начале войны в 1941-м году и о победе в ней в 1945 году.
Голосовая модель Левитана будет работать на базе платформы «Наносемантики» NLab TTS (Text-to-Speech), специализирующейся на синтезировании голоса из текстового формата. Для обучения модели будет использован массивный архив записей из Госфильмофонда. Кроме того, правнук диктора Артур Левитан-Судариков попросил открыть разработчикам доступ к аудиоматериалам, которые хранятся в музее Левитана на его родине – во Владимире.
Перед разработчиками стоит непростая задача синтезировать узнаваемый тембр голоса с помощью аудиозаписей с разным уровнем качества. Записи сильно отличаются друг от друга по громкости, компрессии, эквализации, уровню шума и искажению, что связано с дефектами, которые получены уже после непосредственной записи голоса Левитана, а также в результате перезаписи или копирования мастер-пленки. Такая неоднородность материала всегда осложняет процесс создания голосовой модели, которая должна генерировать «чистый», ровный голос без лишних помех.
В то же время разработчики отмечают, что технические особенности записи во времена работы Юрия Левитана повлияли на его запоминающийся тембр, что тоже важно передать в голосовой модели. «"Нулевой исходник" – очень чистый, теплый, ламповый звук, который изящно подчеркивает голос Левитана. Эти теплота и гармоники играют далеко не последнюю роль в восприятии итогового голоса диктора, каким его запомнили. Нам удалось убрать 80% лишних дефектов, но, где необходимо, мы даже добавили фоновые шумы, чтобы записи звучали одинаково приятно, узнаваемо и при этом не теряли звучание той эпохи», - комментирует Станислав Ашманов, генеральный директор компании «Наносемантика».
Сейчас «Наносемантика» занимается разработкой первой версии модели. Участники проекта обсуждают вопросы открытого доступа пользователей к ней в будущем, а также возможность интеграции голосовой модели с генеративными технологиями. Уже известно, что голос Юрия Левитана будет доступен на платформе орфоэпического сервиса – в приложении «Ударения», которое запущено в 2015 году. Релиз продукта намечен на 2024 год.
«Принимать участие в проекте создания голосовой модели одного из самых важных голосов XX века в нашей стране – большая честь для нас. Важно, чтобы такие голоса как у Левитана, снова зазвучали, но уже в новом формате – из современных гаджетов и приложений. Это откроет широкие возможности на пути сохранения памяти об этих людях, чьими голосами можно будет озвучивать книги, новостные сводки и виртуальных интерактивных персонажей. Благодаря таким проектам голос продолжит жить и напоминать о человеке», – комментирует Станислав Ашманов, генеральный директор компании «Наносемантика».
Справка: «Наносемантика» — ведущий российский производитель решений и продуктов на основе нейросетей. За 18 лет на рынке ИТ-компания разработала более 12 собственных интеллектуальных продуктов и платформ, реализовала свыше 130 проектов для бизнеса. Команда из научных сотрудников и разработчиков обладает обширной базой знаний и практик в области машинного обучения.
Контактное лицо: Татьяна Алексеева (написать письмо автору)
Компания: Наносемантика (все новости этой организации)
Добавлен: 22:32, 06.12.2023
Количество просмотров: 88
Страна: Россия
HRlink внедрил кадровый ЭДО в HR-процессы «Юниливер Русь», HRlink, 04:12, 17.11.2024, Россия |
114 |
HRlink, разработчик сервиса кадрового ЭДО, автоматизировал кадровые процессы одного из лидеров российского FMCG-рынка компании «Юниливер Русь». Внедрение платформы позволило повысить эффективность работы HR-департамента – доля подписанных документов в среднем теперь составляет 97%. |
|
«Газинформсервис» на AQ PRO: укрепление лидерства в сфере кибербезопасности, Газинформсервис, 04:05, 17.11.2024, Россия |
30 |
«Газинформсервис» принял участие в ежегодной конференции компании «Аквариус» «AQ PRO Время решений». В рамках мероприятия, где эксперты и представители ИТ-индустрии обсуждали актуальные технологические вызовы в сфере отечественной электроники и программного обеспечения, «Газинформсервис» представил ряд докладов, посвящённых решениям для повышения информационной безопасности. |
|
IT-компания PMP Tech признана «Лучшим предприятием отрасли» 2023 года, PMP Tech, 04:00, 17.11.2024, Россия |
31 |
ООО «ПМП ТЕХ» объявляет о своей номинации и признании «Лучшим предприятием отрасли 2023» в ежегодной премии, организованной Центром аналитических исследований. Эта награда стала итогом всесторонней аналитики и оценки компании, проведенной на основании данных, полученных от федеральных статистических органов и налоговой службы РФ. |
|
|
|
|
|
|
Разделы //
Новости по странам //
Сегодня у нас публикуются //
|
|