 |
«Наносемантика» создала новую систему для голосового управления в робототехнике

«Наносемантика», ведущий российский разработчик нейросетевых решений, завершила создание универсального программного комплекса, который позволяет управлять роботами с помощью естественной речи без требований к высокой мощности оборудования. В основе комплекса ‒ DialogOS: платформа обеспечивает голосовой интерфейс, распознает и синтезирует речь, интегрируется с внешними системами через API. Для внедрения достаточно устройства с микрофоном и динамиком.
Современные нейросети позволяют роботам воспринимать речь в том виде, в каком она звучит в обычном разговоре. Там, где раньше требовалось строгое соблюдение команд, система теперь корректно обрабатывает свободные формулировки, опираясь на смысл и интонации.
В комплекс включены собственные решения компании: диалоговая платформа DialogOS для создания голосовых и текстовых роботов, NLab Speech ASR для точного распознавания речи и NLab Speech TTS для её синтеза. Текущая версия DialogOS совместима с Gemini и отечественной генеративной моделью, при этом архитектура комплекса заранее рассчитана на подключение любых других LLM. «Наносемантика» протестировала все крупные LLM от ведущих разработчиков, и в зависимости от специфики задачи в комплекс может быть подключена наиболее актуальная модель.
Егор Кириллов, бизнес-аналитик, ООО «Лаборатория Наносемантика»: «Ключевой задачей при разработке этого комплекса была модульность и независимость от аппаратной платформы. Мы реализовали клиент-серверную архитектуру, где на конечном устройстве ‒ будь то робот-собака или промышленный манипулятор ‒ запускается лишь ультралегкий клиент. Вся сложная обработка, включая KWS, VAD и интеграцию с LLM через DialogOS, происходит на сервере. Такой подход позволяет нам гарантировать высокую производительность и качество распознавания независимо от вычислительных мощностей самого робота, а также централизованно обновлять и масштабировать «мозг» всей системы».
Комплекс уже прошёл испытания на роботе-собаке. Она умеет поддерживать диалог, выполняет голосовые команды и откликается на своё имя ‒ «Квант». Для этого была настроена комбинация KWS и VAD, позволяющая роботу отслеживать обращение в реальном времени. «Квант» говорит синтезированным голосом «Лео» из библиотеки компании, хотя при необходимости можно подключить и сторонние варианты.
Сабина Спирина, генеральный директор, ООО «Лаборатория Наносемантика»: «Мы видим устойчивый спрос на решения, которые позволяют компаниям быстрее внедрять роботизированные системы и снижать стоимость их интеграции. Новый комплекс делает голосовое управление стандартной функцией, а не дорогостоящей кастомной разработкой. Это открывает путь к масштабным внедрениям ‒ от логистики до сервисной робототехники ‒ и значительно ускоряет цифровую трансформацию наших клиентов».
Опробовать технологии можно на сайте «Наносемантики» ‒ в роли собеседника выступает цифровой аватар Лили, демонстрирующий работу комплекса в реальном диалоге. Лили ‒ уникальный эксперт по вселенной «Наносемантики»: она свободно ориентируется во всех продуктах, услугах и историях успеха клиентов компании. Пообщаться с аватаром текстом или голосом можно на главной странице сайта «Наносемантики».
Справка:
Группа компаний «Наносемантика» объединяет российских разработчиков продуктов на основе нейросетей («Лаборатория Наносемантика», «Нейросети Ашманова», «Синтелли» и другие). За 20 лет на рынке СНГ создали более 12 собственных продуктов, технологий и платформ. Реализовали свыше 230 проектов для бизнеса и госкорпораций, клиентами и партнерами стали ВТБ, ЛДПР, Энергосбыт, Летуаль, ТВ Центр, Инфамед К, Капитал Лайф, МТС, Билайн, МФТИ и другие известные компании. Команды из научных сотрудников и разработчиков обладают уникальными базами знаний и практикой в области искусственного интеллекта: машинном обучении, компьютерном зрении, создании виртуальных роботов, цифровых аватаров и робототехники.
Контактное лицо: Ольга Кочеткова (написать письмо автору)
Компания: Наносемантика (все новости этой организации)
Добавлен: 21:22, 03.12.2025
Количество просмотров: 34
Страна: Россия
| «Биржа ATI.SU» обновила сервис оформления претензий на платформе, Биржа грузоперевозок АТИ, 21:39, 03.12.2025, Россия |
19 |
| «Биржа грузоперевозок ATI.SU» обновила сервис «Претензии». Теперь он представляет собой единый инструмент, работать с которым можно в одном окне. Задача обновления — упростить и ускорить разрешение спорных ситуаций между пользователями платформы. |
 |
| «Телфин» и Whatcrm интегрировали CRM Planfix с Telegram, Телфин, 21:37, 03.12.2025, Россия |
20 |
| Провайдер коммуникационных сервисов «Телфин» представил новинку в линейке сервисов Whatcrm — интеграцию системы Planfix с Telegram. Связка бизнес-приложений позволяет равномерно распределять нагрузку между сотрудниками и повышает скорость общения с клиентами. |
|
| В экосистеме «Группы Астра» — более 4000 сертифицированных совместимостей, "Группа Астра", 21:24, 03.12.2025, Россия |
18 |
| Гарантия интеграции с софтом «Группы Астра» позволяет конечным заказчикам сократить затраты на пилотирование, тестирование и интеграцию многих востребованных технологий. На базе комплексных импортонезависимых решений можно выстраивать производительные и надежные ИТ-ландшафты, которые сохранят работоспособность независимо от внешних условий и действий глобальных вендоров. |
|
|
 |