ATREX.RU
Пресс релизы коммерческих компаний и общественных организаций
ATREX.RU
» Пресс релизы сегодняшнего дня
» Архив пресс-релизов
» Авторам от редакции
» Добавить пресс-релиз

Самое-самое //
Пресс-релизы // » Добавить пресс-релиз

UDV Group: AI Security — безопасность искусственного интеллекта

Юрий Чернышов, к.ф.-м.н., доцент УНЦ «Искусственный интеллект» УрФУ, руководитель исследовательского центра UDV Group рассказал о сложностях обнаружения причины изменения поведения модели, о методах, которые подходят для анализа безопасности и о том, как оценивается устойчивость модели в условиях реального применения.

— Какие индикаторы помогают заметить ранние признаки отравления данных на этапе подготовки датасета?
Почти все, кто имеет практический опыт внедрения и использования проектов, включающих анализ данных и машинное обучение, уже в курсе, что подобные системы очень неустойчивы, чувствительны к внешним помехам. Причина этого не в том, что у разработчиков недостаточная экспертиза (хотя встречаются и такие случаи), а в том, что при обучении модели применяются наборы данных, которые не могут содержать все возможные ситуации при будущей эксплуатации. Да это и невозможно, поскольку всегда на практике имеет место так называемый «сдвиг в данных» (data shift) из-за меняющейся инфраструктуры, условий эксплуатации, поведения пользователей и пр. Поэтому очень сложно при обнаружении изменения поведения модели понять - что же является истинной причиной: сдвиг в данных, сбой датчика, помехи в сети передачи данных, некачественная модель ML, незначительная перегрузка инфраструктуры или это просто «шум» в рамках статистической погрешности. И за этими вариантами всегда сложно разглядеть атаку через отравление данных. Индикаторы для диагностики изменения традиционные: всесторонний статистический анализ характеристик данных, как по параметрам получения и обработки, так и по семантике. Но для принятия мер при обнаружении отклонения в поведении модели на основе данных необходима комплексная инфраструктура, включающая мониторинг оборудования, параметров данных и модели, метрик инференса (промышленного использования).

— Какие методы анализа позволяют выявлять бэкдор-активность в уже обученной модели?
Для анализа безопасности модели ИИ подходят все те же методы, применяемые при тестировании безопасности программного обеспечения: мониторинг, фаззинг, анализ взаимодействия с внешними компонентами. Сложность заключается в том, что невозможно понять логику работы модели, как это делается при анализе кода программного обеспечения, поскольку эта логика модели ИИ распределена по миллионам (как в случае с глубоким машинным обучением) или по миллиардам (как в случае с LLM) параметров. Поэтому применяется анализ модели ИИ как «черного ящика», анализируя вход и выход, оценивая параметры работы и потребление ресурсов. Исторический анализ параметров работы модели позволяет сформировать паттерны нормального поведения и анализировать в будущем отклонения от этих паттернов.

— Как оценивается устойчивость модели к adversarial-примерам в условиях реального применения?
Самый лучший способ для подобного анализа это red teaming, в том числе и с применением автоматизированных средств проверки: фаззинг, подбор проверяющих сэмплов, создание для модели критических условий для функционирования (ddos атака). Если есть возможность оценивать устойчивость в лабораторных условиях, то эффективным является схема генеративных состязательных сетей (GAN), в которых есть генератор, создающий сэмплы, и дискриминатор, пытающийся различить настоящие сэмплы и созданные генератором. При этом генератор и дискриминатор постоянно конкурируют друг с другом, генератор учится все лучше «обманывать», а дискриминатор – все лучше выявлять факт подделки.

— Какие техники усложняют попытки извлечения модели через API (model extraction)?
Для любого интерфейса взаимодействия, и API в том числе, важно настроить как можно более строгие правила доступа к ресурсу: авторизацию, аутентификацию и контроль за ресурсами. При этом необходимо проектировать API таким образом, чтобы минимизировать возможности взаимодействующей стороны, оставлять доступ только к той информации, которая ей предназначена, ограничивать разумными уровнями потребления ресурса, исходящими из технического задания и архитектуры проекта. Например, можно запретить длительные сессии взаимодействия, если проект этого не предполагает. Или ограничить количество запросов к ресурсу от одного источника таким уровнем, который достаточен для нормальной работы, все что аномально выше этого уровня – скорее всего свидетельствует о попытке автоматизированного сканирования или парсинга.

— Какие меры повышают защищенность датасетов от подмены, injection-атак и несанкционированных правок?
Наличие защищенных наборов данных - серьезная задача, без которой невозможно создавать качественные, надежные и полезные системы ИИ. Зачастую набор данных ценится даже больше, чем модель, обученная на его основе. Поэтому компании-разработчики систем ИИ так ценят свои наборы данных, защищают их наравне с программным кодом. Меры, защищающие наборы данных (датасеты) от злонамеренного искажения, такие же, как и при защите программного кода: требуется контролировать версионирование и доступ к изменениям, проводить тестирование и анализ характеристик после изменений.

— Какие механизмы мониторинга лучше всего подходят для отслеживания аномалий в поведении ИИ-модели?
Существует множество способов мониторить работу сложного устройства или системы, какой из них наиболее эффективен – сильно зависит от самой системы. Можно анализировать низкоуровневые параметры (трафик, потребление ресурсов оборудования), можно анализировать вход и выход модели ИИ (текст промпта и сгенерированный ответ), потребление токенов. Но на мой взгляд наиболее эффективно анализировать влияние применения модели на бизнес-процесс – если в бизнес-процессе появились отклонения (изменилась продолжительность звонков, частота отправки писем, поменялась бизнес-логика процесса, перестал компилироваться код и пр.), то скорее всего случился сбой в работе ИИ-модели и необходимо проводить расследование, в том числе с применением анализа низкоуровневых событий в инфраструктуре и ПО.

Контактное лицо: UDV Group (написать письмо автору)
Компания: UDV Group (все новости этой организации)
Добавлен: 23:37, 06.04.2026
Количество просмотров: 60
Страна: Россия

«Группа Астра» перевела корпоративный контур 1С на машину БД Tantor XData 2B на базе процессора Baikal-S, "Группа Астра", 21:00, 27.05.2026, Россия
209
«Группа Астра» расширяет использование программно-аппаратных комплексов собственной разработки в ИТ-инфраструктуре.


ГИГАНТ - Комплексные системы: активное внедрение отечественной вычислительной техники, ГИГАНТ, 20:58, 27.05.2026, Россия
216
Сергей Семикин, генеральный директор компании «ГИГАНТ - Комплексные системы» рассказал о наиболее востребованных сценариях импортозамещения, о ключевых сложностях интеграции отечественного оборудования связанных с виртуализацией, драйверами, прикладными системами и управляемостью, а также о необходимости подходить к внедрению как к полноценному инженерному проекту.


«Телфин» масштабирует чат-бота и переходит на платформу Max, Телфин, 20:55, 27.05.2026, Россия
209
Российский провайдер коммуникационных сервисов «Телфин» объявляет об обновлении сервиса «Телфин.Бот» для контроля качества обслуживания. Теперь решение позволяет получать уведомления о звонках и СМС, а также записи и резюме телефонных разговоров — не только в Telegram, но и в Max.


VIS.center выпустил обновление мессенджера VIS Connect с интеграциями с Битрикс24 и МАКС, ООО «ВИС центр», 20:53, 27.05.2026, Россия
215
В мае 2026 года ИТ-интегратор ООО «ВИС центр» выпустил обновление корпоративного мессенджера VIS Connect. На платформе реализованы интеграции с внешними мессенджерами, включая Битрикс24 и МАКС. Менеджеры компаний-заказчиков получают возможность вести переписку с клиентами из разных каналов в едином интерфейсе VIS Connect.


AggreGate и MWS AI объединят IIoT и искусственный интеллект для горнодобывающей промышленности, MWS AI, 20:51, 27.05.2026, Россия
212
Российский вендор AggreGate и MWS AI (центр искусственного интеллекта МВС, входит в МТС Web Services) заключили соглашение о стратегическом сотрудничестве на полях конференции «Цифровая индустрия промышленной России» (ЦИПР-2026).


«Нетрика Медицина» обеспечит регионам бесперебойную онлайн-запись к врачу через витрины данных, Нетрика, 20:51, 27.05.2026, Россия
208
Компания «Нетрика Медицина» (входит в N3.Group и ГК «Ташир МЕДИКА») запустила комплексную услугу по внедрению и сопровождению региональных витрин данных для электронной записи пациентов через ЕПГУ («Госуслуги»)


Hybrid Platform обновила интеграции с АТОЛ, Магнитом, X5 Dialog и МегаФоном для повышения точности таргетинга, Hybrid, 20:51, 27.05.2026, Россия
207
AdTech-экосистема Hybrid, которая специализируется на высокотехнологичных разработках в области интернет-рекламы, расширила пул внешних источников данных в своей программатик-платформе.


МТС Банк автоматизировал прием сотрудников с помощью российской разработки от HRlink, HRlink, 20:51, 27.05.2026, Россия
212
ПАО «МТС-Банк» (MOEX: MBNK) объявляет о запуске автоматизированного приема новых сотрудников. С помощью российского решения Start Link (входит в экосистему HRlink) банк уже смог оформить около 1 тыс. человек с начала года без необходимости готовить документы вручную.


«Курчатовский институт» начинает регулярные испытания софта компании «РуПост», "Группа Астра", 20:47, 27.05.2026, Россия
41
На ЦИПР-2026 компания «РуПост» и НИЦ «Курчатовский институт» договорились создать Центр тестирования ПО для корпоративных коммуникаций. Эксперты будут на постоянной основе проводить анализ свежих версий платформы RuPost, почтового клиента Desktop X и EMM-решения WorksPad, чтобы делиться с рынком опытом их применения и рекомендовать проверенные и оптимальные подходы.


Искусственный интеллект и единые дашборды: в Совете профессионалов по цепям поставок обсудят инструменты аналитики в логистике, Loginet, 20:45, 27.05.2026, Россия
43
28 мая 2026 года состоится вебинар «Как построить систему аналитики в цепях поставок под приоритеты и задачи бизнеса». Мероприятие обобщит результаты цикла отраслевых круглых столов, прошедших весной текущего года, и станет площадкой для презентации ИТ-решений в сфере логистической аналитики.


Разделы //


Новости по странам //
Сегодня у нас публикуются //
Разработано AVart.Стуdия © 2008-2026 atrex.ru
  Rambler's Top100