 |
Smart Engines выпустила первый в России специализированный датасет поддельных документов для разработчиков ИИ
Исследователи российской ИИ-компании Smart Engines представили первый в России масштабный датасет с поддельными документами – MIDV-DM. Он включает 8 тыс. изображений с удостоверениями личности РФ, СНГ и других стран. Вошедшие в набор образцы были изготовлены с помощью наиболее распространенных у мошенников методов подделки. Датасет позволит разработчикам со всего мира обучать, тестировать и совершенствовать антифрод-системы на базе ИИ.
MIDV-DM стал первым публичным датасетом, который систематизировал все основные способы манипуляций с документами. В основу набора легла 1 тыс. изображений из ранее опубликованной исследователями Smart Engines выборки MIDV-2020: образцы внутреннего паспорта РФ, национальные паспорта и ID-карты Азербайджана, Латвии, Эстонии, Финляндии и других. Разработчики использовали такие манипуляции с документами, как вставка текстовых полей или фото из «донорского» документа, «маскирование» отдельных полей документа, склеивание разных фрагментов в один образ, вставка посторонних объектов – эмблем, голограмм и др.
Новый набор данных позволяет разработчикам повышать точность антифрод-решений. Это особенно актуально на фоне участившихся случаев мошенничества с поддельными документами – в России число уголовных дел по фальсификации, изготовлению и обороту подделок (ст. 327 УК РФ) увеличилось на 34% и составило 3,9 тыс. в 2024 году. Такие данные представлены в ежегодном исследовании специалистов Smart Engines и юридической фирмы INTELLECT.
«При создании MIDV-DM мы сознательно вышли за рамки сценариев с текстовыми манипуляциями, детекция которых уже не является проблемой для современных систем. В датасет вошли подделки с изменением подписи, фотографии держателя и отдельных полей документа – то есть полный спектр типичных атак, с которыми на практике сталкиваются банки, МФО и госструктуры. Это позволит ИИ-системам учиться с повышенной точностью видеть не только замененные ФИО, но и сложные структурные несоответствия в документе», – отмечает Владимир Арлазаров, генеральный директор Smart Engines, доктор технических наук.
В дальнейшем с помощью MIDV-DM Smart Engines планирует развивать собственную антифрод-систему «Шерлок 2о» – мультимодальную ИИ-модель, способную одновременно работать с изображениями документов из оптического, ультрафиолетового и инфракрасного спектров, текстовыми полями, данными NFC-чипа, штрих-кодами, метаданными и сигнатурами. В общей сложности система проверяет документ на подлинность по 600 параметрам.
Контактное лицо: Кирилл (написать письмо автору)
Компания: Smart Engines (все новости этой организации)
Добавлен: 20:39, 02.12.2025
Количество просмотров: 182
Страна: Россия
| ГИГАНТ - Комплексные системы: активное внедрение отечественной вычислительной техники, ГИГАНТ, 20:58, 27.05.2026, Россия |
66 |
| Сергей Семикин, генеральный директор компании «ГИГАНТ - Комплексные системы» рассказал о наиболее востребованных сценариях импортозамещения, о ключевых сложностях интеграции отечественного оборудования связанных с виртуализацией, драйверами, прикладными системами и управляемостью, а также о необходимости подходить к внедрению как к полноценному инженерному проекту. |
|
| «Телфин» масштабирует чат-бота и переходит на платформу Max, Телфин, 20:55, 27.05.2026, Россия |
67 |
| Российский провайдер коммуникационных сервисов «Телфин» объявляет об обновлении сервиса «Телфин.Бот» для контроля качества обслуживания. Теперь решение позволяет получать уведомления о звонках и СМС, а также записи и резюме телефонных разговоров — не только в Telegram, но и в Max. |
|
| «Курчатовский институт» начинает регулярные испытания софта компании «РуПост», "Группа Астра", 20:47, 27.05.2026, Россия |
29 |
| На ЦИПР-2026 компания «РуПост» и НИЦ «Курчатовский институт» договорились создать Центр тестирования ПО для корпоративных коммуникаций. Эксперты будут на постоянной основе проводить анализ свежих версий платформы RuPost, почтового клиента Desktop X и EMM-решения WorksPad, чтобы делиться с рынком опытом их применения и рекомендовать проверенные и оптимальные подходы. |
|
|
 |