ATREX.RU
Пресс релизы коммерческих компаний и общественных организаций
ATREX.RU
» Пресс релизы сегодняшнего дня
» Архив пресс-релизов
» Авторам от редакции
» Добавить пресс-релиз

Самое-самое //
Пресс-релизы // » Добавить пресс-релиз

ИИ «Шерлок» выходит на рынок Ирана и Пакистана

Российская ИИ-система «Шерлок» для распознавания и проверки документов, созданная Smart Engines, получила возможность работать с удостоверениями личности на урду и персидском языках.
Это стало возможным благодаря первому в мире специализированному датасету MIDV-UP, созданному учеными компании и включающему более 9000 изображений документов Пакистана и Ирана. Новый набор данных закрывает давний пробел в разнообразных и неперсонифицированных обучающих материалах и открывает «Шерлоку» выход на рынки с совокупным населением свыше 330 миллионов человек.

Результаты работы ученых были представлены на ведущей Международной конференции по анализу и распознаванию документов (ICDAR), прошедшей 16–21 сентября в Китае.

Актуальность задачи ученых

На сегодняшний день языковые технологии искусственного интеллекта поддерживают лишь небольшую часть из более чем 7000 языков мира. Алфавиты на основе латиницы уже давно освоены системами ИИ, в то время как обучение систем распознавания языкам с другими системами письменности происходит значительно медленнее. Особенно остро проблема обстоит с урду и персидским (фарси) – государственными языками Пакистана и Ирана. Оба языка используют модифицированный арабский алфавит и отличаются сложными лигатурами.

До настоящего времени существующие датасеты документов оставляли практически без внимания удостоверения личности на урду и персидском. Это препятствовало разработке технологий распознавания, способных работать с документами Пакистана и Ирана. Представленный Smart Engines датасет MIDV-UP впервые изменил эту ситуацию, обеспечив разработчиков качественными данными для обучения ИИ. В состав MIDV-UP вошли 1000 уникальных образцов удостоверений нескольких типов документов – ID-карт, водительских удостоверений и свидетельств о рождении Ирана, а также ID-карт Пакистана. В общей сложности в датасете содержится 9000 полностью аннотированных изображений, полученных безопасным методом синтеза – новым способом создания обучающих данных без использования документов реальных людей.

MIDV-UP охватывает широкий спектр сценариев предъявления документов – от сканов до фотографий и видеоклипов с естественными помехами: тенями, бликами и искаженной перспективой. Специалисты Smart Engines использовали MIDV-UP для обучения нейросетевого ансамбля «Шерлок», предназначенного для распознавания и комплексной проверки физических и цифровых документов.

«Шерлок» выходит на новые рынки

«Шерлок» способен работать одновременно в видимом, ультрафиолетовом и инфракрасном диапазонах, анализировать голограммы и другие защитные элементы, осуществляя в общей сложности более 600 проверок. Это дает возможность детектировать подделки любой сложности и качества, начиная с паспортов с измененными и переклееными фотографиями и заканчивая муляжами и дипфейками. Решение было разработано при финансовой поддержке Фонда содействия инновациям и используется в пунктах автоматического паспортного контроля в аэропортах «Шереметьево», «Внуково» и «Кольцово», а также в РЖД, ФНС и банковском секторе.

«Отсутствие надежных ИИ-решений долгое время оставляло неавтоматизированным огромный рынок цифровых услуг, требующих ввод данных из документов на урду и фарси. Благодаря нашему новому датасету эти документы больше не является преградой для «Шерлока». Сегодня устойчивый спрос на технологии распознавания наблюдается не только в самих Пакистане и Иране, но и в России и других государствах – чему способствуют значительные миграционные и образовательные потоки. Теперь стало возможным масштабировать «Шерлока» как внутри страны, так и на международных рынках», – отмечает один из авторов MIDV-UP, генеральный директор Smart Engines, д.т.н. Владимир Арлазаров.

О конференции

Международная презентация MIDV-UP состоялась на главном мировом научном форуме в области анализа и распознавания документов – конференции ICDAR. Это ключевая площадка, где ежегодно собираются ведущие эксперты и исследователи со всего мира, чтобы обсудить передовые достижения и новые вызовы технологий распознавания и обработки изображений. Ученые Smart Engines ежегодно принимают участие в ICDAR, где представляют свои новейшие разработки.

Контактное лицо: Кирилл Зверев (написать письмо автору)
Компания: Smart Engines (все новости этой организации)
Добавлен: 10:00, 02.10.2025
Количество просмотров: 144
Страна: Россия

SpaceVM позволяет развернуть отказоустойчивый кластер виртуализации за 15 минут, ДАКОМ М, 22:06, 03.06.2026, Россия
543
Платформа виртуализации SpaceVM позволяет создать полноценный отказоустойчивый кластер за 15 минут. За это время администратор может подключить серверы, организовать общее хранилище данных и подготовить инфраструктуру к запуску виртуальных машин.


Axenix: крупный бизнес в России меняет подход к ERP, Axenix, 22:06, 03.06.2026, Россия
554
Крупный бизнес больше не рассматривает замену зарубежных ERP-систем как формальную ИТ-задачу. Компании реального сектора связывают такие проекты с устойчивостью операционной модели, управляемостью данных и снижением зависимости от зарубежной ИТ-инфраструктуры.


В России создан образовательный курс по внедрению MES, Инка, 22:06, 03.06.2026, Россия
543
Компания «ИНКА 4.0» запустила образовательный курс для обучения работе с модулем «ИНКА.Модель производства» и шаблонным набором базовых автоматизированных рабочих мест (ШАРМов).


МегаФон разработал голосового помощника для госучреждений Якутии, МегаФон, 22:05, 03.06.2026, Россия
547
МегаФон и Правительство Республики Саха (Якутия) договорились о пилотном проекте внедрения голосового робота на якутском языке для ряда государственных учреждений.


Коммерческим директором платформы «Моя смена» назначен Алексей Агибалов, Verme, 22:05, 03.06.2026, Россия
547
Алексей Агибалов назначен коммерческим директором платформы «Моя смена» (входит в ГК Verme). В новой роли он будет отвечать за формирование и реализацию коммерческой стратегии, развитие продаж и ключевых партнерств, а также масштабирование бизнеса и выход на новые рынки.


БФТ-Холдинг внедрил платформу КЭДО в МГТУ им. Н.Э. Баумана, HRlink, 22:05, 03.06.2026, Россия
545
БФТ-Холдинг совместно с технологическим партнёром – компанией HRlink – реализовал проект по внедрению системы кадрового электронного документооборота (КЭДО) в Московском государственном техническом университете им. Н.Э. Баумана.


«Цифровой управленец» в ритейле: от отчётов к действиям на полях ПМЭФ, Платформа ОФД, 22:02, 03.06.2026, Россия
558
2 июня в Санкт-Петербурге, в рамках III Международного форума «ИИ – будущее сегодня», прошла сессия «Цифровой управленец в ритейле: большие данные и ИИ-аналитика меняют рынок». Эксперты разобрали, почему при 85% внедрений ИИ в ритейле реальную пользу получают не все.


Продукт «1С:CRM» Центра разработки «1С-Рарус» получил сертификат «Совместимо!», 1С-Рарус, 21:59, 03.06.2026, Россия
560
Статус «Совместимо! Система программ 1С:Предприятие» присвоен специализированному решению «1С-Рарус» для управления взаимоотношениями с клиентами: «1С:CRM» редакции 3.1. Подтверждено соответствие качества решения стандартам фирмы «1С».


Живой диалог о будущем ИТ и ИБ: открыта регистрация на IT IS conf 2026, УЦСБ, 21:58, 03.06.2026,
559
На конференции IT IS conf от УЦСБ эксперты ИТ и кибербезопасности устроят киберпоединки, а также разбор реальных инцидентов и методов защиты бизнеса


Галэкс подтвердил статус ключевого партнера «Катюши» и запустил экспертизу расходных материалов, Галэкс, 21:55, 03.06.2026, Россия
560
Галэкс продлил статус официального бизнес-партнера и авторизованного сервисного партнера уровня «ПРЕМИУМ» экосистемы корпоративной печати «Катюша». Компания также получила сертификацию вендора на проведение экспертизы подлинности расходных материалов.


Разделы //


Новости по странам //
Сегодня у нас публикуются //
Разработано AVart.Стуdия © 2008-2026 atrex.ru
  Rambler's Top100