ATREX.RU
Пресс релизы коммерческих компаний и общественных организаций
ATREX.RU
» Пресс релизы сегодняшнего дня
» Архив пресс-релизов
» Авторам от редакции
» Добавить пресс-релиз

Самое-самое //
Пресс-релизы // » Добавить пресс-релиз

ИИ «Шерлок» выходит на рынок Ирана и Пакистана

Российская ИИ-система «Шерлок» для распознавания и проверки документов, созданная Smart Engines, получила возможность работать с удостоверениями личности на урду и персидском языках.
Это стало возможным благодаря первому в мире специализированному датасету MIDV-UP, созданному учеными компании и включающему более 9000 изображений документов Пакистана и Ирана. Новый набор данных закрывает давний пробел в разнообразных и неперсонифицированных обучающих материалах и открывает «Шерлоку» выход на рынки с совокупным населением свыше 330 миллионов человек.

Результаты работы ученых были представлены на ведущей Международной конференции по анализу и распознаванию документов (ICDAR), прошедшей 16–21 сентября в Китае.

Актуальность задачи ученых

На сегодняшний день языковые технологии искусственного интеллекта поддерживают лишь небольшую часть из более чем 7000 языков мира. Алфавиты на основе латиницы уже давно освоены системами ИИ, в то время как обучение систем распознавания языкам с другими системами письменности происходит значительно медленнее. Особенно остро проблема обстоит с урду и персидским (фарси) – государственными языками Пакистана и Ирана. Оба языка используют модифицированный арабский алфавит и отличаются сложными лигатурами.

До настоящего времени существующие датасеты документов оставляли практически без внимания удостоверения личности на урду и персидском. Это препятствовало разработке технологий распознавания, способных работать с документами Пакистана и Ирана. Представленный Smart Engines датасет MIDV-UP впервые изменил эту ситуацию, обеспечив разработчиков качественными данными для обучения ИИ. В состав MIDV-UP вошли 1000 уникальных образцов удостоверений нескольких типов документов – ID-карт, водительских удостоверений и свидетельств о рождении Ирана, а также ID-карт Пакистана. В общей сложности в датасете содержится 9000 полностью аннотированных изображений, полученных безопасным методом синтеза – новым способом создания обучающих данных без использования документов реальных людей.

MIDV-UP охватывает широкий спектр сценариев предъявления документов – от сканов до фотографий и видеоклипов с естественными помехами: тенями, бликами и искаженной перспективой. Специалисты Smart Engines использовали MIDV-UP для обучения нейросетевого ансамбля «Шерлок», предназначенного для распознавания и комплексной проверки физических и цифровых документов.

«Шерлок» выходит на новые рынки

«Шерлок» способен работать одновременно в видимом, ультрафиолетовом и инфракрасном диапазонах, анализировать голограммы и другие защитные элементы, осуществляя в общей сложности более 600 проверок. Это дает возможность детектировать подделки любой сложности и качества, начиная с паспортов с измененными и переклееными фотографиями и заканчивая муляжами и дипфейками. Решение было разработано при финансовой поддержке Фонда содействия инновациям и используется в пунктах автоматического паспортного контроля в аэропортах «Шереметьево», «Внуково» и «Кольцово», а также в РЖД, ФНС и банковском секторе.

«Отсутствие надежных ИИ-решений долгое время оставляло неавтоматизированным огромный рынок цифровых услуг, требующих ввод данных из документов на урду и фарси. Благодаря нашему новому датасету эти документы больше не является преградой для «Шерлока». Сегодня устойчивый спрос на технологии распознавания наблюдается не только в самих Пакистане и Иране, но и в России и других государствах – чему способствуют значительные миграционные и образовательные потоки. Теперь стало возможным масштабировать «Шерлока» как внутри страны, так и на международных рынках», – отмечает один из авторов MIDV-UP, генеральный директор Smart Engines, д.т.н. Владимир Арлазаров.

О конференции

Международная презентация MIDV-UP состоялась на главном мировом научном форуме в области анализа и распознавания документов – конференции ICDAR. Это ключевая площадка, где ежегодно собираются ведущие эксперты и исследователи со всего мира, чтобы обсудить передовые достижения и новые вызовы технологий распознавания и обработки изображений. Ученые Smart Engines ежегодно принимают участие в ICDAR, где представляют свои новейшие разработки.

Контактное лицо: Кирилл Зверев (написать письмо автору)
Компания: Smart Engines (все новости этой организации)
Добавлен: 10:00, 02.10.2025
Количество просмотров: 126
Страна: Россия

UDV Group: до 80% атак успешны из-за базовых ошибок: почему кибербезопасность остается слабым звеном российского бизнеса, UDV Group, 22:07, 28.04.2026, Россия
64
Российский бизнес продолжает оставаться уязвимым для кибератак - и причина здесь не столько в отсутствии технологий, сколько в системных ошибках их настройки и эксплуатации. По данным компании «Бастион», до 80% атак завершаются успехом злоумышленников именно из-за таких факторов.


«1С-Рарус» модернизировал систему регламентированного учета в «Самарской сетевой компании», 1С-Рарус, 22:07, 28.04.2026, Россия
63
«Самарская сетевая компания» совместно с «1С-Рарус» перевела регламентированный учет с «1С:Управление производственным предприятием» на «1С:Управление холдингом». Выполнена адаптация системы под специфику электросетевого предприятия. Обеспечена синхронизация данных по закупкам, запасам и финансам.


3Logic Group развивает подход к поставкам оборудования под собственными марками, 3Logic Group, 22:03, 28.04.2026, Россия
61
3Logic Group, дистрибьютор комплектующих и ИТ-решений, сообщает о развитии сервиса поставки оборудования под собственными торговыми марками Raskat, Crusader в рамках которого сборка оборудования для партнеров осуществляется без дополнительной оплаты.


«Гравитон» расширяет серверный портфель линейкой оборудования для проектов вне обязательного реестрового контура, «Гравитон», 22:00, 28.04.2026,
64
Разработчик и производитель отечественной вычислительной техники «Гравитон» объявляет о расширении ассортимента серверных решений и выделении новой категории оборудования. Компания выводит на рынок линейку высокопроизводительных серверов, предназначенную для реализации масштабных ИТ-проектов в сегментах, где наличие техники в реестре Минпромторга РФ не является обязательным требованием.


Интеграция сервисов «Телфин» и CURS24 повышает качество бизнес-коммуникаций, Телфин, 21:56, 28.04.2026, Россия
35
Провайдер коммуникационных сервисов «Телфин» объявил об интеграции виртуальной АТС «Телфин.Офис» с системой CURS24. Связка бизнес-приложений создает бесшовный рабочий процесс, обеспечивая свободный обмен данными между телефонией и CRM, повышая общую производительность, а также качество взаимодействия с клиентами.


Российские колледжи и школы закупили более 100 новейших дронов для обучения, Клевер Coex, 21:55, 28.04.2026, Россия
35
К 24 апреля компания «Клевер COEX» реализовала уже более 100 образовательных квадрокоптеров новейшей линейки «Клевер 5» с момента презентации продукта, и более 150 единиц готовятся к отгрузке.


«Группа Астра» и «Элерон» объединяют усилия для создания доверенных решений в сфере физической безопасности, Группа Астра, 21:53, 28.04.2026, Россия
34
«Группа Астра» и АО «ФЦНИВТ «СНПО «Элерон» (входит в Государственную корпорацию по атомной энергии «Росатом») заключили договор о совместной разработке доверенных программно-аппаратных комплексов. Документ был подписан в рамках конференции «Ассоциации крупнейших потребителей программного обеспечения и оборудования» (АКПО-Конф).


«Невский экологический оператор» перевел корпоративные коммуникации на отечественную платформу CommuniGate Pro, CommuniGate Pro, 21:52, 28.04.2026, Россия
31
«Невский экологический оператор» завершил проект по миграции на платформу унифицированных коммуникаций CommuniGate Pro.


«Хи-Квадрат» представил отечественную экосистему для создания и эксплуатации корпоративных приложений, Хи-Квадрат, 21:52, 28.04.2026, Россия
31
Компания «Хи-Квадрат» завершила производственные испытания экосистемы для разработки и эксплуатации бизнес-приложений, целиком построенной на базе отечественных компонентов


Сервер «Гравитон» С2124Б на базе российских процессоров Baikal-S включен в реестр Минпромторга России, «Гравитон», 21:51, 28.04.2026,
29
Компания «Гравитон», разработчик и производитель российской вычислительной техники, объявляет об успешном включении нового высокопроизводительного сервера «Гравитон» С2124Б в реестр промышленной продукции Минпромторга России.


Разделы //


Новости по странам //
Сегодня у нас публикуются //
Разработано AVart.Стуdия © 2008-2026 atrex.ru
  Rambler's Top100