|
|
|
|
Команда Центра когнитивных технологий (ГК «АйТеко») вошла в тройку лидеров на международных соревнованиях по NLP
Специалисты Центра когнитивных технологий (ГК «АйТеко») заняли второе и третье места Открытого соревнования по многоязычному распознаванию именованных сущностей BSNLP-2019. Высокий результат достигнут с помощью системы лингвистической обработки текста, используемой центром в инновационном продукте SmartCS. Открытое соревнование по многоязычному распознаванию именованных сущностей BSNLP организовано Проблемной группой по автоматической обработке славянских языков Ассоциации компьютерной лингвистики и проводится с целью оценки и анализа текущего уровня развития технологии NLP (Natural Language Processing, обработка естественного языка) для определенной группы языков или отдельного языка. По итогам соревнования организация публикует выводы о качестве решения задач в рассматриваемом сегменте, методах и общих тенденциях.
В этом году в соревновании приняли участие 8 команд. Они продемонстрировали возможности разработанных систем распознавания именованных сущностей для текстов на болгарском, чешском, польском и русском языках. Правила позволяли ограничиться одним языком или представить решение сразу для нескольких.
Команда Центра когнитивных технологий «АйТеко» приняла участие в двух дорожках соревнования: распознавании и лемматизации именованных сущностей для текстов на русском языке. Под именованными сущностями подразумеваются описывающие определенные объекты слова и фразы. В поставленной задаче требовалось извлечь из набора текстов пять типов таких объектов: персоны, локации, организации, события и продукты. Лемматизация — это одна из ключевых задач NLP для языков с развитой системой словоизменения, к которым относится и русский язык. При ее решении различные варианты написания сущностей приводятся к установленному.
Подобные задания отражают реальные потребности рынка обработки естественного языка и востребованы в различных контекстах. Например, для определения темы текстов, установления связей на основе упоминаемых в них географических мест или лиц, извлечения других фактов. Организаторы предложили участникам работу с двумя современными датасетами, источником для которых стали новостные сообщения русскоязычных онлайн-СМИ за март - апрель 2019 года.
«Мы хотели в первую очередь определить качество наших базовых технологий распознавания именованных сущностей на признанных мировым сообществом тестовых данных. Соревнование BSNLP-2019, несомненно, следует лучшим традициям подобных соревнований и не предоставляет возможных преимуществ определенному научному подходу или конкретной компании», — прокомментировал участие в соревновании старший лингвист Центра когнитивных технологий «АйТеко», к.ф.н. Сергей Куликов.
На дорожке распознавания именованных сущностей команда ЦКТ заняла второе место, обойдя конкурентов с признанной на международном уровне экспертизой: Институт информатики Вроцлавского университета (Польша), NLP-Cube (совместная разработка румынского подразделения Adobe Systems и Исследовательского института искусственного интеллекта Румынской академии наук) и Центр компетенций текстовой аналитики Объединенного исследовательского центра ЕС.
На дорожке лемматизации эксперты Центра когнитивных технологий «АйТеко» вошли в тройку лучших. В рамках соревнования применялась упрощенная версия системы лингвистической обработки текста, используемая в интеллектуальной системе корпоративного поиска SmartCS.
«Для нас значимо, что подобный результат был достигнут с помощью системы, являющейся основой наших коммерческих продуктов, которую мы незначительно адаптировали к решению соревновательных задач, — отметил руководитель ЦКТ, к.т.н. Илья Калагин. — Высокое качество и точность обработки обеспечиваются применяемым нами гибридным подходом с использованием комбинации интеллектуальных правил и методов машинного обучения».
Контактное лицо: Пресс-служба «АйТеко» (написать письмо автору)
Компания: ГК «АйТеко» (все новости этой организации)
Добавлен: 15:09, 10.06.2019
Количество просмотров: 322
Страна: Россия
В Санкт-Петербурге комитет по делам ЗАГС запустил свой чат-бот, itrend, 03:32, 26.04.2024, Россия |
121 |
Чат-бот «Комитет по делам ЗАГС Санкт-Петербурга» запустили в рамках развития экосистемы городских сервисов «Цифровой Петербург». Новый бот доступен в Telegram, с его помощью можно ознакомиться с полной информацией об услугах и работе муниципального ЗАГСа. |
|
INVENTORUS разместила цифровую платформу для поиска инноваций в облаке НУБЕС (Nubes), ООО Нубес, 03:31, 26.04.2024, Россия |
121 |
Компания INVENTORUS развернула свою ИТ-инфраструктуру в облаке нового поколения NGcloud. На облачных ресурсах Nubes размещается масштабная база данных об инновациях, а также цифровая платформа для поиска и работы с ними. Для быстрого доступа и надежного хранения информации компания использует сервис облачного хранилища S3. |
|
МФК “Лайм-Займ” выступила на конференции Foresight Day 2024, МФК «Лайм-Займ», 03:31, 26.04.2024, Россия |
119 |
Эксперты МФК “Лайм-Займ” поделились опытом внедрения цифровых продуктов вендора «Форсайт» на конференции Foresight Day 2024, которая состоялась 23 апреля в кластере “Ломоносов” (г. Москва). Цель мероприятия - объединить представителей бизнеса и ускорить цифровую трансформацию на базе российского ПО. |
|
|
|
|
|
|
Разделы //
Новости по странам //
Сегодня у нас публикуются //
|
|