ATREX.RU
Пресс релизы коммерческих компаний и общественных организаций
ATREX.RU
» Пресс релизы сегодняшнего дня
» Архив пресс-релизов
» Авторам от редакции
» Добавить пресс-релиз

Самое-самое //
Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева (написать письмо автору)
Компания: IT_One (все новости этой организации)
Добавлен: 22:31, 06.12.2023
Количество просмотров: 144
Страна: Россия

«Телфин» внедряет транскрибацию и саммари звонков в «Битрикс24» для ИИ-анализа коммуникаций с клиентами, Телфин, 23:22, 14.04.2026, Россия
90
Провайдер коммуникационных сервисов «Телфин» расширил возможности интеграции АТС «Телфин.Офис» с «Битрикс24» и запустил транскрибацию и резюмирование звонков в CRM.


«1С‑Рарус» ускорил бюджетирование на Ижевском радиозаводе с 1С:Корпорация, 1С-Рарус, 23:24, 14.04.2026, Россия
111
Ижевский радиозавод и «1С-Рарус» завершили внедрение централизованной системы бюджетирования и финансового планирования. Система создана на базе комплекса решений «1С:Корпорация». Проект охватил 10 юрлиц предприятия с автоматизацией 500 рабочих мест. Внедрение на 10% ускорило ежегодный процесс бюджетирования.


Выручка GreenData за 2025 год превысила 1,8 млрд рублей, GreenData, 23:24, 14.04.2026, Россия
88
Компания GreenData, российский разработчик low-code-платформы, объявила финансовые результаты за 2025 год. Несмотря на возросшую налоговую нагрузку и сложность проектов, выручка компании увеличилась на 25%, а прибыль (EBITDA) выросла более чем в 5 раз.


Minervasoft: Спрос на ИИ-базы знаний вырос втрое, Minervasoft, 23:24, 14.04.2026, Россия
89
По итогам 2025 года спрос на базы знаний с искусственным интеллектом увеличился в три раза. На динамику рынка повлияла синергия факторов: глобальный тренд на внедрение ИИ-ассистентов и острая потребность бизнеса в оптимизации работы линейного персонала.


В линейке продуктов ИНКА 4.0 обновлен модуль для работы с данными в промышленности, Инка, 23:24, 14.04.2026, Россия
89
В линейке продуктов российской платформы ИНКА 4.0 обновлен функциональный модуль нормативно-справочной информации «ИНКА.НСИ».


iSpring входит в топ-3 крупнейших игроков российского рынка HRTech, iSpring, 23:24, 14.04.2026, Россия
95
Компания iSpring заняла первое место в сегменте обучения и развития персонала по итогам 2025 года, согласно данным Smart Ranking. Выручка компании достигла 3,9 млрд рублей, увеличившись на 9,5% по сравнению с предыдущим годом.


Новый NLU Suite от BSS: как создать кастомную языковую модель с минимальными затратами, BSS, 23:23, 14.04.2026, Россия
87
Обновленный инструмент для обучения моделей позволяет адаптировать LLM под локальные задачи благодаря методу LoRA: он обучает только дополнения, не затрагивая всю модель. После такой адаптации качество ответов в среднем растет на 15%, а компактные модели обгоняют недообученные большие на целевых запросах.


«Группа Астра» представила неизменяемый режим Astra Linux Server для растущего рынка контейнеризации, Группа Астра, 23:22, 14.04.2026, Россия
86
«Группа Астра», ведущий российский разработчик инфраструктурного ПО, представила неизменяемый (immutable) режим работы Astra Linux Server. Новый режим предназначен для запуска прикладного ПО в контейнерах с использованием Docker, Podman или Kubernetes. Он позволяет организовать инфраструктуру как код, снизить затраты на развертывание и обновление ОС, а также повысить удобство администрирования.


Компания “Андагар” разработала ИИ-оператора для SEMANTEX: СЕРМ-анализ ускорился в 10 раз, Андагар, 23:18, 14.04.2026, Россия
90
Новый инструмент от ИТ-компании "Андагар" автоматизирует СЕРМ-анализ и позволяет в 10 раз ускорить обработку больших массивов страниц с упоминаниями брендов и продуктов.


«Группа Астра» представила неизменяемый режим Astra Linux Server для растущего рынка контейнеризации, "Группа Астра", 23:13, 14.04.2026, Россия
92
«Группа Астра», ведущий российский разработчик инфраструктурного ПО, представила неизменяемый (immutable) режим работы Astra Linux Server. Новый режим предназначен для запуска прикладного ПО в контейнерах с использованием Docker, Podman или Kubernetes. Он позволяет организовать инфраструктуру как код, снизить затраты на развертывание и обновление ОС, а также повысить удобство администрирования.


Разделы //


Новости по странам //
Сегодня у нас публикуются //
Разработано AVart.Стуdия © 2008-2026 atrex.ru
  Rambler's Top100