ATREX.RU
Пресс релизы коммерческих компаний и общественных организаций
ATREX.RU
» Пресс релизы сегодняшнего дня
» Архив пресс-релизов
» Авторам от редакции
» Добавить пресс-релиз

Самое-самое //
Пресс-релизы // » Добавить пресс-релиз

IT_ONE разработала ETL-продукт для наполнения хранилищ данных – OneData

Компания IT_ONE (ООО «ИТ1-Технологии») разработала ETL-продукт по перемещению и интеграции данных в хранилищах – OneData. Новый фреймворк поддерживает большинство популярных типов источников и приемников данных, высокую скорость развертывания и отличается простотой настройки.

Деятельность коммерческих компаний связана с генерацией огромных массивов данных. Для их размещения и обработки используются озера данных (Data Lake), сложные распределенные хранилища, аналитические системы и другие технологии. При этом важным процессом является регулярная актуализация и пополнение этих данных из внешних систем-источников, разнородных по типу взаимодействия с ними и по типу передаваемых данных.

OneData оптимизирует деятельность ИТ-команд компаний-заказчиков, занимающихся наполнением хранилищ данных. Продукт – альтернатива популярным западным проприетарным продуктам, многие из которых сегодня недоступны в России, а также продуктам на основе открытого ПО, которые могут не подходить заказчику по функциональности.

OneData состоит из четырех основных структурных компонентов: web-интерфейса конфигурирования, базы данных конфигураций потоков перемещения данных, сервиса обработки данных на базе Spark и оркестратора потоков на базе Apache Airflow. Решение поддерживает наиболее популярные в России источники и приемники данных. Например, оно работает с JDBC-источниками и брокером сообщений Apache Kafka, а в качестве приемников могут выступать файловые хранилища (HDFS, S3, FTP), JDBC, таблица Hive.

Работа в OneData происходит следующим образом. Администратор формирует конфигурацию потока перемещения данных, которая сохраняется в БД, и расписание запуска потока. В том же конфигурационном файле можно указать дополнительные настройки: например, количество ресурсов, которое будет запрашивать spark-процесс, преобразования типов полей и т. д. Параллельно происходит формирование DAG-файла и импорт его в Airflow для постановки потока на расписание. По расписанию происходит вызов Spark-процесса, который в соответствии с заданной конфигурацией осуществляет перемещение данных из источника в приемник. Использование Spark обеспечивает высокую скорость перемещения: эффективное распараллеливание, получение и запись данных.

Кроме того, при сохранении в файловую систему фреймворк поддерживает самые разные форматы файлов: orc, parquet, csv, json, deltalake. Чтение из Kafka может сопровождаться валидацией входящих json-сообщений по указанной json-схеме. Сообщения, не прошедшие валидацию фреймворк может бережно сложить в указанный DLQ-топик (Dead Letter Queue topic). Эти опции еще более расширяют функциональность продукта.

К числу преимуществ нового решения относится его оперативное развертывание. Основной Spark-процесс можно запустить даже локально, но для использования всех преимуществ рекомендуется Hadoop-кластер с YARN или Kubernetes-кластер. Конфигурация процессов перемещения данных может храниться в json-файлах или в любой доступной БД PostgreSQL. Оркестрация потоков осуществляется с помощью Airflow, который можно развернуть рядом или использовать уже имеющийся.
OneData прост в настройке, ее может осуществить даже специалист без навыков программиста или DevOps.

В соответствии с «дорожной картой» развития OneData, компания IT_ONE планирует дополнить продукт такими функциями, как маскирование данных, перенос изменений в метаданных, поддержка новых типов источников и приемников, автоматическая проверка консистентности перемещенных данных. Также готовится ряд технологических доработок, которые должны облегчить эксплуатацию фреймворка: это фиксация метрик работы потоков перемещения данных, интеграция с системами мониторинга и т. д.

«Имея богатый опыт внедрения хранилищ и озер данных, в сложившейся на рынке ситуации мы почувствовали необходимость разработки собственного фреймворка перемещения данных. OneData способен радикально сокращать время и трудозатраты в таких задачах, как, например, наполнение Stage/ODS слоев, подключение новых источников данных к хранилищам или наполнение пользовательских песочниц. С каждым спринтом OneData становится всё более быстрым, удобным и совершенным», – комментирует ведущий менеджер проектов IT_ONE Александр Самойлов.

IT_ONE (https://www.it-one.ru) — компания по разработке программного обеспечения для крупных игроков российского бизнеса и созданию собственных технологических решений и инноваций.

Контактное лицо: Татьяна Алексеева (написать письмо автору)
Компания: IT_One (все новости этой организации)
Добавлен: 22:31, 06.12.2023
Количество просмотров: 78
Страна: Россия

(Без)облачная безопасность: как защититься от уязвимости в Power Pages, ООО "Газинформсервис", 21:08, 21.02.2025, Россия
8
Microsoft выпустила экстренное обновление безопасности, устраняющее уязвимость нулевого дня (CVE-2025-24989) в своей платформе веб-разработки — облачном сервисе Power Pages. По данным BleepingComputer, эта уязвимость уже активно используется злоумышленниками для проведения атак. Она позволила злоумышленникам повышать привилегии, обходя систему авторизации.


Решение Axenix для управления данными Dat.ax включено в Реестр российского ПО, Axenix, 21:06, 21.02.2025, Россия
9
Dat.ax – комплексная среда разработки, управления и развития платформ данных и аналитических систем. Функциональность Dat.ax позволяет выстроить сквозной процесс автоматизации разработки data-продуктов от появления новых требований до промышленной эксплуатации.


Fork-Tech: До конца 2025 года компании сократят 15-20% ИТ-персонала, Fork-Tech, 21:06, 21.02.2025, Россия
8
Сокращения сотрудников в ИТ-секторе до конца 2025 года могут достигнуть 15-20%, считают эксперты финтех-разработчика и интегратора Fork-Tech, который также предоставляет услуги ИТ-аутстафинга.


LG ПРЕДСТАВИТ НОВЫЙ БРЕНД «SKS» ДЛЯ ПРЕМИАЛЬНОЙ ЛИНЕЙКИ ВСТРОЕННОЙ БЫТОВОЙ ТЕХНИКИ SIGNATURE KITCHEN SUITE НА ВЫСТАВКЕ KBIS 2025, LG Electronics, 21:05, 21.02.2025, Россия
9
LG Electronics (LG) анонсирует ребрендинг своей линейки SIGNATURE KITCHEN SUITE1, заменив название аббревиатурой SKS2.


Совместимость «Триафлай» и Proxima DB поможет автоматизировать финансово-хозяйственную деятельность предприятий, Триафлай, 20:36, 21.02.2025, Россия
25
ИТ-разработчик модульной no-code платформы прикладных аналитических решений «Триафлай» и российский вендор инфраструктурного ПО для Enterprise-бизнеса Orion soft подтвердили совместимость платформы «Триафлай» и СУБД Proxima DB.


ПРОСВЕТИТЕЛЬСКИЙ МАРАФОН LG «НАСТАВНИЧЕСТВО. СОЗДАВАЯ БУДУЩЕЕ КОММУНИКАЦИЙ» ПОЛУЧИЛ ПРЕМИЮ DIGITAL COMMUNICATIONS AWARDS – 2025, LG Electronics, 20:31, 21.02.2025, Россия
29
18 февраля в Москве наградили лауреатов премии Digital Communications AWARDS – 2025 от Ассоциации директоров по коммуникациям и корпоративным медиа России (АКМР).


Премиальная сеть магазинов парфюмерии и косметики РИВ ГОШ строит платформу для работы с данными, используя Arenadata DB, Navicon, 20:27, 21.02.2025, Россия
25
Премиальная сеть магазинов парфюмерии и косметики РИВ ГОШ в рамках достижения технологического суверенитета реализует проект по миграции корпоративного хранилища данных на продукт Arenadata DB (ADB) российского производителя программного обеспечения Arenadata.


Hybrid разработал инструмент для оценки эффективности рекламных каналов, Hybrid, 20:26, 21.02.2025, Россия
24
AdTech-экосистема Hybrid, один из лидеров в разработке высокотехнологичных решений для интернет-рекламы, разработала инструмент Flow Source, позволяющий брендам оценить влияние каждого из рекламных каналов (Desktop, Mobile web, In-App, TV) и органических охватов на их продвижение в digital.


SIMETRA поставила отечественную платформу RITM³ в Государственный университет управления, Simetra, 20:26, 21.02.2025, Россия
28
В рамках соглашения студенты вуза получат доступ к актуальным знаниям и практикам в области транспортного прогнозирования, а также смогут познакомиться и освоить технологические решения для реализации проектов на транспорте – SIMETRA оснастила ГУУ российской ИТС-платформой RITM³.


STEP LOGIC вырос на 13 позиций в рейтинге поставщиков решений для защиты информации, STEP LOGIC, 17:55, 20.02.2025, Россия
148
Компания заняла 19 место в ежегодном рейтинге «CNews Analytics: Крупнейшие поставщики решений для защиты информации».


Разделы //


Новости по странам //
Сегодня у нас публикуются //
Разработано AVart.Стуdия © 2008-2025 atrex.ru
  Rambler's Top100