Решение «Фабрика данных» (Digital Q.DataFactory) предназначено для объединения разрозненных данных в единое хранилище, аналитики данных, автоматизации подготовки признаков ML-моделей, машинного обучения предиктивных моделей и визуализации данных

Фабрика данных
промышленное решение
Data Lakehouse

S3 Архипелаг

Data Lakehouse

Единое хранилище для аналитики с поддержкой Apache Iceberg и Apache Hudi

Резервное копирование 

Надежное хранение бэкапов с Erasure Coding и защитой от удаления

Микросервисы 

Масштабируемое хранилище для контейнерных приложений с S3 API
Быстрое и надежное S3-совместимое объектное хранилище
с мгновенным доступом через API и веб-интерфейс

ML/AI платформы 

Хранение датасетов, моделей и артефактов машинного обучения

Документооборот

Версионирование файлов и защита от случайного удаления

Импортозамещение 

Замена Amazon S3, Ceph, MinIO
с соответствием требованиям КИИ
Решаемые задачи

Сложности при работе
с данными

Интеграция данных

  • Разрозненность источников (БД, файлы, IoT)
  • Ручное отслеживание изменений

Обработка и анализ

  • Ограниченные инструменты
  • Неавтоматизированные ETL-процессы

Хранение данных

  • Отсутствие единого хранилища
  • Неподдерживаемые форматы (геоданные, потоки и т. д.)

Безопасность

  • Риски НСД
  • Отсутствие гранулярного доступа

Производительность

  • Низкая скорость доступа (10 МБ >1 сек.)
  • Ограниченная масштабируемость
  • Отсутствие CI/CD
  • Сложность мониторинга

DevOps и эксплуатация

  • Отсутствие CI/CD для ML-моделей
  • Неавтоматизированные процессы сбора данных, обучения и построения моделей

MLOps

Управление данными

  • Отсутствие единого каталога данных
  • Отсутствие контроля качества данных
Компоненты MLOps и распределенных вычислений для разработки и обучения ML-моделей
Единый портал данных для доступа пользователей к данным
Компоненты для разработки аналитических приложений: загрузка, контроль качества, обработка и визуализация данных
Инфраструктурные компоненты, обеспечивающие выполнение процессов фабрики данных

Делаем данные полезными

Решение помогает заказчикам максимально эффективно извлекать пользу из данных за счет автоматизации всего процесса — от сбора и обработки данных до решения задач прогнозирования
ИНЖЕНЕРЫ И АНАЛИТИКИ ДАННЫХ
Бизнес-пользователи
Digital Q.ReportCenter
Digital Q.Sensor BI
ИИ
Digital Q.GPT
ИСТОЧНИКи ДАННЫХ
JDBC
API
ODBC
LOG
EVENT
ERP
Безопасность
Digital Q.Security
РАЗВЕРТЫВАНИЕ
КОМПОНЕНТОВ
Enterprise MGR
ОРКЕСТРАЦИЯ
И МАСШТАБИРОВАНИЕ
ВЫЧИСЛЕНИЕ
МЕТАДАННЫЕ
Digital Q.DataBase
ХРАНЕНИЕ ДАННЫХ
Объектные хранилища
S3 Архипелаг/MinIO/Ceph
ЗАГРУЗКА
И ПРЕОБРАЗОВАНИЕ ДАННЫХ
Digital Q.DataFlows
Digital Q.Reference
Digital Q.BPM
Управление данными
ML-инженеры

Архитектура решения

* Все open source компоненты, представленные в архитектуре решения, взяты под ответственное владение компании «Диасофт». Специалисты компании отвечают за их стабильную работу, развитие и сопровождение.


ФУНКЦИОНАЛ РЕШЕНИЯ

  • Spark — система пакетной и потоковой обработки больших данных в распределенном кластере: упрощает реализацию ETL-конвейеров, аналитику и машинное обучение;
  • Impala — система выполнения SQL-запросов для массивно-параллельной обработки (MPP);
  • Trino — система выполнения федеративных SQL-запросов для массивно-параллельной обработки (MPP).
Digital Q.DataFactory

Преимущества решения

Построено на современной lakehouse-архитектуре, снижающей стоимость TCO данных на 40−60%
Универсальное хранилище данных
Единая
ответственность
Ответственность за все компоненты решения от прикладных сервисов до инфраструктурных платформ, поставляемых компанией
Хранение данных, подготовка оперативной отчетности, построение дашбордов, обработка процессов риск-менеджмента, машинное обучения и глубокая аналитика данных
Подходит
для различных задач
Возможности фреймворка построения конвейеров обработки данных позволяют ускорить разработку и снизить уровень требований к квалификации дата-инженеров для разработки на платформе
Снижение стоимости разработки
Возможности использования AI
Среда разработки и эксплуатации ML-моделей с поддержкой фреймворков глубокого обучения. Аналитика данных с использование LLM
Гибкая масштабируемость
Разделение слоев хранения и обработки данных, которое позволяет масштабировать каждый из них независимо друг от друга
Подробнее
Подробнее
Подробнее
Подробнее
Подробнее
Подробнее

Источник данных

CRM/ERP
IoT-датчики
Банковские
транзакции
SCADA-системы

Хранилище и контроль качества данных

OpenMetadata

Контроль
качества данных
Lineage-
трекинг
Валидация
данных
Каталогизация метаданных
S3 +

BI и отчетность

Дашборды

ML-модели

А/В-тестирование
Фрод-детекция (банки)
Прогноз аварий (нефтегаз)
Digital Q.Sensor BI

Предиктивная
аналитика

Автоматизация

Заявки
во внешние системы
Алерты инженерам
Инцидент-менеджмент
Spark ML
Feature Store

Бизнес-процессы

Digital Q.BPM

Обработка
данных

Запросы

Данные о клиенте
Данные с датчиков

Загрузка и обработка

KPI эффективности
Real-time
фрод-карта
Карта
аварийности
Конвертация в
Фильтрация
аномалий
Буферизация
офлайн-данных

Операции

Digital Q.DataFlows

Бизнес-процесс: как работает решение

рейтинги и награды

CNewMarket подготовил уникальный обзор российских платформ управления данными, предназначенных для комплексной работы с разнородной корпоративной информацией.
В декабре 2025 года Санкт-Петербургский Клуб ИТ-директоров провёл собственное независимое исследование платформ управления данными DMP.

расскажем, как превратить данные
в реальную ценность

Презентация решения «Фабрика данных»

Устали от хаоса в данных?

Ваши данные разбросаны по разным системам, а их обработка отнимает дни? Фабрика данных — это готовое решение для создания единой и автоматизированной платформы управления данными.

Скачайте презентацию, чтобы увидеть, как это работает, и получить обзор ключевых возможностей платформы
новости и публикации

Часто задаваемые вопросы

Digital Q. DataFactory — это современная платформа для подготовки, интеграции и управления корпоративными данными. Решение объединяет различные источники информации, выполняет очистку и трансформацию данных, обеспечивает их качество и доступность для аналитических систем и бизнес-приложений.
Компания «Диасофт» — один из лидеров российского рынка корпоративных ИТ-решений. Компания более 30 лет помогает клиентам повышать эффективность работы, в том числе за счет цифровой трансформации бизнеса.

В портфеле компании «Диасофт» — решения для финансового сектора, промышленности, энергетики, логистики и других отраслей экономики.

О компании

сотрудников
в компании
2 200+
программных продуктов компании включены в Единый реестр российских программ
для ЭВМ и баз данных
250+
«Диасофт» входит в экспертный совет при МинЦифры РФ (с момента образования совета)
2015
с
года
250+
проектов в год по внедрению
сложных IT-систем
на рынке
информационных услуг
лет
35
Остались вопросы?

Оставьте заявку на презентацию Digital Q.DataFactory, получение записи вебинара или консультацию руководителя решения

ОБРАТНАЯ СВЯЗЬ

Продолжая использовать и/или оставаясь на сайте, вы соглашаетесь с Политикой конфиденциальности сайта, включая использование сайтом файлов «cookie».
ОК