S3 Архипелаг — объектное хранилище для Data Lakehouse

Быстрое и надежное S3-совместимое объектное хранилище с мгновенным доступом через API и веб-интерфейс

Связаться с экспертом и получить консультацию с демонстрацией решения «Диасофт»

Data Lakehouse

Единое хранилище для аналитики с поддержкой Apache Iceberg и Apache Hudi

Резервное копирование 

Надежное хранение бэкапов с Erasure Coding и защитой от удаления

Микросервисы 

Масштабируемое хранилище для контейнерных приложений с S3 API

ML/AI платформы 

Хранение датасетов, моделей и артефактов машинного обучения

Документооборот

Версионирование файлов и защита от случайного удаления

Импортозамещение 

Замена Amazon S3, Ceph, MinIO
с соответствием требованиям КИИ

Решаемые задачи

S3 API 

полная совместимость с AWS S3, работа с aws-cli, boto3, стандартными SDK

Множество интерфейсов 

S3, FUSE, WebDAV, HDFS, gRPC для любых сценариев интеграции

Erasure Coding 

эффективное использование дисков, накладные расходы 40% вместо 200%

Версионирование 

сохранение предыдущих версий объектов с возможностью восстановления

Lifecycle Policies 

автоматическое управление жизненным циклом: архивирование, перемещение, удаление

Шифрование данных

AES-256 в покое, TLS 1.3 при передаче, ключи хранятся отдельно от данных

Cross-Region Replication

асинхронная репликация в резервный ЦОД для катастрофоустойчивости

Object Lock 

защита от удаления на заданный срок, соответствие требованиям регуляторов

Bitrot Protection 

периодическая проверка контрольных сумм и автоматическое восстановление данных

Функциональность продукта

Хранить любые
объёмы данных

Линейное масштабирование до экзобайт
Эффективная работа с миллионами мелких файлов
Поддержка горячих, тёплых и холодных данных
Автоматическое распределение по узлам кластера

Интегрироваться с любыми системами

Полная совместимость с AWS S3 API
Монтирование как файловая система (FUSE)
Интеграция с Hadoop-экосистемой (HDFS)
Работа со Spark, Trino, Apache Iceberg, Apache Hudi

Соответствовать требованиям регуляторов

Работа на российских ОС (Astra Linux, РЕД ОС, Alt Linux)
Соответствие КИИ, ИСПДн, ГИС

С S3 Архипелаг вы сможете:

Линейная
масштабируемость

Архитектура Master-Volume-Filer позволяет хранить сотни миллиардов файлов без деградации

Горячее
масштабирование

Инфраструктурные компоненты, обеспечивающие выполнение процессов фабрики данных

Консолидация
хранилищ

Замена объектного и файлового хранилища одной платформой — экономия CAPEX и OPEX

Гибридная отказоустойчивость

Репликация для горячих данных, Erasure Coding для холодных — экономия до 50% дисков

Многоуровневая безопасность

Шифрование, LDAP/AD, Kerberos, защита от удаления — соответствие требованиям регуляторов

Простота
эксплуатации

Не требует команды экспертов, веб-интерфейс администрирования, готовые Grafana-дашборды

Ключевые преимущества

Архитектура S3 Архипелага

Интерфейсы
Filer REST
gRPC
WebDAV
FUSE mount S3
S3 Gateway
Сервера хранения
Горячие данные
NVME
Теплые данные
SSD
Холодные данные
HHD
Файловый менеджер
Управление метаданными
Мастерноды
Метаданные
Digital Q.DataBase
Архитектура хранилища с многоуровневым хранением данных и разделением слоев обеспечивает независимое масштабирование метаданных и данных, высокую доступность и гибкость хранения в зависимости от класса данных:
Запросите демо-версию S3 Архипелаг и протестируйте бесплатно
На основе тестов, проведенных на идентичном железе (6 серверов, 12 NVMe дисков на каждом, 10GbE сеть):

Быстродействие S3 Архипелага

Сравнение потребления ресурсов на 1 TB данных:
S3 Архипелаг показывает стабильную производительность даже при заполнении кластера до 80% (деградация всего -8,6%), что выгодно отличает его от аналогов.

Потребление ресурсов

S3 Архипелаг потребляет в 2–3 раза меньше ресурсов, чем Ceph, что позволяет использовать более дешевое железо или хранить больше данных на существующей инфраструктуре.
Кейсы использования
Организации

Банки и финтех — хранение транзакционных логов, бэкапов, данных для антифрод-аналитики

Ритейл и e-commerce — каталоги товаров, изображения, аналитика поведения покупателей

Телеком — CDR-записи, логи сетевого оборудования, данные биллинга

Госсектор — архивы документов, данные для межведомственного обмена, соответствие КИИ

Производство — для хранения данных IoT-датчиков и недропользователей

Роли

Архитекторы данных — проектирование Data Lakehouse и интеграция с аналитическими системами

DevOps и SRE — развёртывание, мониторинг, автоматизация через Helm и Kubernetes

Инженеры ML — хранение датасетов и моделей, интеграция с MLflow и DVC

Специалисты ИБ — настройка шифрования, политик доступа, аудита для SIEM

Кому подходит

новости и публикации
Остались вопросы?

Оставьте заявку на презентацию Digital Q.DataFactory, получение записи вебинара или консультацию руководителя решения

ОБРАТНАЯ СВЯЗЬ

Продолжая использовать и/или оставаясь на сайте, вы соглашаетесь с Политикой конфиденциальности сайта, включая использование сайтом файлов «cookie».
ОК