ArgoTech blog
Технологии News

Классификация современных систем хранения данных

За свою историю системы хранения эволюционировали от жестких дисков, подключаемых напрямую к серверам без какой-либо избыточности (DAS, direct attached storage) до способных обеспечить совместное использование дисковой емкости разными серверами высокопроизводительных масштабируемых отказоустойчивых решений с собственной операционной системой.



В настоящее время существует несколько классификаций СХД, впрочем, часто эта классификация довольно условна:

1. По уровню надежности и функциональности принято делить СХД на Entry Level, Midrange и Hi-End.


Подразумевается, что Entry Level системы начального уровня предназначены для решения определенного класса задач, не требующего высокого уровня надежности и функциональности. Оборудование имеет малые габариты, низкое потребление электроэнергии, низкий уровень шумов и допускает размещение систем в офисных помещениях и даже дома.

Hi-End системы предполагают самый высокий уровень надежности, что обеспечивается как многократным дублированием компонентов (блоки питания, вентиляторы, процессоры, диски, контроллеры, доступ к дискам по нескольким путям), так и программными решениями. Выход из строя любого компонента практически не влияет на функционирование системы.

Hi-End — это, как правило, габаритный комплект оборудования, требующий размещения в центре обработки данных (ЦОД) с резервированным электропитанием и климатической системой. Основной заказчик таких СХД — крупные организации, размещающие на Hi-End критичные для бизнеса данные систем управления предприятием, автоматизированные банковские системы, бухгалтерию.

Midrange-решения занимают нишу между системами начального уровня и Hi-End. Условную граница между ними достаточно сложно провести, но считается, что в Midrange обеспечивается отказоустойчивость и резервирование, но в случае выхода из строя какого-либо компонента не исключено заметное снижение производительности СХД.
Расширенная функциональность СХД, такая как репликация, поддержка виртуализации, компрессия, дедупликация обычно начинает поддерживаться с Midrange уровня.

2. По «привязке к оборудованию» СХД можно определить в 2 основные группы: классические СХД и программно-определяемые СХД.


Классические СХД, представляющие собой связку компонентов «оборудование — программное обеспечение» от единого производителя, представлены на рынке наиболее широко (по разным оценкам, не менее 70% предлагаемых СХД).

Тем не менее, современным трендом стали программно-определяемые (software defined) СХД. Вендоры оборудования приходят на рынок и уходят с рынка, и в этих условиях «привязывать» свою деятельность к классическим СХД для крупных компаний является большим риском. Многие крупнейшие интернет-компании, такие как Amazon, Google, Яндекс, VK, давно поняли, что требуемый уровень гибкости, надежности, производительности без привязки к какому-то определенному вендору оборудования могут обеспечить и программно-определяемые системы. Производимые многими компаниями по всему миру и легкодоступные универсальные серверы «стандартной» архитектуры высокой совместимости (x8664), т.н. commodity — стали строительными блоками для SDS.

3. По принципу масштабирования существуют вертикально масштабируемые и горизонтально масштабируемые (Scale-out) СХД.


В горизонтально масштабируемых системах, в отличие от вертикально масштабируемых, отсутствуют централизованные контроллеры. Расширение емкости хранения (и, как правило, производительности) происходит путем добавления активного (имеющего свои процессоры и программное обеспечение) дискового модуля и его подключения в сеть интерконнекта СХД. Клиенты СХД могут обращаться к данным через любой модуль.

4. По методу доступа СХД подразделяются на файловые, блочные и объектные.


Файловый доступ лучше всего подходит для доступа к целым файлам и имеет механизмы блокировки для многопользовательского доступа, предотвращающие повреждение файлов.

При обращении к блочной системе клиент оперирует механизмами адресации блоков хранения данных и сам управляет информацией, находящейся в каждом блоке. Блочный доступ очень хорошо подходит для размещения баз данных, где часто происходит изменение определенных блоков в файлах.

Объектный доступ появился не так давно и уже успел завоевать популярность, т.к. обеспечивает высочайшую масштабируемость из-за «плоской» структуры хранения. У объектов в системе существуют метаданные, многие могут быть созданы/определены, исходя из потребностей в них пользователей, что позволяет гибко настраивать системы хранения неструктурированных данных, масштабные архивы, системы документооборота и аналитики на основе объектных СХД.