Блок Хранения Данных

Системы хранения данных: как выбирать?! Ноябрь 30, 2020 – 02:25

Проект любой сложности, как ни крути, сталкивается с задачей хранения данных. Таким хранилищем могут быть разные системы: Block storage, File storage, Object storage и Key-value storage. В любом вменяемом проекте перед покупкой того или иного storage-решения проводятся тесты для проверки определённых параметров в определённых условиях. Вспомнив, сколько хороших, сделанных правильно растущими руками проектов прокололись на том, что забыли про масштабируемость, мы решили разобраться:

Какие характеристики Block storage и File storage нужно учитывать, если хотите, чтобы при росте проекта система хранения выросла вслед за ним
Почему отказоустойчивость на software уровне надежнее и дешевле, чем на hardware уровне
Как правильно проводить тестирование, чтобы сравнивать «яблоки с яблоками»
Как получить на порядок больше/меньше IOPS, поменяв всего один параметр

В процессе тестирования мы применяли RAID–системы и распределенную систему хранения данных Parallels Cloud Storage (PStorage). PStorage входит в продукт Parallels Cloud Server.

Начнем с того, что определим основные характеристики, на которые нужно обратить внимание при выборе системы хранения. Они же будут определять структуру поста.

Отказоустойчивость
Скорость восстановления данных
Производительность, соответствующая вашим запросам.
Консистентность данных

Отказоустойчивость

Самая важное свойство системы хранения данных – это то, что система призвана СОХРАНЯТЬ данные без каких-либо компромиссов, то есть обеспечивать максимальную доступность и ни в коем случае не потерять даже малой их части. Почему-то очень многие задумываются о производительности, цене, но мало внимания уделяют надежности хранения данных.

Для обеспечения отказоустойчивости в случае сбоя существует одна-единственная техника – резервирование. Вопрос в том, на каком уровне применяется резервирование. С некоторым грубым упрощением, можно сказать, что уровня два: Hardware и Software.

Резервирование на уровне Hardware давно зарекомендовало себя в Enterprise-системах. SAN/NAS коробки имеют двойное резервирование всех модулей (два, а то и три блока питания, пара плат «мозгов») и сохраняют данные одновременно на нескольких дисках внутри одной коробки. Лично я метафорически представляю это себе как очень безопасную кружку: максимально надежную для сохранения жидкости внутри, с толстыми стенками и обязательно с двумя ручками на случай, если одна из них сломается.

Резервирование на уровне Software только начинает проникать в Enterprise-системы, но с каждым годом отъедает все больший и больший кусок у HW решений. Принцип тут прост. Такие системы не полагаются на надежность железа. Они считают, что оно априори ненадежно, и решают задачи резервирования на уровне ПО, создавая копии (реплики) данных и храня их на физически разном железе. Продолжая аналогию с чашками, это — когда есть несколько совершенно обычных чашек, и ты разлил чай в обе, вдруг одна разобьется.

Таким образом, SW решения не требуют дорогостоящего оборудования, как правило, более выгодны, но при этом обеспечивают ровно такую же отказоустойчивость, хотя и на другом уровне. Их также легче оптимизировать, например, разносить данные на разные сайты, выполнять балансировку, менять уровень отказоустойчивости, линейно масштабировать при росте кластера.

Source: habrahabr.ru

Облако для Хранения › Облако для Хранения Данных

Необходимые ресурсы для хранения выделяются в облаке на условиях аренды, что позволит сэкономить на закупке, установке и поддержке ИТ-оборудования, а также специализированного ПО. Защита данных от несанкционированного доступа...

Хранение Персональных Данных › Хранение Персональных Данных

Президент России Владимир Путин подписал закон, обязывающий хранить персональные данные российских граждан только на территории России. Об этом сообщается на портале правовой информации. Во втором и третьем (окончательном)...

Технологии › Технология Хранения Базы Данных

Информационные технологии Технология обработки текстовой информации.Текстовый редактор Технология обработки графической информации.Графический редактор Технология обработки числовой информации.Электронные таблицы Системы управления...

Системы › Дисковая Система Хранения Данных

Практически каждый старается обеспечить качественное управление постоянно возрастающей сложностью ИТ-сред и ростом объема данных. И в большей мере это можно связать с тем разнообразием серверов, которые располагаются в нескольких...

Устройства Хранения Данных › Устройство Хранения Данных

Electrically Erasable Programmable Read-Only Memory, англ. flash memory), отличающиеся высокой скоростью доступа и возможностью быстрого стирания данных По энергозависимости (англ. nonvolatile storage) — ЗУ, записи в которых...