Re[15]: Выбор NoSQL
От: chaotic-kotik  
Дата: 16.06.16 06:54
Оценка: :))
S>А можно пояснить, каким именно образом мне удастся прочитать битый сектор? С учётом CRC на уровне контроллера.
Я же написал как. CRC защищает от небольших повреждений (bit flip). В этом случае контроллер может попереворачивать биты сверяя CRC, но этот процесс не гарантирует ничего на 100%. Как минимум, может повредиться сама контрольная сумма. Как максимум — несколько повреждений в одном секторе гарантированно приведут к URE.

CK>>Даже из RAID-5 массива их можно прочитать.

S>Пруфлинк в студию.

google -> "RAID5 URE"

CK>>Термин "high-availability" подразумевает что твой кластер может пережить потерю до трети машин без перерывов в обслуживании.

S>Откуда такое определение? Сами придумали? Термин availability означает процент времени работы, в течение которого система остаётся доступной. High availability — термин неформальный, означает просто "высокий процент доступности". Каким способом он досигается — вопрос вторичный. Можно брать более качественные компоненты, можно закладывать избыточность прямо внутрь отдельной машины (например, дублируют блок питания), можно увеличивать количество машин в кластере.

Из CAP. HA система, это практически всегда AP система, которой, для того чтобы пережить F fail-stop отказов нужно 2F + 1 машин. Про "треть" машин я написал подразумевая трехмашинную конфигурацию (о которой шла речь). Высокая доступность тут достигается за счет кворума и избыточности. За счет одних только железок достижение высокой доступности едва ли возможно. Поэтому люди и обсуждают availability и fault-tolerance в одном контексте, так как первое достигается за счет второго даже на ширпотребном железе. Доступность на разных уровнях означает разное, дополнительный блок питания это хорошо, RAID массив тоже хорошо, но если я пытаюсь записать данные в БД и запрос отваливается по таймауту, считается что система недоступна в данный момент, это даунтайм. А это может быть даже если все железо работает хорошо, никаких железных отказов не было даже близко. Ну например CP система словила split-brain из-за GC-паузы. Split-brain длился пять секунд но в течении этих пяти секунд система была недоступна на запись.

S>Ок, попробую на пальцах вам объяснить сложную для вас вещь: даже в вашем надуманном определении, кластер из трех машин считается HA. Но как только одна из них навернулась, кластер тут же перестал быть HA, так как в нём осталось только две машины. Этот момент понятен, или нужно дальше объяснять?


Про hot standby слышал, или троллинг в интернете все свободное время занимает?
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.