NEW BOT Телеграм, страница - 523500953

Some random GrafanCon EU 2k18 Notes

73 subscribers

312 photos

9 files

54 links

Заметки по докладам на которые я пошел (начинаются с #talk) и флуд фоточками.

Связаться с автором можно так: @Civiloid

Download Telegram

About

Blog

Apps

Platform

Some random GrafanCon EU 2k18 Notes

Some random GrafanCon EU 2k18 Notes

и в каждой группе делать replication factor 1

29 views17:43

Some random GrafanCon EU 2k18 Notes

https://blog.smirnov.photo/slides/rf1.png

29 views17:44

Some random GrafanCon EU 2k18 Notes

И третий вариант - берем две группы, но во второй считаем хэш чуть-чуть иначе

25 views17:44

Some random GrafanCon EU 2k18 Notes

https://blog.smirnov.photo/slides/rf1-rnd.png

26 views17:44

Some random GrafanCon EU 2k18 Notes

Мы захотели проверить каковы же плюсы и минусы каждого варианта

25 views17:44

Some random GrafanCon EU 2k18 Notes

для этого провели мысленный эксперимент - написали программу, которая эмулирует падение серверов и замеряет разные параметры

27 views17:45

Some random GrafanCon EU 2k18 Notes

И вот что мы тут получилиН

27 views17:45

Some random GrafanCon EU 2k18 Notes

https://blog.smirnov.photo/slides/experiment_8srv_cmp_al.png

28 views17:45

Some random GrafanCon EU 2k18 Notes

Первый график это колличество потерянных данных в худшем случаи, в процентах.

29 views17:45

Some random GrafanCon EU 2k18 Notes

Худший случай для replication factor 1 - потеря сервера с тем же набором метрик

30 views17:46

Some random GrafanCon EU 2k18 Notes

Как можно заметить, для rf1 она максимальна

30 views17:46

Some random GrafanCon EU 2k18 Notes

для replication factor 2 - минимально

29 views17:46

Some random GrafanCon EU 2k18 Notes

А теперь давайте посмотрим на вероятности потери данных

29 views17:46

Some random GrafanCon EU 2k18 Notes

https://blog.smirnov.photo/slides/experiment_8srv_cmp_cl.png

28 views17:47

Some random GrafanCon EU 2k18 Notes

Как можно видеть, в случаи Replication factor 2 мы будем терять данные при падении любых двух серверов

27 views17:47

Some random GrafanCon EU 2k18 Notes

А на 5-и серверах мы будем терять данные во всех случаях

29 views17:47

Some random GrafanCon EU 2k18 Notes

replication factor 1 же наоборот, имеет хорошие шансы пережить падение двух сервера и даже в общем трех из 8 без потерь

29 views17:48

Some random GrafanCon EU 2k18 Notes

И мы решили что доступность данных для пользователей нам важнее

30 views17:48

Some random GrafanCon EU 2k18 Notes

Поэтому перешли на replication factor 1

32 views17:48

Some random GrafanCon EU 2k18 Notes

Собственно что мы имеем сейчас?

32 views17:48

Some random GrafanCon EU 2k18 Notes

- 32 фронтэнд сервера
- nginx на фронтэнде получает 200 RPS
- Это выливается в 30000 чтений метрик (в секунду конечно)
- Трафик в процессе записи примерно 11 Гбит в секунду.
- У нас более 200 стораджей в двух ДЦ
- Мы получаем 2 миллиона уникальных метрик в секунду (с учетом репликации получается все 8 на хранение)
- Общий объем виспер-файлов - 130 ТБ
- Мы переписали почти весь графит, кроме carbon-cache'а. Да, мы все еще используем виспер

31 viewsedited 17:48