31 января один из системных администраторов Gitlab ошибся при настройке репликации на продакшене и удалил боевую базу данных, содержащую issues, merge requests и некоторые другие важные данные. Сами репозитории при этом не пострадали. Сервис ушел в оффлайн и при попытке восстановления выяснилось, что ни один из методов бэкапов не работал, были потеряны данные за последние 6 часов. По ссылке приведен перевод внутреннего документа с процессом решения проблемы, а также рекомендации по недопущению подобных аварий.
http://amp.gs/12fu
http://amp.gs/12fu
Habr
sudo rm -rf, или Хроника инцидента с базой данных GitLab.com от 2017/01/31
Он пьянел медленно, но все-таки опьянел, как-то сразу, скачком; и когда в минуту просветления увидел перед собой разрубленный дубовый стол в совершенно...
Когда ваших данных становится очень много, изменение их структуры становится вызовом для вас и вашего проекта. Stripe рассказал почему миграция данных это сложно, а также повествует о способах решения ряда проблем.
http://amp.gs/164X
http://amp.gs/164X
Stripe
Online migrations at scale
Engineering teams face a common challenge when building software: they eventually need to redesign the data models they use to support clean abstractions and more complex features. In production environments, this might mean migrating millions of active objects…
За 8 летнюю историю проекта mongodb, вокруг него было множество споров и драм на различные темы связанные с надёжностью хранения данных.
И вот, судя по всему одна из важнейших проблем (по мнению ненавистников) решена.
http://amp.gs/16Nj
И вот, судя по всему одна из важнейших проблем (по мнению ненавистников) решена.
http://amp.gs/16Nj
Короткая и интересная статья о том, как по разному можно интерпретировать и визуализировать изменения в time series данных. И о том, как же важно понимать чего вы хотите данных, и что означают изменения в них.
http://amp.gs/16u5
http://amp.gs/16u5
Medium
Visualizing Time-Series Change
* The Python code and data used for this post can be found here
Ребята из Hashicorp, а в частности те что разрабатывают Nomad, подгоняют нам очередную флеймообразующую тему.
Вместо стандартного подхода с использованием воркеров для разбирания очередей заданий, они предлагают запускать задачи по запросу при помощи их механизма Nomad Dispatch.
Это решение на их взгляд даёт ряд преимуществ связанных с более оптимальной утилизацией ресурсов.
http://amp.gs/16we
Вместо стандартного подхода с использованием воркеров для разбирания очередей заданий, они предлагают запускать задачи по запросу при помощи их механизма Nomad Dispatch.
Это решение на их взгляд даёт ряд преимуществ связанных с более оптимальной утилизацией ресурсов.
http://amp.gs/16we
Всеволод 'ctrlok' Поляков начал цикл статей о современных орекстраторах. Первый небольшой материал — обзорный, в нем рассказывается о том, зачем вообще придумали оркестраторы контейнеров, и всегда ли они нужны.
http://amp.gs/YTjD
http://amp.gs/YTjD
dpvs
Рубрика кэпа: контейнеры и оркестраторы. Часть 1.
В общем, сейчас дофига разных систем оркестрации контейнеров. А зачем они вообще нужны? Зачем вообще нужны контейнеры? Контейнеры, по моему мнению, в первую очередь решают проблему сборки, доставки и запуска приложения, помогают сделать окружения запуска…
Вышел Go 1.8. Основные новшества:
* Бэкенд компилятора SSA (Static Single Assignment) включен для всех архитектур, а не только для x86_64. Прирост производительности генерируемого кода при его использовании составляет 5-35%
* Сборщик мусора теперь работает более короткими циклами, которые не превышают 100 мкс и обычно длятся около 10 мкс
* В модуль с реализацией HTTP-сервера добавлена поддержка операций Push для HTTP/2
* В модуль sort добавлена новая функция Slice, упрощающая сортировку данных с типом slice
* Проведена оптимизация значительного числа модулей
http://amp.gs/YYYA
* Бэкенд компилятора SSA (Static Single Assignment) включен для всех архитектур, а не только для x86_64. Прирост производительности генерируемого кода при его использовании составляет 5-35%
* Сборщик мусора теперь работает более короткими циклами, которые не превышают 100 мкс и обычно длятся около 10 мкс
* В модуль с реализацией HTTP-сервера добавлена поддержка операций Push для HTTP/2
* В модуль sort добавлена новая функция Slice, упрощающая сортировку данных с типом slice
* Проведена оптимизация значительного числа модулей
http://amp.gs/YYYA
Пост-мортем аварии Instapaper. Ребята упали 9 февраля и окончательно смогли восстановиться только к 14 февраля. Причина — уперлись в лимит размера файла (2TB) на RDS-инстансе. Починить все получилось только полным дампом и восстановлением 2.5-терабайтной базы данных.
Вишенка на торте: по словам инженеров Instapaper, RDS не имеет никаких средств мониторинга/алертинга таких проблем.
http://amp.gs/YYlv
Вишенка на торте: по словам инженеров Instapaper, RDS не имеет никаких средств мониторинга/алертинга таких проблем.
http://amp.gs/YYlv
Medium
Instapaper Outage Cause & Recovery
The Instapaper service experienced an extended outage between Wednesday, February 9 at 12:30PM PT through Thursday, February 10 at 7:30pm…
Docker сменил нумерацию версий. После 1.13 в марте выйдет 17.03.0. Release Candidat, кстати, уже доступен.
http://amp.gs/Yt76
http://amp.gs/Yt76
Github
docker/CHANGELOG.md at 17.03.x · docker/docker · GitHub
docker - Docker - the open-source application container engine
Спецы из команды безопасности Google нашли серьезную уязвимость у провайдера CloudFlare, уязвимость похожа на Heartbleed, в определенной ситуации клиентам отдается часть содержимого оперативной памяти серверов CloudFlare. Проблема возникла из-за ошибки в коде сервера и была оперативно закрыта сотрудниками CloudFlare. Также появился отчет от CloudFlare, где они заверяют, что приватные ssl ключи не могли утечь, поскольку терминация ssl происходит на других машинах.
Отчет Google Project Zero http://amp.gs/YBSk
Отчет CloudFlare: http://amp.gs/YBSC
Отчет Google Project Zero http://amp.gs/YBSk
Отчет CloudFlare: http://amp.gs/YBSC
До главной DevOps коммьюнити-конференции этого года в России осталось чуть больше недели, напоминаем, что состоится она 11 марта. Самое время определяться тем, кто еще не определился, а тем, кто уже купил билет, самое время изучить программу.
Мы запустили локальный сайт конференции и там теперь можно купить билет и посмотреть доклады и докладчиков в более удобном виде — http://amp.gs/YPPF
А в программе есть много важного и полезного.
Николай Кныш и Роман Мурашкин из Райффайзенбанка расскажут про DevOps-трансформацию у себя в IT-департаменте. Это не будет рассказ про эффективные процессы и эффективных менеджеров, ребята из Райфа действительно круто подошли к вопросу и решили создать среду, где DevOps возможен, тезисы доклада тут — http://amp.gs/YPP2.
В Альфа-Лаборатории уже давно экспериментируют с Docker и Mesosphere, но считают, что культура и здравый смысл важнее всего, о здравом смысле в DevOps будет доклад Александра Тарасова и Юлии Викторовой http://amp.gs/YPP3
Костя Назаров из Tarantool расскажет, как он сделал свое собственное облако http://amp.gs/YPPH Думаю, это будет феерично, он обещал для своего доклада рисовать от руки!
Антон Иванов из HeadHunter поделиться своим опытом управления SRE-отделом http://amp.gs/YPPw.
Друзья ждем вас, билеты можно купить здесь — http://amp.gs/YPP0
Мы запустили локальный сайт конференции и там теперь можно купить билет и посмотреть доклады и докладчиков в более удобном виде — http://amp.gs/YPPF
А в программе есть много важного и полезного.
Николай Кныш и Роман Мурашкин из Райффайзенбанка расскажут про DevOps-трансформацию у себя в IT-департаменте. Это не будет рассказ про эффективные процессы и эффективных менеджеров, ребята из Райфа действительно круто подошли к вопросу и решили создать среду, где DevOps возможен, тезисы доклада тут — http://amp.gs/YPP2.
В Альфа-Лаборатории уже давно экспериментируют с Docker и Mesosphere, но считают, что культура и здравый смысл важнее всего, о здравом смысле в DevOps будет доклад Александра Тарасова и Юлии Викторовой http://amp.gs/YPP3
Костя Назаров из Tarantool расскажет, как он сделал свое собственное облако http://amp.gs/YPPH Думаю, это будет феерично, он обещал для своего доклада рисовать от руки!
Антон Иванов из HeadHunter поделиться своим опытом управления SRE-отделом http://amp.gs/YPPw.
Друзья ждем вас, билеты можно купить здесь — http://amp.gs/YPP0
Интересная статья от Adrian Cockcroft (VP Cloud Architecture Strategy at AWS), в которой он размышляет о том, как архитектуры современных приложений смещаются в сторону концепции function as a service и как это соотносится с уже популярными событийными моделями.
Также он рассмматривает как совмещение этих двух подходов радикально сокращает time to value.
http://amp.gs/Ygbj
Также он рассмматривает как совмещение этих двух подходов радикально сокращает time to value.
http://amp.gs/Ygbj
A Cloud Guru
Evolution of Business Logic from Monoliths through Microservices, to Functions
Underlying technology advancements are creating a shift to event driven functions and radical improvements in time to value
Доклад от Josh Evans (Director of Operations Engineering at Netflix) с Qcon в котором он рассказывает о «живом» и «хаотичном» мире микросервисов который существует в Netflix.
Он начинает с базового описания анатомии микросверисов, вызовы которые приходится принимать при разработке распределенных архитектур, и преимущества которые они дают.
А затем, он повествует о том что фундаментом для овладения совершенным мастерством в разработке микросервисов является применение определенных и специфичных культурных, архитектурных и эксплуатационных подходов.
https://www.youtube.com/watch?v=CZ3wIuvmHeM
Он начинает с базового описания анатомии микросверисов, вызовы которые приходится принимать при разработке распределенных архитектур, и преимущества которые они дают.
А затем, он повествует о том что фундаментом для овладения совершенным мастерством в разработке микросервисов является применение определенных и специфичных культурных, архитектурных и эксплуатационных подходов.
https://www.youtube.com/watch?v=CZ3wIuvmHeM
YouTube
Mastering Chaos - A Netflix Guide to Microservices
QCon San Francisco, the international software conference, returns November 17-21, 2025. Join senior software practitioners from early adopter companies as they share real-world insights and actionable advice to help you adopt the right technologies and practices.…
Отличное 5 минутное видео о происхождении термина 'human error' и его различных нотациях.
https://www.youtube.com/watch?v=rHeukoWWtQ8
https://www.youtube.com/watch?v=rHeukoWWtQ8
YouTube
Two views on Human Error
In this video Dr. Johan Bergström introduces two schools of thought on the notion of 'human error': (1) the cognitive psychological school and (2) the joint cognitive school.
www.humanfactors.lth.se
www.humanfactors.lth.se
Daniil Baturin написал прекрасный cheatsheet по iproute2. Рекомендуем для беглого просмотра всем, кто хочет обозреть возможности iproute2.
http://amp.gs/YEGh
http://amp.gs/YEGh
Все мы помним про старинные рекомендации по установке размера swap в linux системах равной 2х кратному размеру RAM.
Но ведь ядро, фс, шедулеры сильно изменились за последнее десятилетие. Актуальны ли рекомендации на данный момент ?
Прекрасная (и короткая) статья от инженера из RH рассказывает о том, как используется swap в современных системах и какие есть рекомендации по его тюнингу для повышения производительности на данный момент.
http://amp.gs/YE7h
Но ведь ядро, фс, шедулеры сильно изменились за последнее десятилетие. Актуальны ли рекомендации на данный момент ?
Прекрасная (и короткая) статья от инженера из RH рассказывает о том, как используется swap в современных системах и какие есть рекомендации по его тюнингу для повышения производительности на данный момент.
http://amp.gs/YE7h
Интересное решение!
Ребята рассказывают о решении, в котором используется Kafka в качестве транспорта реплики MySQL
http://amp.gs/YVBJ
Ребята рассказывают о решении, в котором используется Kafka в качестве транспорта реплики MySQL
http://amp.gs/YVBJ
Wepay
Streaming databases in realtime with MySQL, Debezium, and Kafka
Change data capture has been around for a while, but some recent developments in technology have given it new life. Notably, using Kafka as a backbone to str...
Первая статья из серии о написании concurrent приложений.
В данной статье ребята рассматривают как операционная система управляет планированием IO операций наших приложений.
http://amp.gs/YVx6
В данной статье ребята рассматривают как операционная система управляет планированием IO операций наших приложений.
http://amp.gs/YVx6
Без правильных людей понимающих что DevOps это не тайтл, а изменение в культуре которые должны помагать как руководителям так и девелоперам, очень просто сделать что-то не так.
Чтобы понять, подходит ли вам кандидат вот вам 10 вопросов, на которые должен ответить любой сотрудник который претендует на место в компании с развитой devops культурой.
http://amp.gs/YVe2
Чтобы понять, подходит ли вам кандидат вот вам 10 вопросов, на которые должен ответить любой сотрудник который претендует на место в компании с развитой devops культурой.
http://amp.gs/YVe2
Интересный анализ методик devops при помощи теории ограничений и попытка ответа на 4 вопроса Голдратта.
http://amp.gs/Y9vh
http://amp.gs/Y9vh
DevOps Pro
DevOps Transformation using Theory of Constraints
For several years IT companies have been exposed to more and more blogs and conferences talking about DevOps, arguably the hottest topic…
Facebook зарелизил проект Prophet — инструмент для предсказания временных рядов (имеющих достаточно большую историю).
На самом деле это чертовски сложная задача, и поэтому безумно приятно видеть такие инструменты в open source.
http://amp.gs/Y9Ro
На самом деле это чертовски сложная задача, и поэтому безумно приятно видеть такие инструменты в open source.
http://amp.gs/Y9Ro