Анонс докладов на 14-00:
Пересядь с иглы TCP на UDP с миллионами пользователей / Александр Тоболь (Одноклассники) — Конгресс-холл
Хардкор-трек от Романа Ивлиева:
Десятки ветвистых ETL-пайплайнов из сотен источников / Михаил Славошевский (ЦИАН) — Пекин + Шанхай
DBA-бот Joe. Снимаем боль backend-разработки при оптимизации SQL-запросов / Анатолий Станслер (Postgres.ai) — Москва
PostgreSQL на K8s в Zalando: два года в бою / Александр Кукушкин (Zalando SE) — Сингапур
AnalyticOps: конвейеры для поставки моделей машинного обучения в промышленную эксплуатацию / Антон Задорожный (Teradata) — Найроби + Касабланка
MySQL 8 vs MariaDB 10.4 — сравнение возможностей / Петр Зайцев (Percona) — Мумбай
Yandex Cloud Instance Groups: опыт создания сервиса оркестрации / Василий Бригинец (Яндекс.Облако) — Рио-де-Жанейро
В Калининграде продолжается двухчасовой доклад: Профайлер запросов в ClickHouse / Никита Лапков
Перерыв в залах Дели + Калькутта и Кейптаун
Пересядь с иглы TCP на UDP с миллионами пользователей / Александр Тоболь (Одноклассники) — Конгресс-холл
Хардкор-трек от Романа Ивлиева:
Десятки ветвистых ETL-пайплайнов из сотен источников / Михаил Славошевский (ЦИАН) — Пекин + Шанхай
DBA-бот Joe. Снимаем боль backend-разработки при оптимизации SQL-запросов / Анатолий Станслер (Postgres.ai) — Москва
PostgreSQL на K8s в Zalando: два года в бою / Александр Кукушкин (Zalando SE) — Сингапур
AnalyticOps: конвейеры для поставки моделей машинного обучения в промышленную эксплуатацию / Антон Задорожный (Teradata) — Найроби + Касабланка
MySQL 8 vs MariaDB 10.4 — сравнение возможностей / Петр Зайцев (Percona) — Мумбай
Yandex Cloud Instance Groups: опыт создания сервиса оркестрации / Василий Бригинец (Яндекс.Облако) — Рио-де-Жанейро
В Калининграде продолжается двухчасовой доклад: Профайлер запросов в ClickHouse / Никита Лапков
Перерыв в залах Дели + Калькутта и Кейптаун
В 15.50 с главной сцены Selectel разыграет большого тирекса среди всех, кто прошёл викторину на стенде! Победитель должен присутствовать в зале. Ссылка на викторину: http://slc.tl/HL2019
Митап Николая Самохвалова о новых методах оптимизации запросов переехал из А 1.3 в Рио и начнется в 15:00.
💥А в 16:50 розыгрыш денежного приза на стенде Спортмастер. Успевайте принять участие! (Ещё успеваете).
А в 15-00 вас ждут отъявленные баги и как их избежать на примере ClickHouse / Алексей Миловидов (Яндекс) — Конгресс-холл
Новости о PostgreSQL 12 / Олег Бартунов (Postgres Professional) — Дели + Калькутта
MongoDB distributed transactions from top to bottom / Henrik Ingo (MongoDB) — Москва
Путь к Open Source DBaaS с помощью Kubernetes / Николай Маржан (Percona) — Сингапур
Версионирование дата-сетов и моделей машинного обучения, используя Open Source-инструменты / Дмитрий Петров (Iterative.ai) — Найроби + Касабланка
Новая инфраструктура компонентов в MySQL 8.0 / Vittorio Cioe (Oracle - MySQL) — Мумбай
Как мы сделали С++ распределенным / Игорь Сапего (GridGain) — Кейптаун
Пекин + Шанхай, Рио-де-Жанейро и Калининград стоят пустыми и ждут посетителей в следующем слоте.
Новости о PostgreSQL 12 / Олег Бартунов (Postgres Professional) — Дели + Калькутта
MongoDB distributed transactions from top to bottom / Henrik Ingo (MongoDB) — Москва
Путь к Open Source DBaaS с помощью Kubernetes / Николай Маржан (Percona) — Сингапур
Версионирование дата-сетов и моделей машинного обучения, используя Open Source-инструменты / Дмитрий Петров (Iterative.ai) — Найроби + Касабланка
Новая инфраструктура компонентов в MySQL 8.0 / Vittorio Cioe (Oracle - MySQL) — Мумбай
Как мы сделали С++ распределенным / Игорь Сапего (GridGain) — Кейптаун
Пекин + Шанхай, Рио-де-Жанейро и Калининград стоят пустыми и ждут посетителей в следующем слоте.
В 15:00 в А 1.6 OpsGuru приглашают обсуждать «GCP: Обработка Данных и Машинное Обучение штатными средствами».
В 15-00 (совсем скоро) в митапошной R1.7 Вирна Штерн (Aletheia Digital) и Александр Зиза рассказывают про цифровую трансформацию.
Версионирование дата-сетов и моделей машинного обучения, используя Open Source-инструменты / Дмитрий Петров (Iterative.ai) — Найроби + Касабланка.
Дмитрий начинает доклад.
Дмитрий начинает доклад.
1 часть доклада - почему ML настолько “необычный”, почему не можем использовать стандартные подходы, которые применяются ко всей отрасли ПО.
Основное отличие ML: гиперпараметры развиваются быстрее кода, эта информация - очень важна. Именно ею выделитесь с коллегами. И Excel - один из самых неплохих вариантов, бывают и хуже.
Второе отличие - нужно отслеживать метрики, нужно хранить метрики вместе с параметрами, их тоже надо пересылать и хранить.
Аналогично нужно хранить сами модели. Очень много моделей, чаще всего в имени хранится информация, например “model_v7_i1_zero_15”
Чуть лучше обстоит дело с датасетами, они реже меняются. Однако, они тоже меняются, и их тоже надо версионировать. Опять файлы, директории с разными названиями,
Код - тоже есть, не подумайте, и он тоже меняется. Но здесь все проще, git и стандартные практики.