HighLoad++ – Telegram
HighLoad++
6.32K subscribers
2.41K photos
159 videos
16 files
2.27K links
Официальный канал профессиональной конференции разработчиков высоконагруженных систем

Saint HighLoad++ 2026 пройдёт в июне в Санкт-Петербурге: https://highload.ru/spb/2026

Общаемся в чатике https://news.1rj.ru/str/HighLoadTalks
Download Telegram
➡️ Алексей Васильев расскажет о том, как с помощью их фреймворка RePlay можно быстро и удобно построить рекомендательную систему, а также как сравнить существующие решения с бейзлайнами

📋 https://bx.vc/mej0wm

Отличительными особенностями библиотеки являются удобный интерфейс и возможность масштабирования за счет встраивания pyspark внутрь фреймворка. Алексей покажет несколько примеров использования. Мы обсудим этапы создания рекомендательных систем, какие варианты выбора подходов могут быть на каждом этапе. Также поговорим о том, что даже всем известные метрики могут считаться по-разному.

👉 Встречаемся 22 и 23 сентября на Saint HighLoad++

Программа ML-трека - https://bx.vc/trww12
👍2
👉 Алан Савушкин, Data Scientist в Лаборатории Касперского, расскажет про частотный и байесовский подходы оценки TPR при неполной разметке данных

📋 https://bx.vc/2lupb8

Практически в каждом проекте, в котором применяются модели машинного обучения, присутствует необходимость оценивать метрики онлайн, отражающие качество модели. В случае доступности полной разметки данных, с точки зрения статистики, достаточно просто получить оценки и построить доверительные интервалы для этих оценок. Но что, если решается задача фильтрации данных, полная разметка для отфильтрованных объектов отсутствует и необходимо оценить TPR?

На примере задачи фильтрации данных мы рассмотрим проблему оценки TPR при отсутствии полной разметки отфильтрованных объектов, и какая здесь возникает особенность. Алан покажет, как можно решить данную проблему.

Встречаемся на Saint HighLoad++ уже 22 и 23 сентября 🙌

Программа конференции и билеты здесь - https://bx.vc/xatahf
👍2
Владимир Меркулов и Василий Вологдин расскажут, как они подружили биореакторы и ML

📋 https://bx.vc/z7f2ep

Когда речь заходит о машинном обучении в фармацевтических компаниях, таких как BIOCAD, то большинство специалистов подразумевает участие Data Scientist'ов в процессе разработки лекарственных препаратов. В докладе Владимир и Василий посмотрят на этот вопрос немного под другим углом и расскажут о том, какие еще задачи решаются при помощи машинного обучения в фармацевтических компаниях, в том числе как алгоритмы машинного обучения помогают решать задачи на производственных линиях и какую архитектуру они для этого используют.

Также узнаем о том, с какими трудностями они столкнулись при разработке, и каким образом выстраивалось взаимодействие между специалистами службы АСУ ТП и специалистами по машинному обучению.

Ждем вас 22 и 23 сентября в Петербурге 🙌

Программа ML-трека - https://bx.vc/0vv6ae
👍1
👋 Геолокация при помощи триангуляции по сотовым вышкам в прошлом! Артем Кравчук расскажет про геолокацию по WiFi/GSM в больших городах на базе ML для 30-ти миллионов пользователей

📋 https://bx.vc/sh1eqe

Крупные города содержат миллионы Wi-Fi-точек. Современные статистические методы позволяют рассчитывать честные двумерные карты сил сигналов, а современные инженерные приёмы — строить сотни миллионов таких карт и использовать для позиционирования десятков тысяч пользователей в секунду. Подход команды Артема позволил улучшить точность геолокации по Wi-Fi/GSM более чем в 2 раза там, где GPS неточен или недоступен.

Из доклада узнаем, как симбиоз data science и инженерных решений позволил построить экономную по аппаратным ресурсам систему силами небольшой команды для 30+ М пользователей c нагрузочной ёмкостью 10K+ RPS.

📍Ждем вас 22 и 23 сентября на Saint HighLoad++

Программа ML-трека - https://bx.vc/w1ivee
👍3🔥1
🔥 Крутая новость

Друзья, при поддержке генерального партнера Garage Eight на Saint HighLoad++ 22 и 23 сентября пройдет открытая трансляция главного зала. Доступно абсолютно всем, просто подключайтесь и смотрите лучшие выступления 🙌

Подробности, расписание и подключиться здесь - https://bx.vc/0t38x1

До встречи в эфире!
🔥7👍1
Сергей Хорошеньких, тимлид группы разработки в Яндекс. Доставке, расскажет доклад на тему: Сверхскорость. Единая платформа экспресс-доставки Яндекса

📋 https://bx.vc/ywfoxh

Он расскажет, как устроена единая платформа для экспресс-доставки в Яндексе.

В докладе рассмотрим архитектуру, которая позволяет объединить разные алгоритмы диспатча разных сервисов с учетом их бизнес-требований. Также, мы более подробно поговорим про один из таких алгоритмов, который призван решить задачу экспресс-доставки в общем виде: мы обсудим, почему это сложнее, чем обобщенная задача о назначениях, и как они комбинируют особенности предметной области с методами дискретной оптимизации.

Ждем вас 22 и 23 сентября на Saint HighLoad++

Программа конференции и билеты здесь - https://bx.vc/kt82dl
👍1
В рамках ML-трека, который пройдет на Saint HighLoad++ 2022 при поддержке VK, Александр Прошунин расскажет о применении машинного обучения в анализе научных данных

📋 https://bx.vc/yngrru

Александр продемонстрирует применение МО в области анализа спектров в сравнении с классическими подходами. Будет описан полный путь от сбора данных, их подготовки и построения решения задачи с нетипичным функционалом ошибки, который полностью строится, исходя из задачи.

Второй задачей будет рассмотрена классификация режимов сложных динамических систем. Применение метода показателей Ляпунова полностью отвечает на этот вопрос. Расчет данного показателя является сложной задачей, однако применение машинного обучения существенно снижает затраты на вычисления. Построение методом генерации обучающих данных и сравнение по вычислениям с другими классическими подходами.

Программа ML-трека – https://bx.vc/pbivf9

До скорой встречи в Питере 🙌
👍1😁1
Авторы в Дзене и как мы ищем их аудиторию – тема доклада Анастасии Павловской

📋 https://bx.vc/ij8vnd

Дзен — это площадка, где пользователь находит контент для себя, а авторы — свою аудиторию. Задача Анастасии и команды — с помощью механизмов рекомендаций облегчить поиск аудитории для креатора.

На первый взгляд, задача очень похожа на задачу рекомендаций холодного контента, однако на практике она оказывается на порядок сложнее.

Если в «холодном старте» контента можно использовать статистики взаимодействия автора с пользователями и реакции подписчиков, которые первые видят айтем, то в их задаче такой коллаборативной информации нет. Стандартные контентные похожести айтемов использовать «из коробки» тоже не получится.

В докладе Анастасия расскажет, как они сталкивались с проблемами и решали их: как научились определять похожести авторов и автоматически подбирать для них подходящую аудиторию.

📍Встречаемся 22 и 23 сентября в Петербурге.

Программа ML-трека - https://bx.vc/exmjd4
🔥2
🚀 Друзья, мы рады объявить о старте профессиональной конференции для разработчиков высоконагруженных систем - Saint HighLoad++ 2022, которая пройдет сегодня и завтра в Санкт-Петербурге!

Как это будет?

🔹 Продолжительность мероприятия - два полных дня. Первый доклад начинается ежедневно в 10:00, а последний заканчивается в 18:50. Регистрация открывается в 8:30.

🔹Длительность докладов — 50 минут, включая ответы на вопросы, а еще 10-20 минут заложены на перерывы и смену аудитории.

🔹Онлайн-участники смогут задавать вопросы авторам докладов в чате трансляции.

👉 Расписание можно увидеть здесь: https://bx.vc/oeug0r

😉 Ждём вас! Открытие конференции уже в 09:30!
👍6
А у нас регистрация уже началась!
Для того, чтобы пройти её подготовьте, пожалуйста, любой документ, удостоверяющий личность, или заранее распечатанный билет.
После регистрации вы сможете выпить чашечку бодрящего кофе (или чая, на выбор), чтобы зарядиться энергией и окончательно проснуться.
Друзья, ловите актуальное расписание конференции на все два дня!
👉 https://bx.vc/oeug0r
Мы начинаем нашу конференцию! Сразу после открытия в 10:00 стартуют первые доклады Saint HighLoad++ 2022!

🏰 В «Зале 00. Башня» Александр Тоболь (ВКонтакте) расскажет про архитектуру: история и будущее на примере ВКонтакте

🔸 В «Зале 01. Желтый» от Кирилла Горелова (Яндекс) узнаем про надёжность высоконагруженных C++-приложений в Яндекс.Маркете

🔹 В «Зале 03. Синий» Артем Кравчук (2GIS) расскажет про геолокацию по Wi-Fi/GSM в больших городах на базе ML для 30 миллионов пользователей

🔺 В «Зале 04. Красный». С Артемом Исмагиловым (Яндекс) обсудим дедупликацию 5 миллионов событий в секунду на YDB в АппМетрике

В «Зале 06. Зеленый» Михаил Волков (VisionLabs) и Гусейн Римиханов (Московский метрополитен) расскажут про Face Pay — сервис полностью бесконтактной оплаты проезда с помощью распознавания лиц в Московском метрополитене.
🔵 При поддержке VK на Saint HighLoad++ представлен целый трек докладов на тему технологий машинного обучения. Поговорим о том, как на базе ML создавать практичные решения, готовые к большим нагрузкам.

Все доклады ML-трека пройдут в «Зале 03. Синий». Ловите первую часть докладов на сегодня:

🔹10:00. Артем Кравчук (2GIS) расскажет про геолокацию по Wi-Fi/GSM в больших городах на базе ML для 30 миллионов пользователей

🔹11:10. Из доклада Виталия Шутова (ВКонтакте) узнаем про распознавание речи для субтитров в VK Видео

🔹12:20. С Александром Прошуниным (ГК Иннотех) обсудим применение машинного обучения в анализе научных данных

🔹13:30. Марк Паненко (Работа.ру) поделится опытом о том, как выкатить в highload production сервис рекомендаций с BERT-like-моделью
Следующие выступления на Saint HighLoad++ 2022 ждут вас в 11:10 МСК.

🏰 В «Зале 00. Башня» Дмитрий Завалишин (ГК Digital Zone) расскажет про языки программирования: прошлое, настоящее и будущее

🔸 В «Зале 01. Желтый» из доклада Антона Колесова (Nexign) узнаем, как они защищают при перегрузках миллионы клиентов посредством динамического троттлинга в высоконагруженных системах

🔹 В «Зале 03. Синий» с Виталием Шутовым (ВКонтакте) обсудим распознавание речи для субтитров в VK Видео

🔺 В «Зале 04. Красный» Андрей Михеев (Pixonic) расскажет доклад на тему: От 0 до 200 000 000 игроков — об эволюции бэкенда за 40 мин

В «Зале 06. Зеленый» из доклада Александра Сербула (1С-Битрикс) узнаем про распределенный высоконагруженный BI-движок для Google Data Studio и Microsoft Power BI — как сделать массовую облачную BI-аналитику доступной для человечества
HighLoad++ pinned a photo
Встречайте анонс докладов, которые вы услышите в 12:20 МСК.

🏰 В «Зале 00. Башня» Олег Бартунов и Иван Панченко (Postgres Professional) расскажут про Postgres от начала веков и до наших дней

🔸 В «Зале 01. Желтый» из доклада Павла Лавренко и Антона Катенева (РСК) узнаем, могут ли данные управлять аппаратной конфигурацией дата-центра

🔹 В «Зале 03. Синий» с Александром Прошуниным (ГК Иннотех) обсудим применение машинного обучения в анализе научных данных

🔺 В «Зале 04. Красный» Анастасия Некрашевич (ЦФТ) расскажет про граф компонентов: как отобразить 100 компонентов и 500 связей

В «Зале 06. Зеленый» Василий Агапитов и Камиль Хамитов (Яндекс) расскажут о подготовке данных поиска Яндекса, какую библиотеку и процессы для этого они сделали
«Я до сих пор не умею нетворкаться» – признайтесь, проскакивала ли у вас такая мысль на деловых мероприятиях?
Если бывало, не переживайте - вы не одиноки. И главное: это поправимо!

Мы подготовили программный бонус. Наши спикеры расскажут и покажут на практике, как:
- избавиться от страхов заговорить
- научиться питчить себя
- в режиме реального времени превращать неудачную коммуникацию в удачную

Приходите на воркшоп по нетворкингу и консультацию к нашим экспертам в нетворкинг-зону выставки. Самых активных энтузиастов ждут призы.

Расписание воркшопов на сегодня:

13:00-14:00
19:00-20:00

Спикеры зоны:

Евгений Идзиковский – Психолог, сам из айти, 15 лет помогает другим айтишникам с психологическими проблемами, руководитель лаборатории психологических исследований в Евразийском Международном Университете, спикер TeamLeadConf, Сколково

Анисимова Александра - Психолог, клинический психолог в клинике РАН

Не откладывай прокачку нетворкинг-скилла!

Регистрируйтесь здесь - https://bx.vc/bjhvzs
⚡️Это наш "Зал 00. Башня", доклады которого прямо сейчас транслируются онлайн в открытом доступе

Если вы пропустили, подключайтесь
👉 https://bx.vc/5ouv5i
Новая порция знаний от IT-профессионалов современности в 13:30 МСК на Saint HighLoad++

🏰 В «Зале 00. Башня» Андрей Аксенов (Авито, Sphinx) расскажет про историю и будущее поиска

🔸 В «Зале 01. Желтый» Виктор Попов (НЛМК) расскажет доклад на тему: Контейнеры мертвы. Да здравствуют виртуальные машины!

🔹 В «Зале 03. Синий» из доклада Марка Паненко (Работа.ру) узнаем, как выкатить в highload production сервис рекомендаций с BERT-like-моделью

🔺 В «Зале 04. Красный» со Станиславом Сидристым (ЦРТ) обсудим гибридную архитектуру: разделяемый на микросервисы монолит

В «Зале 06. Зеленый» Андрей Гончаров (Garage Eight) расскажет про централизованный self-service ETL. О системе автоматизации, умеющей эффективно и дешево двигать данные между десятками систем
Встречайте анонс докладов, которые вы услышите в 14:40 МСК

🏰 В «Зале 00. Башня» Сергей Хорошеньких (Яндекс Доставка) расскажет доклад на тему: Сверхскорость. Единая платформа экспресс-доставки Яндекса

🔸 В «Зале 01. Желтый» Александр Обливальный (ГК Иннотех) расскажет про развитие и жизненные циклы пайплайна

🔹 В «Зале 03. Синий» от Анастасии Павловской (Дзен) узнаем про авторов в Дзене и как они ищут их аудиторию

🔺 В «Зале 04. Красный» Евгений Пак (Ozon) расскажет доклад на тему: Без A/B — результат XЗ, или Как мы построили платформу A/B-тестов в Ozon

В «Зале 06. Зеленый» Антон Быстров (Percona/Simbirsoft) расскажет доклад на тему: Dashboard as a code, или Путь от правок в UI до grafonnet
Расписание второй части докладов ML-трека на сегодня.

🔵 Все доклады ML-трека пройдут в «Зале 03. Синий».

🔹 14:40. Анастасия Павловская (Дзен) расскажет доклад на тему: Авторы в Дзене и как мы ищем их аудиторию

🔹 15:50. Артем Бондарь (Voximplant) с темой доклада: Собираем облачную AutoML-платформу для создания голосовых роботов на базе трансформеров

🔹 18:00. Любовь Рожкова (S7 TechLab) расскажет про аналитику по самолетам S7: pets vs cattle
👍2