WBTECH – Telegram
WBTECH
13.7K subscribers
563 photos
18 videos
219 links
Разработчики Wildberries делятся опытом: полезные статьи и анонсы мероприятий

Ютуб: https://www.youtube.com/@wb_tech

Регистрация в Роскомнадзоре:
№ 4963508866
Download Telegram
👾👾 Стартуем в ML и DS

Привет! На связи Андрей Тюняткин, руководитель команды ML Ценообразования Wildberries.

Представь, что ты решил изучить ML — инженерные задачи, которые стоят за современными ИИ-моделями. Тема популярная, новостей море. Но с чего начать? Давайте разбираться в посте.

Кем я стану, когда вырасту?

ML занимаются два рода специалистов — Data Scientist и ML Engineer.

➡️ Data Scientist изучает зависимости в данных, придумывает и проверяет гипотезы, обучает модели.

➡️ ML Engineer обучает модели на больших данных, упаковывает модели для продакшена и строит на их основе сложные программные продукты.

Если ты математик — тебе, скорее всего, ближе трек Data Scientist.

Если программист — твой путь ML Engineer.

Оттенки ИИ

Classic ML — классические задачи машинного обучения: прогноз спроса, поиск мошенников, разбиение пользователей на кластеры по лояльности. Начинать стоит именно с классики.

RecSys — рекомендательные системы: какие товары предложить пользователю, какое push-уведомление отправить, чтобы он точно кликнул.

CV — компьютерное зрение: распознавание лиц, оценка качества карточки товара, поиск текста на изображениях. Да даже автопилот в беспилотном трамвае!

NLP — анализ естественного языка. Нереально популярная область ML. В комментариях не нуждается — вспомни хотя бы ChatGPT.

Есть и другие направления — например, распознавание голоса. Но их мы оставим за кадром.

Очень советую изучить платформу HuggingFace. На ней представлены множество разных ML-задач и моделей, которые эти задачи решают. Часть моделей можно буквально «потрогать» онлайн: писать им тексты, отправлять картинки и смотреть, как они эти тексты с картинками анализируют.

Где разрабатывать модели?

Твой лучший друг — Jupyter Notebook. Он позволяет интерактивно писать и выполнять код, обучать модели и красиво выводить результаты.

Google Colab — тот же Jupyter, но прямо в браузере, без установки.

VS Code — полноценный редактор, поддерживающий формат Юпитер-ноутбуков. Очень советую: подсвечивает ошибки и делает работу с кодом заметно удобнее.

Во второй части разберёмся: что изучить, какие инструменты использовать, и какие пет-проекты можно выполнить для тренировки.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2514👍10
Продолжаем ⬇️

⭐️ Что почитать и изучить?
Я сам начинал погружение в ML с книги «Python и машинное обучение». Да, индустрия развивается стремительно, и любая книга устаревает за пару лет. Но базовые принципы и основы обучения моделей там изложены понятно и с практикой.
И не забывай про современные LLM!

Напиши, например, Qwen:
«Как опытный и дружелюбный преподаватель по Data Science и Machine Learning, составь мне программу, которая поможет дойти до уровня Junior Machine Learning Engineer. Добавь теорию, примеры на Python и практические задания. Я буду присылать тебе решения, а ты проверяй их подробно и с объяснениями».


После изучения основ обязательно нужна практика. Придумай пет-проект, реализуй его и выложи на GitHub.

Примеры проектов:

✏️ Распознавание рукописных цифр на датасете MNIST. Сравни KNN, полносвязную сеть и CNN. (Забавный факт: архитектуру CNN подсмотрели у зрительной коры кошки.)

👀 Распознавание поз человека с помощью YOLO — пригодится, например, для анализа правильности спортивных упражнений.

✏️ Классификация токсичных сообщений с DeepPavlov, чтобы поддерживать деловой этикет в чатах.

💡 Участвуй в Kaggle-соревнованиях — там куча реальных данных и задач для тренировки.

Куда расти дальше
Важно не только обучать и тестировать модели, но и превращать их в работающие продукты. Для этого пригодятся:

👆 FastAPI — Python-библиотека для создания сервера, который возвращает предсказания модели.

👆 Streamlit — собери интерфейс: настройки, кнопки, визуализация результатов.

👆 ClearML — сохраняй модели и результаты экспериментов, чтобы не теряться в версиях.

👆 Airflow — автоматизируй пайплайн: сбор данных, обработку, вызов модели и сохранение результатов.

Новый виток — ИИ-агенты


LLM открыли целое направление прикладного ИИ, и изучать его стоит уже сейчас.

👆 Qwen — мощная и доступная из РФ LLM: отвечает на вопросы, пишет код, ищет данные, собирает исследования в PDF.

👆 Cursor AI — как VS Code, но с ИИ-помощником: подсказывает, как улучшить код, исправить ошибки и писать чище. Бесплатен для студентов.

👆 N8N — платформа для создания собственных ИИ-агентов и автоматизации. Можно сделать чат, подключить Telegram, почту или календарь, чтобы агент сам присылал план на день или подборку новостей.

Успехов в этом увлекательном пути! До встречи в рядах ML-инженеров Wildberries & Russ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1912👍9
⭐️⭐️ Golang meetup: регистрация уже идёт!

На митапе соберутся инженеры, которые знают, как писать устойчивые Go-сервисы на экстремальных нагрузках. Рассказываем, о чём будут их доклады ⬆️

Ждём вас 27 ноября в 19:00, офлайн и онлайн
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2010👍7
Архитектура облачной платформы Wildberries 🔥

Собственная облачная платформа помогает компаниям контролировать технологические процессы, повышать безопасность и ускорять работу продуктовых команд. В Wildberries это особенно важно из-за масштабов: тысячи геораспределённых серверов, несколько дата-центров и десятки тысяч виртуальных машин.

Сейчас у нас работают две инсталляции облака, которые обслуживают более 42 тысяч виртуальных машин. Базовый слой стабилен, поверх него мы уже запускаем сервисы уровня aaS. Например, PostgreSQL как сервис с кластерами, растянутыми на несколько дата-центров.

За пять лет эксплуатации мы пережили множество отказов разного масштаба и убедились, что собственная разработка позволяет нам контролировать технологические риски и не зависеть от внешних вендоров. Эта стратегия доказала свою устойчивость и даёт нам пространство для дальнейшего развития платформы.


В карточках — основные идеи, выводы и подходы, которыми поделилась команда. Про создание и запуск облачной платформы — читайте на Хабре.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
125👍10🔥6
Уже на этой неделе встречаемся на Golang Meetup!

Знакомимся с нашими спикерами: они уже допиливают презентации и репетируют свои выступления, чтобы встретиться с вами в этот четверг.

➡️ Регистрация
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1813🥰2