👋 Привет, будущие дата-сайентисты! 👨💻👩💻
Мы видим все ваши стремления учиться, расти и добиваться большего. Поэтому специально для вас мы сделали новый вид набора 💥BINGO💥.
Это не просто шанс стать частью сообщества талантливых и целеустремленных людей, а возможность открыть двери в мир данных, машинного обучения и аналитики, которые улучшают жизнь многих людей.
Но чтобы попасть к нам вам надо сыграть в бинго 🎯
Выполните 3⃣ задания по вертикали / горизонтали / диагонали плюс еще 1⃣ дополнительное задание из карты с подтверждениями (их отправляйте 👉🏻Никите) и вне очереди и набора попадите на собеседование в нашу команду организаторов!
📍Подробности заданий:
1. Сделать ревью статьи на DS тему
2. Посетить наш ликбез, сделать селфи
3. Сделать пет-проект с полным его объяснением и ссылкой на гитхаб
4. Сделать селфи с одним из хедов клуба
5. Пройти хороший курс (смотрите нашу Базу Знаний!) по DS\Python\Backend, скинуть подтверждение (сертификат или результат)
6. Посетить IT\DS конференцию, сделать селфи
7. Сделать плашку к одному из наших постов
8. Сделать дизайн постера для клуба с использованием ИИ
9. Посетить наше очное мероприятие (лекция, мастер-класс) и сделать селфи
🟠 При успешном прохождении собеседования вы станете полноценным участником DS Club в одном из выбранных вами департаменте: SMM, EVENTS, PR, HACKS&PROJECTS, DEVELOPMENT&MENTORING.
Подробнее о преимуществах для организаторов клуба
Мы видим все ваши стремления учиться, расти и добиваться большего. Поэтому специально для вас мы сделали новый вид набора 💥BINGO💥.
Это не просто шанс стать частью сообщества талантливых и целеустремленных людей, а возможность открыть двери в мир данных, машинного обучения и аналитики, которые улучшают жизнь многих людей.
Но чтобы попасть к нам вам надо сыграть в бинго 🎯
Выполните 3⃣ задания по вертикали / горизонтали / диагонали плюс еще 1⃣ дополнительное задание из карты с подтверждениями (их отправляйте 👉🏻Никите) и вне очереди и набора попадите на собеседование в нашу команду организаторов!
📍Подробности заданий:
1. Сделать ревью статьи на DS тему
2. Посетить наш ликбез, сделать селфи
3. Сделать пет-проект с полным его объяснением и ссылкой на гитхаб
4. Сделать селфи с одним из хедов клуба
5. Пройти хороший курс (смотрите нашу Базу Знаний!) по DS\Python\Backend, скинуть подтверждение (сертификат или результат)
6. Посетить IT\DS конференцию, сделать селфи
7. Сделать плашку к одному из наших постов
8. Сделать дизайн постера для клуба с использованием ИИ
9. Посетить наше очное мероприятие (лекция, мастер-класс) и сделать селфи
🟠 При успешном прохождении собеседования вы станете полноценным участником DS Club в одном из выбранных вами департаменте: SMM, EVENTS, PR, HACKS&PROJECTS, DEVELOPMENT&MENTORING.
Подробнее о преимуществах для организаторов клуба
❤4
Всем привет! 🔥 Приглашаем вас на мастер-класс с разбором кейса с Kaggle!
Самое время представить нашего спикера: Александр Иванов, Data Scientist (AI решения для ВСП в Сбере), а также заместитель хэда REU DS Club по внутренней части в этом сезоне.
На мастер-классе мы разберем задачу классификации текста, шаг за шагом пройдя путь от анализа данных до построения работающей модели. Наш спикер поделится своим опытом, расскажет о лучших практиках и тонкостях решения подобных задач, а также ответит на все ваши вопросы!
Что вас ждет:
🔸 Обсуждение кейса и анализ датасета 📊
🔸 Пошаговый разбор решения задачи ➡
🔸 Выбор и настройка моделей ⚙
🔸 Оценка и интерпретация результатов 📈
🔸 Возможность задать любые вопросы спикеру 🙋♂
💻 При желании можете взять с собой ноутбук, чтобы делать заметки, писать код и закреплять полученные знания. Это отличная возможность прокачать свои навыки в NLP!
📅 Когда: 24 декабря, 19:15
Ссылка для регистрации 👉🏼 https://docs.google.com/forms/d/e/1FAIpQLSeLuyqM6_2VwL2Z-Pbqn76SB8lG1ZppBUb3aQ4WVQ4Lmv1hHQ/viewform?usp=header
⛳Где: РЭУ им Плеханова, 3 корпус, 201 аудитория
Самое время представить нашего спикера: Александр Иванов, Data Scientist (AI решения для ВСП в Сбере), а также заместитель хэда REU DS Club по внутренней части в этом сезоне.
На мастер-классе мы разберем задачу классификации текста, шаг за шагом пройдя путь от анализа данных до построения работающей модели. Наш спикер поделится своим опытом, расскажет о лучших практиках и тонкостях решения подобных задач, а также ответит на все ваши вопросы!
Что вас ждет:
🔸 Обсуждение кейса и анализ датасета 📊
🔸 Пошаговый разбор решения задачи ➡
🔸 Выбор и настройка моделей ⚙
🔸 Оценка и интерпретация результатов 📈
🔸 Возможность задать любые вопросы спикеру 🙋♂
💻 При желании можете взять с собой ноутбук, чтобы делать заметки, писать код и закреплять полученные знания. Это отличная возможность прокачать свои навыки в NLP!
📅 Когда: 24 декабря, 19:15
Ссылка для регистрации 👉🏼 https://docs.google.com/forms/d/e/1FAIpQLSeLuyqM6_2VwL2Z-Pbqn76SB8lG1ZppBUb3aQ4WVQ4Lmv1hHQ/viewform?usp=header
⛳Где: РЭУ им Плеханова, 3 корпус, 201 аудитория
Привет! Сегодня мы поговорим о вопросах, которые могут встретиться на собеседовании на позицию Machine Learning Engineer. Давайте разберем их вместе)😉
🟠 1. Какая будет асимптотика времени работы алгоритма quicksort в худшем случае, если в качестве разделителя выбирать всегда первый элемент массива, не используя рандомизации?
Ответ 👉🏻 в худшем случае, если в качестве разделителя выбирать всегда первый элемент массива, асимптотика времени работы алгоритма quicksort будет O(n^2). Это происходит, когда массив уже отсортирован или почти отсортирован, и каждый разделитель делит массив на одну часть с одним элементом и другую часть с n-1 элементами.
🟠 2. Сколько необходимо использовать дополнительной памяти (асимптотически), чтобы развернуть (reverse) связный список?
Ответ 👉🏻 для разворота связного списка асимптотически требуется O(1) дополнительной памяти. Это возможно, потому что можно изменить указатели внутри существующих узлов списка, не создавая новых узлов или структур данных.
🟠 3. Дисперсия стандартного нормального распределения?
Ответ 👉🏻 дисперсия стандартного нормального распределения равна 1. Стандартное нормальное распределение имеет среднее значение 0 и стандартное отклонение 1, следовательно, дисперсия (квадрат стандартного отклонения) также равна 1
🟠 4. Сложность поиска по сету в питоне?
Ответ 👉🏻 сложность поиска по сету (set) в Python в среднем составляет O(1). Это достигается за счет использования хеш-таблиц для хранения элементов, что позволяет быстро осуществлять операции поиска, вставки и удаления.
Эти вопросы и ответы помогут вам подготовиться к собеседованиям и углубить ваши знания в области машинного обучения и данных! Если у вас есть свои вопросы или вы хотите обсудить что-то еще, пишите в комментариях.
#DataScience #MachineLearning #InterviewPrep #Algorithms #Python
🟠 1. Какая будет асимптотика времени работы алгоритма quicksort в худшем случае, если в качестве разделителя выбирать всегда первый элемент массива, не используя рандомизации?
Ответ 👉🏻 в худшем случае, если в качестве разделителя выбирать всегда первый элемент массива, асимптотика времени работы алгоритма quicksort будет O(n^2). Это происходит, когда массив уже отсортирован или почти отсортирован, и каждый разделитель делит массив на одну часть с одним элементом и другую часть с n-1 элементами.
🟠 2. Сколько необходимо использовать дополнительной памяти (асимптотически), чтобы развернуть (reverse) связный список?
Ответ 👉🏻 для разворота связного списка асимптотически требуется O(1) дополнительной памяти. Это возможно, потому что можно изменить указатели внутри существующих узлов списка, не создавая новых узлов или структур данных.
🟠 3. Дисперсия стандартного нормального распределения?
Ответ 👉🏻 дисперсия стандартного нормального распределения равна 1. Стандартное нормальное распределение имеет среднее значение 0 и стандартное отклонение 1, следовательно, дисперсия (квадрат стандартного отклонения) также равна 1
🟠 4. Сложность поиска по сету в питоне?
Ответ 👉🏻 сложность поиска по сету (set) в Python в среднем составляет O(1). Это достигается за счет использования хеш-таблиц для хранения элементов, что позволяет быстро осуществлять операции поиска, вставки и удаления.
Эти вопросы и ответы помогут вам подготовиться к собеседованиям и углубить ваши знания в области машинного обучения и данных! Если у вас есть свои вопросы или вы хотите обсудить что-то еще, пишите в комментариях.
#DataScience #MachineLearning #InterviewPrep #Algorithms #Python
❤1
Всем привет! 🧡 Новый год уже совсем близко 🎄 и мы спешим поздравить вас с наступающими праздниками🎊. А пока вы готовитесь к торжеству, давайте узнаем кое-что полезное и интересное вместе.
Сегодня мы хотим рассказать вам о представлении данных для нейронных сетей. Если вы когда-нибудь задумывались, как машины 🤖 "понимают" и обрабатывают информацию, то этот пост для вас.
Все современные системы машинного обучения используют тензоры в качестве основной структуры данных. 📍Фактически тензор — это контейнер для данных, чаще всего числовых. Можно это представить в виде обобщения матриц с производным количеством измерений (осей). Давайте рассмотрим подробнее их разновидности.
0️⃣ Тензор, содержащий единственное число, называется скаляром (скалярным тензором, или тензором нулевого ранга). В NumPy — это число типа float32 или float64. Скалярный тензор имеет 0 осей, то есть у него нулевой ранг.
1️⃣ Одномерный массив чисел называют вектором, или тензором первого ранга, он имеет единственную ось.
2️⃣ Массив векторов — это матрица, или тензор второго ранга, также его можно назвать двумерным тензором. Матрица имеет две оси (часто их называют строками и столбцами).
3️⃣ Если упаковывать такие матрицы в новый массив, то получится трехмерный тензор, который можно представить как числовой куб.
⬆️ Упаковав трехмерные тензоры в массив, вы получите четырехмерный тензор – и т.д. В глубоком обучении используются тензоры от нулевого ранга до четырехмерных, но иногда (например, при обработке видео данных📹) дело может дойти и до пятимерных.
Это может показаться сложным, но именно в этой многомерности кроется сила нейронных сетей. Каждое новое измерение — это новый уровень абстракции, который позволяет моделям находить сложные закономерности и решать задачи, которые раньше казались недостижимыми.
Сегодня мы хотим рассказать вам о представлении данных для нейронных сетей. Если вы когда-нибудь задумывались, как машины 🤖 "понимают" и обрабатывают информацию, то этот пост для вас.
Все современные системы машинного обучения используют тензоры в качестве основной структуры данных. 📍Фактически тензор — это контейнер для данных, чаще всего числовых. Можно это представить в виде обобщения матриц с производным количеством измерений (осей). Давайте рассмотрим подробнее их разновидности.
0️⃣ Тензор, содержащий единственное число, называется скаляром (скалярным тензором, или тензором нулевого ранга). В NumPy — это число типа float32 или float64. Скалярный тензор имеет 0 осей, то есть у него нулевой ранг.
1️⃣ Одномерный массив чисел называют вектором, или тензором первого ранга, он имеет единственную ось.
2️⃣ Массив векторов — это матрица, или тензор второго ранга, также его можно назвать двумерным тензором. Матрица имеет две оси (часто их называют строками и столбцами).
3️⃣ Если упаковывать такие матрицы в новый массив, то получится трехмерный тензор, который можно представить как числовой куб.
⬆️ Упаковав трехмерные тензоры в массив, вы получите четырехмерный тензор – и т.д. В глубоком обучении используются тензоры от нулевого ранга до четырехмерных, но иногда (например, при обработке видео данных📹) дело может дойти и до пятимерных.
Это может показаться сложным, но именно в этой многомерности кроется сила нейронных сетей. Каждое новое измерение — это новый уровень абстракции, который позволяет моделям находить сложные закономерности и решать задачи, которые раньше казались недостижимыми.
❤1
Надеемся, вы успели отойти от новогодних праздников 🥂, потому что у нас для вас крутые новости 🔥
Мы с радостью объявляем новый набор организаторов в DS Club! 🤩 Стань частью нашей команды, раскрой свой потенциал и вместе с нами сделай клуб лучше.
Прием осуществляется во ВСЕ департаменты.
🟠 SMM 💫: творчество и тренды — твоя стихия? Присоединяйся, если хочешь создавать уникальный контент и продвигать клуб в соцсетях.
🟠 EVENTS 🪩: если ты жаждешь устраивать незабываемые мероприятия, то быстрее проходи в этот департамент. Это не только про организацию и планирования, но и про яркие эмоции.
🟠 PR 🗣️: для тех, кто мастерски ведет переговоры, умеет влиять на аудиторию и хочет стать лицом клуба в общении с партнерами.
🟠 HACKS&PROJECTS 👾: интересуешься передовыми методами, любишь сложные задачи и внимание к деталям? Здесь ты сможешь работать над кейсами, участвовать в хакатонах и создавать решения проектов, которые меняют реальность.
🟠 DEVELOPMENT&MENTORING 📙: идеально подойдет для тех, кто хочет заниматься контролем за развитием организаторов клуба. Именно ты будешь участвовать в формировании будущего для нашего сообщества.
Что тебе понадобится, чтобы стать организатором?
🎯 Первое и самое важное – желание развиваться в сфере Data Science!
А также посмотри в этом посте требуемые технические и социальные навыки
Преимущества для организаторов:
🌟 Персональная программа развития с опытным ментором
🌟 Погружение в Data Science на Месяце бота
🌟 Работа над реальными проектами на хакатонах
🌟 Реализация своих идей через пет-проекты
🌟 Неформальные встречи с коммьюнити клуба
🌟 Закрытые лекции и ликбезы для участников
🌟 Экскурсии в офисы топовых компаний
Скорее заполняйте форму для организаторов, она открыта для всех, вне зависимости от ВУЗа, возраста и других мелочей!
👉🏻 https://forms.gle/yxfcnmUUKZzYpMeN8
❗️Дедлайн заполнения формы 01.02.2025 , 23:59❗️
🤔 Что делать, если я не особо хочу развиваться в Data Science?
Если Data Science — не ваше направление, но у вас есть навыки или желание развиваться в дизайне, видеомонтаже, фотографии, копирайтинге или других вышеперечисленных сферах, и вы ищете площадку для реализации идей, заполните форму для сотрудничества и присоединяйтесь к нам на своих условиях.
👉🏻 https://forms.gle/yojzqRQxUrijZKZ37
С нетерпением ждем вас в нашей команде! 🧡
Мы с радостью объявляем новый набор организаторов в DS Club! 🤩 Стань частью нашей команды, раскрой свой потенциал и вместе с нами сделай клуб лучше.
Прием осуществляется во ВСЕ департаменты.
🟠 SMM 💫: творчество и тренды — твоя стихия? Присоединяйся, если хочешь создавать уникальный контент и продвигать клуб в соцсетях.
🟠 EVENTS 🪩: если ты жаждешь устраивать незабываемые мероприятия, то быстрее проходи в этот департамент. Это не только про организацию и планирования, но и про яркие эмоции.
🟠 PR 🗣️: для тех, кто мастерски ведет переговоры, умеет влиять на аудиторию и хочет стать лицом клуба в общении с партнерами.
🟠 HACKS&PROJECTS 👾: интересуешься передовыми методами, любишь сложные задачи и внимание к деталям? Здесь ты сможешь работать над кейсами, участвовать в хакатонах и создавать решения проектов, которые меняют реальность.
🟠 DEVELOPMENT&MENTORING 📙: идеально подойдет для тех, кто хочет заниматься контролем за развитием организаторов клуба. Именно ты будешь участвовать в формировании будущего для нашего сообщества.
Что тебе понадобится, чтобы стать организатором?
🎯 Первое и самое важное – желание развиваться в сфере Data Science!
А также посмотри в этом посте требуемые технические и социальные навыки
Преимущества для организаторов:
🌟 Персональная программа развития с опытным ментором
🌟 Погружение в Data Science на Месяце бота
🌟 Работа над реальными проектами на хакатонах
🌟 Реализация своих идей через пет-проекты
🌟 Неформальные встречи с коммьюнити клуба
🌟 Закрытые лекции и ликбезы для участников
🌟 Экскурсии в офисы топовых компаний
Скорее заполняйте форму для организаторов, она открыта для всех, вне зависимости от ВУЗа, возраста и других мелочей!
👉🏻 https://forms.gle/yxfcnmUUKZzYpMeN8
❗️Дедлайн заполнения формы 01.02.2025 , 23:59❗️
🤔 Что делать, если я не особо хочу развиваться в Data Science?
Если Data Science — не ваше направление, но у вас есть навыки или желание развиваться в дизайне, видеомонтаже, фотографии, копирайтинге или других вышеперечисленных сферах, и вы ищете площадку для реализации идей, заполните форму для сотрудничества и присоединяйтесь к нам на своих условиях.
👉🏻 https://forms.gle/yojzqRQxUrijZKZ37
С нетерпением ждем вас в нашей команде! 🧡
VK
REU Data Science Club. Пост со стены.
Если вы хотите стать одним из организаторов нашего клуба, то этот пост для вас!🙌🏻
📚Какие ha... Смотрите полностью ВКонтакте.
📚Какие ha... Смотрите полностью ВКонтакте.
❤5👍3🥰1
Всем привет! Сегодня мы подготовили для вас подборку курсов по линейной алгебре из нашей базы знаний🔥
📕 Линейная алгебра является важным разделом математики для дата-сайентистов, поскольку она помогает нам понять, как алгоритмы машинного обучения работают с потоком данных для создания представления и позволит вам:
🔸 разработать методы машинного обучения
🔸 смоделировать поведение различных объектов
🔸 оптимизировать процесс кластеризации и уменьшения размерности описания данных
1. Linear Algebra, Stepik
Курс ориентирован на освоение базовых понятий линейной алгебры и их практическое применение, а также помогает в развитии интуиции, что особенно важно для успешного использования теории в реальных задачах. Курс предлагает разнообразные задачи для более глубокого усвоения материала. Кроме того, он будет полезен тем, кто хочет освежить свои знания и уверенно применять линейную алгебру в различных областях.
Ссылка 👉🏻 stepik.org/course/79
2. Линейная алгебра и геометрия, Stepik
Этот курс состоит из теоретической и практической частей, построенных вокруг системы кейсов, взятых из реальной практики геометрического моделирования движения мобильных виртуальных объектов и применения машинного обучения.
Ссылка 👉🏻 stepik.org/course/4940
3. Линейная алгебра, Openedu
Базовый онлайн курс линейный алгебры от ВШЭ, содержащий все ключевые для статистки и многомерного анализа приложения и алгоритмы, хотя и не всегда содержащий подробные доказательства.
Ссылка 👉🏻 https://openedu.ru/course/hse/LINAL/?session=fall_2020
4. Линейная алгебра, Stepik:
Данный курс представляет собой краткое изложение основ линейной алгебры. Основная его задача - напомнить базовые факты линейной алгебры, использующиеся в тех или иных разделах практического программирования.
Ссылка 👉🏻 stepik.org/course/2461
Успехов вам в изучении!🐱
📕 Линейная алгебра является важным разделом математики для дата-сайентистов, поскольку она помогает нам понять, как алгоритмы машинного обучения работают с потоком данных для создания представления и позволит вам:
🔸 разработать методы машинного обучения
🔸 смоделировать поведение различных объектов
🔸 оптимизировать процесс кластеризации и уменьшения размерности описания данных
1. Linear Algebra, Stepik
Курс ориентирован на освоение базовых понятий линейной алгебры и их практическое применение, а также помогает в развитии интуиции, что особенно важно для успешного использования теории в реальных задачах. Курс предлагает разнообразные задачи для более глубокого усвоения материала. Кроме того, он будет полезен тем, кто хочет освежить свои знания и уверенно применять линейную алгебру в различных областях.
Ссылка 👉🏻 stepik.org/course/79
2. Линейная алгебра и геометрия, Stepik
Этот курс состоит из теоретической и практической частей, построенных вокруг системы кейсов, взятых из реальной практики геометрического моделирования движения мобильных виртуальных объектов и применения машинного обучения.
Ссылка 👉🏻 stepik.org/course/4940
3. Линейная алгебра, Openedu
Базовый онлайн курс линейный алгебры от ВШЭ, содержащий все ключевые для статистки и многомерного анализа приложения и алгоритмы, хотя и не всегда содержащий подробные доказательства.
Ссылка 👉🏻 https://openedu.ru/course/hse/LINAL/?session=fall_2020
4. Линейная алгебра, Stepik:
Данный курс представляет собой краткое изложение основ линейной алгебры. Основная его задача - напомнить базовые факты линейной алгебры, использующиеся в тех или иных разделах практического программирования.
Ссылка 👉🏻 stepik.org/course/2461
Успехов вам в изучении!🐱
Stepik: online education
Linear Algebra: Problems and Methods
The goal of the course is explain the fundamental ideas of linear algebra and how to use them to find easy solutions of hard problems.
❤7
🚨Внимание🚨 Напоминаем, что осталось 3️⃣ дня до окончания приема заявок на прием организаторов в DS Club!
Вы можете стать частью нашей команды и влиять на будущее клуба. 🚀 Прием осуществляется во ВСЕ департаменты:
💫 SMM
🪩 EVENTS
🗣️ PR
👾 HACKS&PROJECTS
📙 DEVELOPMENT&MENTORING
Читайте подробности о наборе в этом посте.
А также скорее заполняйте форму для организаторов, она открыта для всех, вне зависимости от ВУЗа, возраста и других мелочей!
👉🏻 https://forms.gle/yxfcnmUUKZzYpMeN8
❗️Дедлайн заполнения формы 01.02.2025 , 23:59❗️
С нетерпением ждем вас в нашей команде! 🧡
Вы можете стать частью нашей команды и влиять на будущее клуба. 🚀 Прием осуществляется во ВСЕ департаменты:
💫 SMM
🪩 EVENTS
🗣️ PR
👾 HACKS&PROJECTS
📙 DEVELOPMENT&MENTORING
Читайте подробности о наборе в этом посте.
А также скорее заполняйте форму для организаторов, она открыта для всех, вне зависимости от ВУЗа, возраста и других мелочей!
👉🏻 https://forms.gle/yxfcnmUUKZzYpMeN8
❗️Дедлайн заполнения формы 01.02.2025 , 23:59❗️
С нетерпением ждем вас в нашей команде! 🧡
💯3❤2🔥2🏆2😴1
❗️Ваша последняя возможность❗️ Мы продлеваем прием заявок в DS Club до 10.02.
Читайте подробности о наборе в этом посте.
Скорее заполняйте форму для организаторов:
👉🏻 https://forms.gle/yxfcnmUUKZzYpMeN8
❗️Дедлайн заполнения формы 10.02.2025 , 23:59❗️
Или форму для свободного сотрудничества:
👉🏻 https://forms.gle/yojzqRQxUrijZKZ37
Не упусти свой шанс 🧡
Читайте подробности о наборе в этом посте.
Скорее заполняйте форму для организаторов:
👉🏻 https://forms.gle/yxfcnmUUKZzYpMeN8
❗️Дедлайн заполнения формы 10.02.2025 , 23:59❗️
Или форму для свободного сотрудничества:
👉🏻 https://forms.gle/yojzqRQxUrijZKZ37
Не упусти свой шанс 🧡
🔥8❤1👍1🤯1💯1💘1
Всем привет! 👋 Мы знаем, вы уже успели соскучиться по ликбезам, поэтому представляем вашему вниманию онлайн-ликбез про сложности основных классических ML алгоритмов.
🗣️ Спикер: Дмитрий Голубев
📍 Middle Data Scientist в компании Wildberries
📍 Специалист по работе с LLM и RAG
📍 Занимается SWE и классическим ML
На ликбезе Дмитрий подробно и доступно разберет следующие темы:
🔸 Архитектура классических алгоритмов машинного обучения
🔸Нюансы использования ML алгоритмов
🔸 Сравнение алгоритмов
🔸 Практические примеры и кейсы применения
🔸 Выбор подходящих методов для конкретных задач
🗓️ Дата: 6 февраля (четверг), 20:00
🔗 Ссылка на трансляцию появится в комментариях под постом перед ликбезом
🗣️ Спикер: Дмитрий Голубев
📍 Middle Data Scientist в компании Wildberries
📍 Специалист по работе с LLM и RAG
📍 Занимается SWE и классическим ML
На ликбезе Дмитрий подробно и доступно разберет следующие темы:
🔸 Архитектура классических алгоритмов машинного обучения
🔸Нюансы использования ML алгоритмов
🔸 Сравнение алгоритмов
🔸 Практические примеры и кейсы применения
🔸 Выбор подходящих методов для конкретных задач
🗓️ Дата: 6 февраля (четверг), 20:00
🔗 Ссылка на трансляцию появится в комментариях под постом перед ликбезом
✍5🔥5⚡1❤1🐳1💯1🆒1
Всем привет!
Сегодня мы подготовили для вас подборку актуальных стажировок!👩🏼💻
🧡 Стажировка в Яндекс
🔸Набор открыт на несколько направлений:
▪️Аналитика данных
Прогнозируйте события на основе данных, занимайтесь их сбором и интерпретацией.
▪️ML
Обучайте нейросети и улучшайте алгоритмы машинного обучения для сервисов Яндекса
▪️Yandex Research ML Residency
Принимайте участие в исследованиях мирового уровня в сфере машинного обучения
Ссылка 👉 https://yandex.ru/yaintern/internship?ysclid=m6pgcgkamw6780382
🧡 Стажёр Data Scientist в Альфа Банк
🔸Обязанности:
▪️Построение ML-моделей для оптимизации процессов и решения задач бизнес-подразделений в команде Data Scientist-ов
▪️Заниматься решением задач с помощью классических ML-моделей, реже с помощью нейросетей
▪️Поиск и разработка новых признаков моделей, исследованием данных, погружаться в бизнес-процессы
🔸Требования:
▪️Теоретические знания ML
▪️Опыт в построении моделей и ▪️исследовании данных (будет преимуществом)
▪️Навыки программировании на Python
▪️Знание PEP-8 и базовых типов переменных и умение ими пользоваться
Ссылка 👉 https://alfabank.ru/alfastudents/ichoosealfa/vacancies/?rp-vacancy=51988175-dbfd-433b-b20b-7afdb965dc25
🧡 Стажёр Data engineer в Сбербанк
🔸Обязанности
▪️Извлечение данных из источников
▪️Разработка и документирование детерминированного алгоритма трансформации и очистки данных
▪️Контроль качества выборки
▪️Разработка регулярно обновляемых витрин
▪️Уточнение постановки задачи для определения оптимального состава данных для выборки
▪️Коммуникации с экспертным сообществом Банка для идентификации необходимых систем-источников и особенностей хранения данных внутри них
🔸Требования:
▪️Знание SQL
▪️Базовые знания Python
▪️Аналитическое мышление, умение быстро погружаться в новые предметные области
Ссылка 👉 https://rabota.sber.ru/search/4382768/
🧡 Курс «Компьютерное зрение» от WB Техношкола
Открыт набор на бесплатный 3-ех месячный онлайн курс от Техношколы. Это шанс научиться применять ИИ для анализа визуальной информации, используя фреймворк глубокого обучения Pytorch.
🔸В рамках курса можно научиться:
▪️классифицировать изображения, искать по фото, определять объекты на изображении, искать фотографии по текстовому описанию
▪️решать проблемы реальных данных
▪️оценивать качество моделей
▪️применять современные инструменты Python и Pytorch
🔸Требования:
▪️Английский язык
▪️Python
▪️Git
▪️Математический анализ
▪️Линейная алгебра
▪️Теория вероятности и статистика
Лучших позовут в команду Wildberries!
Ссылка 👉🏻 https://tech.wildberries.ru/courses/computer-vision
Не упусти свой шанс! ⭐️
Сегодня мы подготовили для вас подборку актуальных стажировок!👩🏼💻
🧡 Стажировка в Яндекс
🔸Набор открыт на несколько направлений:
▪️Аналитика данных
Прогнозируйте события на основе данных, занимайтесь их сбором и интерпретацией.
▪️ML
Обучайте нейросети и улучшайте алгоритмы машинного обучения для сервисов Яндекса
▪️Yandex Research ML Residency
Принимайте участие в исследованиях мирового уровня в сфере машинного обучения
Ссылка 👉 https://yandex.ru/yaintern/internship?ysclid=m6pgcgkamw6780382
🧡 Стажёр Data Scientist в Альфа Банк
🔸Обязанности:
▪️Построение ML-моделей для оптимизации процессов и решения задач бизнес-подразделений в команде Data Scientist-ов
▪️Заниматься решением задач с помощью классических ML-моделей, реже с помощью нейросетей
▪️Поиск и разработка новых признаков моделей, исследованием данных, погружаться в бизнес-процессы
🔸Требования:
▪️Теоретические знания ML
▪️Опыт в построении моделей и ▪️исследовании данных (будет преимуществом)
▪️Навыки программировании на Python
▪️Знание PEP-8 и базовых типов переменных и умение ими пользоваться
Ссылка 👉 https://alfabank.ru/alfastudents/ichoosealfa/vacancies/?rp-vacancy=51988175-dbfd-433b-b20b-7afdb965dc25
🧡 Стажёр Data engineer в Сбербанк
🔸Обязанности
▪️Извлечение данных из источников
▪️Разработка и документирование детерминированного алгоритма трансформации и очистки данных
▪️Контроль качества выборки
▪️Разработка регулярно обновляемых витрин
▪️Уточнение постановки задачи для определения оптимального состава данных для выборки
▪️Коммуникации с экспертным сообществом Банка для идентификации необходимых систем-источников и особенностей хранения данных внутри них
🔸Требования:
▪️Знание SQL
▪️Базовые знания Python
▪️Аналитическое мышление, умение быстро погружаться в новые предметные области
Ссылка 👉 https://rabota.sber.ru/search/4382768/
🧡 Курс «Компьютерное зрение» от WB Техношкола
Открыт набор на бесплатный 3-ех месячный онлайн курс от Техношколы. Это шанс научиться применять ИИ для анализа визуальной информации, используя фреймворк глубокого обучения Pytorch.
🔸В рамках курса можно научиться:
▪️классифицировать изображения, искать по фото, определять объекты на изображении, искать фотографии по текстовому описанию
▪️решать проблемы реальных данных
▪️оценивать качество моделей
▪️применять современные инструменты Python и Pytorch
🔸Требования:
▪️Английский язык
▪️Python
▪️Git
▪️Математический анализ
▪️Линейная алгебра
▪️Теория вероятности и статистика
Лучших позовут в команду Wildberries!
Ссылка 👉🏻 https://tech.wildberries.ru/courses/computer-vision
Не упусти свой шанс! ⭐️
🔥6❤1❤🔥1👍1🥰1
❗️Ваша последняя возможность❗️ Сегодня - последний день приема заявок в DS Club.
Читайте подробности о наборе в этом посте.
Скорее заполняйте форму для организаторов:
👉🏻 https://forms.gle/yxfcnmUUKZzYpMeN8
❗️Дедлайн заполнения формы 10.02.2025 , 23:59❗️
Мы ждем тебя 🧡
Читайте подробности о наборе в этом посте.
Скорее заполняйте форму для организаторов:
👉🏻 https://forms.gle/yxfcnmUUKZzYpMeN8
❗️Дедлайн заполнения формы 10.02.2025 , 23:59❗️
Мы ждем тебя 🧡
🔥2❤1💯1🆒1
Привет! 👋🏻 Мы подготовили для вас подборку интересных статей по рекомендательным системам! 💥 Сегодня подробнее рассмотрим один из трендов в этой области, который всегда остается актуальным — графовые нейронные сети.
📌 Классификация подходов
🔸 End-to-end – графовая нейросеть обучается совместно с основной моделью.
🔸 Frozen – заранее обученные графовые представления используются в замороженном виде:
▪️Трансдуктивные – не обобщаются на новых пользователей и товары.
▪️Индуктивные – позволяют получать представления для новых пользователей и товаров.
▪️Промежуточные – представления можно получить только для пользователей.
🟠 End-to-end подходы
📄 Etsy (2023)
Граф используется как дополнительная фича для поиска. Применяется SearchQuery-Product граф с семплированием соседей и усреднением в агрегации.
Ссылка 👉🏻 https://arxiv.org/abs/2306.04833
📄 Taobao (2023)
Аналогичный подход, но с item-item графом, где используется attention для агрегации.
Ссылка 👉🏻 https://arxiv.org/abs/2307.04322
📄 Amazon (2021)
Идея, похожая на работу от Etsy. Авторы делают multilingual модель.
Ссылка 👉🏻 https://arxiv.org/abs/2105.02978
📄 Alibaba Group (2022)
Ha обучении графовое представление пользователя сближается с тем, что получено из sequential модели. На этапе инференса графовая часть откидывается.
Ссылка 👉🏻 https://arxiv.org/abs/2208.13007
🟠 Трансдуктивные подходы
📄 X/Twitter (2022)
Используются обучаемые ID для каждой сущности и TransE на ВСЕ (link-prediction).
Ссылка 👉🏻 https://arxiv.org/abs/2202.05387
🟠 Промежуточные подходы
📄 Amazon (2023)
Кросс-доменный граф (музыка, видео, книги). Пользователи кодируются индуктивно, а айтемы — через обучаемые ID.
Ссылка 👉🏻 https://arxiv.org/abs/2306.06302
🟠 Индуктивные подходы
📄 Pinterest (2022)
Графовые представления для пинов, которые затем переиспользуются по всей системе.
Ссылка 👉🏻 https://arxiv.org/abs/2205.10666
📄 Spotify (2021)
Мультитаск, ВСЕ — пара вершин принадлежит одному плейлисту (link-prediction), либо пара вершин имеет один и тот же жанр, регрессия основана на близости по контенту.
Ссылка 👉🏻 https://research.atspotify.com/publications/multi-task-learning-of-graph-based-inductive-representations-of-music-content/
📄 Spotify (2020)
Собственные графовые сетки Spotify.
Ссылка 👉🏻 https://youtu.be/79MRwEB5AhA
📄 KuaiShou (2023)
Индуктивные представления для видео и тегов к ним.
Ссылка 👉🏻 https://arxiv.org/abs/2211.10624
📌 Основные выводы
✅ Графовые нейросети улучшают рекомендации на айтемах, содержащих длинные запросы.
✅ Они особенно полезны при работе с разными доменами (музыка, видео, книги и т. д.).
✅ Используются как источник кандидатов или как фичи в ранжировании.
💡 Графовые модели продолжают набирать популярность и находят применение в самых разных индустриях. Если хотите глубже разобраться в теме — изучайте статьи из подборки! 🔥
📌 Классификация подходов
🔸 End-to-end – графовая нейросеть обучается совместно с основной моделью.
🔸 Frozen – заранее обученные графовые представления используются в замороженном виде:
▪️Трансдуктивные – не обобщаются на новых пользователей и товары.
▪️Индуктивные – позволяют получать представления для новых пользователей и товаров.
▪️Промежуточные – представления можно получить только для пользователей.
🟠 End-to-end подходы
📄 Etsy (2023)
Граф используется как дополнительная фича для поиска. Применяется SearchQuery-Product граф с семплированием соседей и усреднением в агрегации.
Ссылка 👉🏻 https://arxiv.org/abs/2306.04833
📄 Taobao (2023)
Аналогичный подход, но с item-item графом, где используется attention для агрегации.
Ссылка 👉🏻 https://arxiv.org/abs/2307.04322
📄 Amazon (2021)
Идея, похожая на работу от Etsy. Авторы делают multilingual модель.
Ссылка 👉🏻 https://arxiv.org/abs/2105.02978
📄 Alibaba Group (2022)
Ha обучении графовое представление пользователя сближается с тем, что получено из sequential модели. На этапе инференса графовая часть откидывается.
Ссылка 👉🏻 https://arxiv.org/abs/2208.13007
🟠 Трансдуктивные подходы
📄 X/Twitter (2022)
Используются обучаемые ID для каждой сущности и TransE на ВСЕ (link-prediction).
Ссылка 👉🏻 https://arxiv.org/abs/2202.05387
🟠 Промежуточные подходы
📄 Amazon (2023)
Кросс-доменный граф (музыка, видео, книги). Пользователи кодируются индуктивно, а айтемы — через обучаемые ID.
Ссылка 👉🏻 https://arxiv.org/abs/2306.06302
🟠 Индуктивные подходы
📄 Pinterest (2022)
Графовые представления для пинов, которые затем переиспользуются по всей системе.
Ссылка 👉🏻 https://arxiv.org/abs/2205.10666
📄 Spotify (2021)
Мультитаск, ВСЕ — пара вершин принадлежит одному плейлисту (link-prediction), либо пара вершин имеет один и тот же жанр, регрессия основана на близости по контенту.
Ссылка 👉🏻 https://research.atspotify.com/publications/multi-task-learning-of-graph-based-inductive-representations-of-music-content/
📄 Spotify (2020)
Собственные графовые сетки Spotify.
Ссылка 👉🏻 https://youtu.be/79MRwEB5AhA
📄 KuaiShou (2023)
Индуктивные представления для видео и тегов к ним.
Ссылка 👉🏻 https://arxiv.org/abs/2211.10624
📌 Основные выводы
✅ Графовые нейросети улучшают рекомендации на айтемах, содержащих длинные запросы.
✅ Они особенно полезны при работе с разными доменами (музыка, видео, книги и т. д.).
✅ Используются как источник кандидатов или как фичи в ранжировании.
💡 Графовые модели продолжают набирать популярность и находят применение в самых разных индустриях. Если хотите глубже разобраться в теме — изучайте статьи из подборки! 🔥
🔥5