Магия данных | Артур Сапрыкин – Telegram
Магия данных | Артур Сапрыкин
906 subscribers
329 photos
57 videos
9 files
316 links
Канал Артура Сапрыкина.
- Основатель и CEO Maglosya (@maglosya)
- Создаю со своей командой AI/ML-проекты
- Преподаватель, автор курсов
- Исследователь ML и AI.

Сайт: https://arthursaprykin.ru/

По вопросам сотрудничества пишите мне: @arthur_saprykin
Download Telegram
Магия данных | Артур Сапрыкин
1 час - 2 место в конкурсе 🏆 В конце 2021 года проходил конкурс ПРО//ЗНАНИЕ, который был саттелитом большего конкурса UpGREAT ПРО//ЧТЕНИЕ (о нём в следующем посте). В ПРО//ЗНАНИИ нужно было построить классификатор наличия фактических ошибок в тексте. …
Гордость и обида

До этого писал выше про призовое второе место на ПРО//ЗНАНИИ, а также про то, что это предшествовало участию в конкурсе ПРО//ЧТЕНИЕ.

Так вот, задача на конкурсе была очень сложной, от того и очень интересной!!!
И да, призовой фонд был 100 000 000 рублей 😍 (да, в нулях не ошибся 😃)

Все вы знаете про ЕГЭ, и что есть часть С, где школьники должны написать сочинение (если мы не про математику или естественно научные дисциплины говорим).
На конкурсе предлагались тексты сочинений по дисциплинам: русский язык, обществознание, история и литература.

Необходимо было создать систему, которая должна была самостоятельно выделять участок текста, а затем классифицировать по одному или нескольким классам, которые характеризуют как-то этот участок или содержат какую-то ошибку.

Классов было много, данных мало, всё как мы любим.
Приступил к задаче поздно, и у меня была неделя для того, чтобы пройти квалификационные испытания.

В итоге, мне удалось собрать сильное решение, за счёт иерархического моделирования, и на всех тестах на квалификации результаты были на высшем уровне!

ПРОДОЛЖЕНИЕ В СЛЕДУЮЩЕМ ПОСТЕ 👇🏼
🔥3👍1
Гордость и обида (продолжение)

Дальше был финал.
Попали 5 команд, где с самого утра до вечера, наши сервисы должны были принимать, а затем обрабатывать поступающие документы.

Условие было такое, чтобы полноценный анализ и подготовка разметки нашими решения проходили максимум до 60 секунд.

Наверное, я никогда раньше не был так приклеен к компьютеру, чтобы следить за состоянием сети и сервиса.
Был даже инцидент, когда система с ошибкой принимала разметки по «литературе» от меня, но вопрос решили, так как косяк был на стороне принимающей системы.

Долго ждали результатов, но в конце концов стало известно, что я занял 3е место 🏆, меня обошли 2 компании.

2е место было достаточно близко по метрикам к моему решению, а 1е место сильно выделялось на нашем фоне.
Действительно, достойная работа. 👍🏼

Конечно, было обидно, что призовой фонд весь достался только первому месту, а нам только дипломы дали, НО насколько я горжусь тем, что удалось собрать отличное решение для такой сложной задачи всего за неделю!

Один из уроков для меня тогда стал, что нужно всё-таки больше времени уделять на соревнование. 📝
👍4🔥3
Магия данных | Артур Сапрыкин
Анонсирую мощный курс "Основы NLP. Общая теория и практика" ⚡️⚡️⚡️. В рамках курса рассмотрим различные направления обработки естественного языка от классических подходов до самых современных. Мы рассмотрим, какие задачи решает направление NLP, что уже…
В понедельник уже официально стартует курс "Основы NLP. От Теории к Практике".

Ребята уже приглашены в общую группу потока.
Создалась душевная и веселая обстановка и компания 🌟🦾🔥
Все общаются, знакомятся, и, как оказалось, немало общего друг с другом (кстати, такие особенности всегда наблюдаются 🙂 )

Набор ещё продолжается, поэтому буду рад пополнениям в наши ряды 🕶️

Стоимость курса 15 000 рублей.

По вопросам участия и приобретения курса, пишите мне - @arthur_saprykin
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Наше первое занятие завершилось успешно 🤩
🔥15
Увидел на просторах сети очень наглядную статью про типы инференсов ML-моделей.

Строго к ознакомлению всем!
Написана прекрасно, ясно, даже приведены живые примеры использования.

Все уйдут просветленными 😁
Друзья, 26 мая в рамках Positive Hack Days 2024 будет проходить PythonDay (тот самый Moscow Python Conf++), где разработчики на Python из разных компаний будут делиться своим опытом.

Среди спикеров буду я, и расскажу про "жизнь во время и после языковых моделей" (анонс будет позже).

В честь этого, у меня есть возможность привести с собой человека на конференцию бесплатно.

Поэтому, среди купивших курс "Основы NLP. От Теории к Практике" я объявляю розыгрыш.

Розыгрыш будет проходить в пятницу в 10 утра по московскому времени в прямом эфире.
Друзья, с Альфа банка прислали вакансию "Тестировщик ML-моделей на Python".

В комментариях к посту скину полное описание, если кому интересно и соответствует, пишите в личку @arthur_saprykin
Media is too big
VIEW IN TELEGRAM
Мои поздравления @AlexFee1 !

До встречи 26 мая на конференции Python Day в рамках Positive Hack Days.

Спасибо всем, кто присоединился к курсу 🙏🏼☀️

Продолжаем движение 😎🦾⚡️
🔥3
Forwarded from ProIT Fest
🗺 Перемещаемся из Питера в Москву, где 14 мая мы проведём DS Meetup Real Easy х ProIT Fest

Приглашаем вас погрузиться в сферу Computer Vision от разных индустрий: PropTech, видеоконтент и генерация новостей.

Программа следующая:

🤩 Доклад «Решение задачи определения пиратского контента в UGC». Как не допустить откровенный контент на видеоплатформе с ежедневной загрузкой более 30к видео
Спикер: Григорий Скворцов — руководитель направления ML Rutube

🤩Доклад «Мониторинг техники на стройке с помощью CV»
Спикер: Александр Неварко — аналитик больших данных в Самолете, занимается задачами видеоаналитики в реальном времени

🤩 Мастер-класс «Мультиагент. Делегирование задач на множество моделей».
Спикер: Артур Сапрыкин — предприниматель, поработавший со многими крупными и амбициозными компаниями, автор и преподаватель курсов по машинному обучению, более 8 лет занимается DataScience.

Регистрация по ссылке
Дата и время: 14 мая, 19:00-22:00
Локация: Москва, COiN event HALL
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
Заходите на огонёк

Мероприятие бесплатное, рады всем специалистам из даты ☺️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Forwarded from Machinelearning
🖥 Gpt2-chatbot = Gpt-5 ?

Появился новый загадочный LLM под названием “gpt2-chatbot”, который невероятно хорошо справляется с широком спектром задач.

Пользователи reddit уверены, что создатели модели - OpenAI и таким образом они тестируют GPT-5 или GPT-4.5.

Модель выдает рабочий код высочайшего качества на всех популярных языках, решает олимпиадные задачи по математике, физике, на недоступном ранее уровне и демонстрирует высокое качество рассуждений и логики.

GPT-4 тоже тестили подобным образом внутри Bing Chat, так что это вполне может быть новая модель OpenAI.

Вот как вы можете попробовать ее бесплатно и оценить модель сами:

- перейдите по ссылке: http://chat.lmsys.org

- перейдите во вкладку “Direct Chat”.

- введите свой промпт.

На видео сравниваем GPT-4 Turbo и Gpt2-chatbot. Отправляем запрос на создание игры на JS в одном HTML-документе.

Первое видео результат работы - GPT-4 Turbo, Второе - Gpt2-chatbot.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
На некоторые вещи просто приятно смотреть :)
👍12
Для глубоких познаний в управлении серпентарием ⚡️
Forwarded from Никита Соболев
Лучший курс по питону: bool
Или "обзор исходников CPython с CPython core разработчиком".

В рамках поддержки конференции Python Day на Positive Hack Days!
Билеты (всего за 1000 рублей!) и регистрация: https://bit.ly/phd-mpp

О чем поговорим в видео?

Уровень Junior:
- Магические методы __add__ и __len__
- Почему нужно использовать is, а не ==, для сравнения объектов с True и False?
- Почему bool ведет себя как int?

Уровень Middle:
- ast для ключевых слов and, or, и not
- Ленивые условия
- Использование all и any

Уровень Senior:
- PyBool CAPI и Py_LIMITED_API
- Оптимизация байткода в CPython
- FlowGraph

https://www.youtube.com/watch?v=sS5SFcqGp6M
👍21
Яндекс выложил в опенсорс свою альтернативу Apache Kafka - YDB Topics.

Об этом вчера вышла статья на Хабре, где рассказывают, чем хорош их продукт, а также про отличия от Kafka и Pulsar.

Учитывая, что их Clickhouse приобрел любовь во всем мире, то есть вероятность, что Topics также будет достойно оценен.

Время покажет :)
👍3🔥3
Дескрипторы просили? Нееет?
Но я всё равно их покажу :)

Пробежался по любопытной статье, рассказывающей про питонячьи дескрипторы.

Не уверен, что на практике многие из вас будут этим пользоваться, но очень полезно, чтобы понимать внутренние процессы классов.

Знание - свет! 💡
👍4
ИИнтересная стажировка 🔥

Национальный центр развития искусственного интеллекта при Правительстве Российской Федерации даёт возможность получить стажировку по профилю искусственный интеллект.

Вам необходимо:

пройти по ссылке;
— зарегистрироваться на Национальном портале искусственного интеллекта Правительства Российской Федерации;
— заполнить анкету в личном кабинете.

Таким образом вы попадаете в базу данных стажеров по ИИ, которую организации предоставляющие места для стажеров смогут просмотреть и связаться с заинтересовавшим их кандидатом.

От качества и полноты указанной информации в вашем резюме, будет зависеть интерес организаций к Вам, как к стажеру.
👍2