Магия данных | Артур Сапрыкин – Telegram
Магия данных | Артур Сапрыкин
906 subscribers
329 photos
57 videos
9 files
316 links
Канал Артура Сапрыкина.
- Основатель и CEO Maglosya (@maglosya)
- Создаю со своей командой AI/ML-проекты
- Преподаватель, автор курсов
- Исследователь ML и AI.

Сайт: https://arthursaprykin.ru/

По вопросам сотрудничества пишите мне: @arthur_saprykin
Download Telegram
а на www.llama2.ai можно и с 70B поиграть)
😁4
This media is not supported in your browser
VIEW IN TELEGRAM
наши роботы передают приветы капче (🖕)
🔥5
Узнаёте себя? 😂
👍6😁4
Магия данных | Артур Сапрыкин
1 час - 2 место в конкурсе 🏆 В конце 2021 года проходил конкурс ПРО//ЗНАНИЕ, который был саттелитом большего конкурса UpGREAT ПРО//ЧТЕНИЕ (о нём в следующем посте). В ПРО//ЗНАНИИ нужно было построить классификатор наличия фактических ошибок в тексте. …
Гордость и обида

До этого писал выше про призовое второе место на ПРО//ЗНАНИИ, а также про то, что это предшествовало участию в конкурсе ПРО//ЧТЕНИЕ.

Так вот, задача на конкурсе была очень сложной, от того и очень интересной!!!
И да, призовой фонд был 100 000 000 рублей 😍 (да, в нулях не ошибся 😃)

Все вы знаете про ЕГЭ, и что есть часть С, где школьники должны написать сочинение (если мы не про математику или естественно научные дисциплины говорим).
На конкурсе предлагались тексты сочинений по дисциплинам: русский язык, обществознание, история и литература.

Необходимо было создать систему, которая должна была самостоятельно выделять участок текста, а затем классифицировать по одному или нескольким классам, которые характеризуют как-то этот участок или содержат какую-то ошибку.

Классов было много, данных мало, всё как мы любим.
Приступил к задаче поздно, и у меня была неделя для того, чтобы пройти квалификационные испытания.

В итоге, мне удалось собрать сильное решение, за счёт иерархического моделирования, и на всех тестах на квалификации результаты были на высшем уровне!

ПРОДОЛЖЕНИЕ В СЛЕДУЮЩЕМ ПОСТЕ 👇🏼
🔥3👍1
Гордость и обида (продолжение)

Дальше был финал.
Попали 5 команд, где с самого утра до вечера, наши сервисы должны были принимать, а затем обрабатывать поступающие документы.

Условие было такое, чтобы полноценный анализ и подготовка разметки нашими решения проходили максимум до 60 секунд.

Наверное, я никогда раньше не был так приклеен к компьютеру, чтобы следить за состоянием сети и сервиса.
Был даже инцидент, когда система с ошибкой принимала разметки по «литературе» от меня, но вопрос решили, так как косяк был на стороне принимающей системы.

Долго ждали результатов, но в конце концов стало известно, что я занял 3е место 🏆, меня обошли 2 компании.

2е место было достаточно близко по метрикам к моему решению, а 1е место сильно выделялось на нашем фоне.
Действительно, достойная работа. 👍🏼

Конечно, было обидно, что призовой фонд весь достался только первому месту, а нам только дипломы дали, НО насколько я горжусь тем, что удалось собрать отличное решение для такой сложной задачи всего за неделю!

Один из уроков для меня тогда стал, что нужно всё-таки больше времени уделять на соревнование. 📝
👍4🔥3
Магия данных | Артур Сапрыкин
Анонсирую мощный курс "Основы NLP. Общая теория и практика" ⚡️⚡️⚡️. В рамках курса рассмотрим различные направления обработки естественного языка от классических подходов до самых современных. Мы рассмотрим, какие задачи решает направление NLP, что уже…
В понедельник уже официально стартует курс "Основы NLP. От Теории к Практике".

Ребята уже приглашены в общую группу потока.
Создалась душевная и веселая обстановка и компания 🌟🦾🔥
Все общаются, знакомятся, и, как оказалось, немало общего друг с другом (кстати, такие особенности всегда наблюдаются 🙂 )

Набор ещё продолжается, поэтому буду рад пополнениям в наши ряды 🕶️

Стоимость курса 15 000 рублей.

По вопросам участия и приобретения курса, пишите мне - @arthur_saprykin
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Наше первое занятие завершилось успешно 🤩
🔥15
Увидел на просторах сети очень наглядную статью про типы инференсов ML-моделей.

Строго к ознакомлению всем!
Написана прекрасно, ясно, даже приведены живые примеры использования.

Все уйдут просветленными 😁
Друзья, 26 мая в рамках Positive Hack Days 2024 будет проходить PythonDay (тот самый Moscow Python Conf++), где разработчики на Python из разных компаний будут делиться своим опытом.

Среди спикеров буду я, и расскажу про "жизнь во время и после языковых моделей" (анонс будет позже).

В честь этого, у меня есть возможность привести с собой человека на конференцию бесплатно.

Поэтому, среди купивших курс "Основы NLP. От Теории к Практике" я объявляю розыгрыш.

Розыгрыш будет проходить в пятницу в 10 утра по московскому времени в прямом эфире.
Друзья, с Альфа банка прислали вакансию "Тестировщик ML-моделей на Python".

В комментариях к посту скину полное описание, если кому интересно и соответствует, пишите в личку @arthur_saprykin
Media is too big
VIEW IN TELEGRAM
Мои поздравления @AlexFee1 !

До встречи 26 мая на конференции Python Day в рамках Positive Hack Days.

Спасибо всем, кто присоединился к курсу 🙏🏼☀️

Продолжаем движение 😎🦾⚡️
🔥3
Forwarded from ProIT Fest
🗺 Перемещаемся из Питера в Москву, где 14 мая мы проведём DS Meetup Real Easy х ProIT Fest

Приглашаем вас погрузиться в сферу Computer Vision от разных индустрий: PropTech, видеоконтент и генерация новостей.

Программа следующая:

🤩 Доклад «Решение задачи определения пиратского контента в UGC». Как не допустить откровенный контент на видеоплатформе с ежедневной загрузкой более 30к видео
Спикер: Григорий Скворцов — руководитель направления ML Rutube

🤩Доклад «Мониторинг техники на стройке с помощью CV»
Спикер: Александр Неварко — аналитик больших данных в Самолете, занимается задачами видеоаналитики в реальном времени

🤩 Мастер-класс «Мультиагент. Делегирование задач на множество моделей».
Спикер: Артур Сапрыкин — предприниматель, поработавший со многими крупными и амбициозными компаниями, автор и преподаватель курсов по машинному обучению, более 8 лет занимается DataScience.

Регистрация по ссылке
Дата и время: 14 мая, 19:00-22:00
Локация: Москва, COiN event HALL
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
Заходите на огонёк

Мероприятие бесплатное, рады всем специалистам из даты ☺️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Forwarded from Machinelearning
🖥 Gpt2-chatbot = Gpt-5 ?

Появился новый загадочный LLM под названием “gpt2-chatbot”, который невероятно хорошо справляется с широком спектром задач.

Пользователи reddit уверены, что создатели модели - OpenAI и таким образом они тестируют GPT-5 или GPT-4.5.

Модель выдает рабочий код высочайшего качества на всех популярных языках, решает олимпиадные задачи по математике, физике, на недоступном ранее уровне и демонстрирует высокое качество рассуждений и логики.

GPT-4 тоже тестили подобным образом внутри Bing Chat, так что это вполне может быть новая модель OpenAI.

Вот как вы можете попробовать ее бесплатно и оценить модель сами:

- перейдите по ссылке: http://chat.lmsys.org

- перейдите во вкладку “Direct Chat”.

- введите свой промпт.

На видео сравниваем GPT-4 Turbo и Gpt2-chatbot. Отправляем запрос на создание игры на JS в одном HTML-документе.

Первое видео результат работы - GPT-4 Turbo, Второе - Gpt2-chatbot.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
На некоторые вещи просто приятно смотреть :)
👍12
Для глубоких познаний в управлении серпентарием ⚡️