Магия данных | Артур Сапрыкин – Telegram
Магия данных | Артур Сапрыкин
906 subscribers
329 photos
57 videos
9 files
316 links
Канал Артура Сапрыкина.
- Основатель и CEO Maglosya (@maglosya)
- Создаю со своей командой AI/ML-проекты
- Преподаватель, автор курсов
- Исследователь ML и AI.

Сайт: https://arthursaprykin.ru/

По вопросам сотрудничества пишите мне: @arthur_saprykin
Download Telegram
Одна из первых задач, в которую я сильно вкладывался при разработке - это саммаризация.

В чём состоит задача?
Это краткое изложение какого-то текста. Может быть выдержка наиболее значимых фрагментов текста (экстрактивная саммаризация) или генерация этого же текста более коротко (абстрактивная).

Очень интересная, и в тоже время сложная задача, потому что формировать или извлекать ключевую мысль непросто. Даже не каждый человек это делает легко.

Так или иначе, предлагаю почитать статью, чтобы повысить грамотность в этом вопросе.

Всем мир!
👍8❤‍🔥3🔥21
Ну, что же, для тех кто уже познакомился с миром нейронных сетей известно такое понятие, как loss-function.

Хотя эти функции используются для оценки качества обучения не только в нейронках, обычно многообразие lossов видим именно в этом контексте.

Для тех, кто ещё не успел познакомиться с этим понятием, и какие функции бывают, рекомендую прочитать вот эту и эту статью на простую, но важную тему.
👍5
Друзья, кто из Москвы, есть возможность встретиться лично на конференции Moscow Python Conf++ 2023 уже в эту субботу 🙂
🗓 С Артуром Сапрыкиным обсудим большие языковые модели + словарные описания как способ кодирования слов и фразеологизмов

📋 https://bit.ly/3W7gEiN

Применение эмбеддингов языковых моделей на всём тексте не всегда дает четкое разделение для качественного обучения под другие задачи. Периодически возникают задачи, где нужно сократить лексикон для повышения точности классификации или кластеризации текста, а постоянное дообучение fasttext не всегда возможно, тем более он не работает со словосочетаниями.

Артур хочет поделиться иным способом кодирования слов и словосочетаний с помощью больших языковых моделей и словарных описаний слов и фразеологизмов, благодаря которым схожесть слов учитывается не по контексту применения, а по смыслу содержания.

Встречаемся 19 и 20 мая на Moscow Python Conf++ 2023 🙌

Участие в конференции бесплатное. Вход возможен только при предъявлении именного билета.

➡️Чтобы получить именной билет, заполните анкету - https://bit.ly/3Ienyx5
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Для тех, кому ещё сложно понимать, насколько хороша/плоха ситуация со скоростью вычисления алгоритма, то вот красивый график сравнения.

А ещё есть красивое и понятное видео, где рассказывают про Big O.
👍12🔥7🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Прогонка прошла успешно, готов в субботу вещать 🧑🏼‍🚀🌍
🔥9👍3
Друзья, всем спасибо, кто пришёл!

Было круто и интересно!

Был рад видеть каждого, и отвечать на интересные вопросы 🦾🔥
🍾15🔥10👍4
Оффтопик от наших тем, но хочу сказать, что в IT мире мерч - это что-то вроде валюты, которую с удовольствием ждёшь 🙂

Вы тоже любите мерч? 😉
🔥14👏1
Мне реально часто задают вопрос про то, чем отличаются эти дата-специальности, и вот вам наглядный ответ.

Но моё мнение такое, что если в вакансии указано это направление, то не значит, что будете заниматься тем, что на изображении указано 😀
👍18😁1🤔1
Чудесная и очень полная статья про то, как используются и обучаются сверточные нейронные сети.

Много теории, но зато в голове порядок будет в использовании нейронных сетей.

С этой статьи открываю цикл #теориянейронныхсетей , где будут статьи с максимально подробным описанием работы нейронок.

Во имя познания 😎🙏🏼☀️
👍9🤔1
Ребята, а у меня ещё анонс! Вообще, май полон публичных выступлений

27 и 28 на фестивале GeekPicnic в Москве снова соберутся московские стартапы и учёные, музыканты и дизайнеры, студенты IT направлений и фрилансеры, чтобы стать частью главной технологической сети страны!

Но что важно сообщить - 28 мая я буду вещать совместно с сотрудниками Нетологии про нейросети и ИИ.
Сразу скажу, что мероприятие больше научпоп формата, но от этого не менее интересное.
Весь таймлайн на изображениях.

Приходите, вживую пообщаеся. Буду рад всем 🤗

Место: Москва, Остров Мечты (Южный Ландшафтный Парк), лекторий «Путь в IT».
6🤔2👎1🔥1
Классная статья по разработке системы геоаналитики.
Обязательно изучите, чтобы понимать этапы разработки, и расширить понимание в анализе данных и построении моделей
Forwarded from DATApedia | Data science
​​Как построить систему геоаналитики с применением ML

В этой статье рассмотриавются примеры работы сервисов геоаналитики VK Predict. Выясняется, какие модели машинного обучения используются при построении таких систем и из каких этапов состоит разработка продукта с возможностями геоаналитики.

Перейти к статье | DATApedia
🔥2
Когда обучаете модель регрессии, и вдруг обнаруживаете, что коэффициент детерминации R2 на тесте выше 0.99.

Какие первые мысли у вас появляются? 🤔
Наткнулся в сети на очень познавательную статью, где автор реализовывал на Python конечный автомат для бизнес-процессов с Jira.

Мне лично понравилось, особенно учитывая мою любовь к конечным автоматам.

К сожалению, теории мало, но практика очень показательна.

Изучайте 😉
👍4🔥31
Хочу поделиться статьёй про синтаксические парсеры с теми, кто начал свой путь в NLP.

Это направление сейчас слабо развивается из-за популярности и успеха моделей на трансформерах, но ведь при правильном подходе никто не помешает объединить всё 😉

Статья хоть и не новая, но и прорывов, как таковых, не произошло, кроме библиотеки spacy, которая на основе нейронок достаточно хорошо проводит синтаксический анализ.

Стоит обратить внимание, что статья содержит немало мыслей, которые расширят ваше восприятие работы с текстами.

Наслаждайтесь и просвещайтесь ☀️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🙏1
Выложили в видео в ютуб с моим докладом на конференции Moscow Python Conf++ 2023.

Тема была "Большие языковые модели + словарные описания слов" 😎

Тем, кто пропустил - посмотрите и ставьте лайки!
Было классно и интересно 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥109
Хочу рекомендовать статью с достаточно подробным списоком функций активаций.
Чтобы столько в одном месте мне не приходилось встречать.

Поэтому оставлю это тут.

Из плюсов - много функций активаций и их производные (всё в одном месте)
Минус - нет объяснений, зачем может пригодиться та или иная функция, что важно новичкам.

Дополнительно оставлю код на Python с реализованными функциями активации (для закрепления материала)