Магия данных | Артур Сапрыкин – Telegram
Магия данных | Артур Сапрыкин
906 subscribers
329 photos
57 videos
9 files
316 links
Канал Артура Сапрыкина.
- Основатель и CEO Maglosya (@maglosya)
- Создаю со своей командой AI/ML-проекты
- Преподаватель, автор курсов
- Исследователь ML и AI.

Сайт: https://arthursaprykin.ru/

По вопросам сотрудничества пишите мне: @arthur_saprykin
Download Telegram
Друзья, я обещал в чате сегодня скинуть Альпаку на русском языке.

Её обучал Илья Гусев, и как-то недавно сообщил об этом в одном из чатов NLPэшников.

Можете любить и жаловать - https://huggingface.co/IlyaGusev/llama_13b_ru_turbo_alpaca_lora

Пробуйте, пишите свои наблюдения, результаты работы в комментарии к посту.

Будет интересно 🦾
🔥8🎉1
Channel name was changed to «Магия данных | Артур Сапрыкин»
timeline.pdf
47.9 KB
Увидел в одном NLP-сообществе, как развивались большие нейросетевые модели, начиная с появления трансформеров, заканчивая современными моделями.

Классный ориентир. Одобряю ☀️
👍12
А тут анонс моего выступления на конференции подоспел. Приходите 🙌
Please open Telegram to view this post
VIEW IN TELEGRAM
Следующий наш спикер:

Артур Сапрыкин - Data scientist, предприниматель, исследователь AI, автор и преподаватель курсов по машинному обучению.

"Покажу работу методов и прогнозов временного ряда, а также много визуализаций графиков ряда и его компонентов."

📍 Тема: Декомпозиция временных рядов с помощью сингулярного-спектрального разложения (SSA), и её польза для прогноза

- Что из себя представляет сингулярно-спектрально разложение (SSA).
- Выделение компонентов ряда с помощью SSA с различными наборами параметров. Подбор оптимальных параметров SSA.
- Преимущества обучения моделей на каждой отдельной компоненте перед построением единой модели.

📍 Регистрация на конференцию - clck.ru/34BXk7
🔥151
Forwarded from IT Юмор
This media is not supported in your browser
VIEW IN TELEGRAM
«Документация к фреймворку? Не, не слышал»
😁12🤔1
Друзья, представьте себе, что ИИ имеет такие же возможности, как в фантастических фильмах, и по сути сопровождают нас ещё глубже, чем сейчас.

Представили?
А теперь напишите в комментариях, какую услугу вы бы хотели видеть в будущем от ИИ.
Например, робот парикмахер, терапевт и тд.

Это будет интересно, и поддайте огоньку 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Одна из основополагающих статей по графам знаний.
Если вы хотите создать систему, с обновляющей системой знаний (в том числе поисковые системы), то эта статья может дать старт.

Там нет никакой практики, но есть обзорная информация и ссылки на другие статьи, помогающие понять, что это такое, и как может вам помочь.

От себя скажу, что графы знаний очень помогают решать много задач, и я стараюсь любую задачу свести к такой системе.
🔥3
Недавно выступал на тему аналитики больших данных для самых начинающих в этой сфере.
Полезно для тех, кто ещё не знает, что можно делать с помощью больших данных и машинного обучения 🙂
💥 Запись митапа «Работа с данными: использование больших данных, машинного обучения и аналитики, чтобы улучшить принятие решений и предсказать тенденции на рынке»

🎙 Спикер: Артур Сапрыкин — Предприниматель, исследователь AI, преподаватель и автор курсов по машинному обучению.

Автор телеграм-канала Магия Данных

Ты узнаешь:
Что такое большие данные и машинное обучение;
Какую роль большие данные и машинное обучение играют в принятии решений;
Сферы применения;
И многое другое.

Приятного просмотра. Посмотреть митап можно по ссылке.
👍14
Мне очень нравится тема информационной безопасности (видимо, мои интересы неспроста 😂), как то наткнулся на статью на тему контроля доступа.

Там на примере кода на Python объяснены базовые концепции управления доступом.

Очень познавательно, и может быть вдохновит вас на свою реализацию 😉
🔥3
Хочу поделиться с вами статьёй о способе обучения временных рядов, точней архитектуре.

Речь идёт об N-BEATS.
Он состоит из блоков, которые осуществляют прогноз, как вперёд, так и назад.

Дальше то, что спрогнозировано назад вычитается из входного сигнала, а прогноз вперёд идёт в копилочку для дальнейшего сложения.

Такая процедура идёт в зависимости от того, какой размер блока вы определите, и в конце концов множество прогнозов суммируете между собой.

Весьма вдохновляет архитектура, ведь вычитанием прошлого мы идём на шаг назад, и пытаемся предсказать то, на текущий момент.

Это неполное описание. Только лишь блок, все подробности в статье.

Думаю попробовать и исследовать модель лучше, а затем поделюсь интересными наблюдениями ☺️
👍7❤‍🔥6
Попалась на глаза статья про классические структуры данных.

Хоть она и называется для «Дата инженеров», я скажу, что нужно знать всем, кто хоть как-то себя связывает с программированием.

Там и хэш-индексы, и графы разные.

Для того, чтобы освежить в своей голове или узнать Основы - очень даже хорошо.
😍7👍4
Одна из первых задач, в которую я сильно вкладывался при разработке - это саммаризация.

В чём состоит задача?
Это краткое изложение какого-то текста. Может быть выдержка наиболее значимых фрагментов текста (экстрактивная саммаризация) или генерация этого же текста более коротко (абстрактивная).

Очень интересная, и в тоже время сложная задача, потому что формировать или извлекать ключевую мысль непросто. Даже не каждый человек это делает легко.

Так или иначе, предлагаю почитать статью, чтобы повысить грамотность в этом вопросе.

Всем мир!
👍8❤‍🔥3🔥21
Ну, что же, для тех кто уже познакомился с миром нейронных сетей известно такое понятие, как loss-function.

Хотя эти функции используются для оценки качества обучения не только в нейронках, обычно многообразие lossов видим именно в этом контексте.

Для тех, кто ещё не успел познакомиться с этим понятием, и какие функции бывают, рекомендую прочитать вот эту и эту статью на простую, но важную тему.
👍5
Друзья, кто из Москвы, есть возможность встретиться лично на конференции Moscow Python Conf++ 2023 уже в эту субботу 🙂