Магия данных | Артур Сапрыкин – Telegram
Магия данных | Артур Сапрыкин
906 subscribers
329 photos
57 videos
9 files
316 links
Канал Артура Сапрыкина.
- Основатель и CEO Maglosya (@maglosya)
- Создаю со своей командой AI/ML-проекты
- Преподаватель, автор курсов
- Исследователь ML и AI.

Сайт: https://arthursaprykin.ru/

По вопросам сотрудничества пишите мне: @arthur_saprykin
Download Telegram
Хотите обучить мощную языковую модель под ваши конкретные задачи?

Вот человек дообучил GPT-2 на научных статьях.
Как он это сделал и что в итоге получил, можете прочитать в статье.

Очень полезно, особенно тем, кто никогда ничего не файнтюнил, и вообще, хочет разобраться, как готовые модели помогают тем, у кого нет лярдов долларов на подготовку и обучения новой GPT 🙂
🔥6👍3
Всем привет, а у нас есть уютный чат.

Заходите, можете обсуждать темы ИИ, DS и вообще IT.
🎅1
Ещё хочу поделиться с вами с одним из направлений информатики - клеточные автоматы.

Да, это про известную игру Жизнь и ей подобные.

Знаете, правила и код у неё достаточно просты, но, как известно, всё гениальное просто, и я вдохновляюсь этой простотой и красотой.

Один замечательный человек на Хабре создал цикл статей, посвящённых тому, что было сделано с помощью клеточный автоматов, какие шаблоны есть. Некоторые из них влились в современную культуру (без преувеличений).

Вот список:
Статья 1
Статья 2
Статья 3
Статья 4

Наслаждайтесь и вдохновляйтесь. ☀️
👍51
Сегодня расскажу про поиск похожих аудио. Заходите! 🙌
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Поиск похожих аудио

Успевайте зарегистрироваться. Количество мест строго ограничено!

👉Регистрация

Время проведения:

21 Марта (Вторник) в 19:00 по МСК

Программа практикума:

🔹Теория работы алгоритма Shazam
🔹Готовые инструменты, которые решают аналогичную задачу. Применение на практике

Кто ведет?

Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
👍4🔥21
Друзья, кому интересен сентимент-анализ (это когда токсичность текста классифицируем), то загляните сюда.

Здесь специалист по DS Сергей Сметанин пару лет назад провёл своё исследование на тему моделей, решающих эту задачу.

Не смотрите на давность. До сих пор актуально.
👍4👎1🔥1
Мне, кажется, что для многих будет полезно.
Forwarded from DL in NLP (Vlad Lialin)
Внезапно поделюсь статьёй на VC от знакомой (да, я сам удивлен). Статья на наболевшую тему составления резюме.

Четыре года назад когда я переехал на учебу в штаты именно Анна помогла мне полностью переделать CV, после чего я попал на стажировку в гугл.

В статье есть полезные советы о том что добавлять в описание опыта работы, например перечислить скилы которые вы получили там, а что не надо. Также есть ссылки на хорошие шаблоны CV в Overleaf.
👍5🔥3
😂👍🏼
🔥10😁6😢1
Forwarded from Типичный программист
Умер сооснователь Intel Гордон Мур

Гордону Муру было 94 года. Именно он сформулировал «закон Мура». В 1965 году Мур предположил, что количество транзисторов в интегральной схеме будет удваиваться каждый год.

Press F.

#intel #история
😱2🙏2🫡2
Для тех, кто уже учит нейронки, и думает насчёт размещения куда-либо, да ещё и максимально оптимально, то вот статья.

Тут ребята с Даблтап рассказали, какие способы есть для оптимизации нейронок.

Классный ликбез, рекомендую! 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
Заходите на огонёк 🙂
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Алгоритмы классификации изображений

Успевайте зарегистрироваться. Количество мест строго ограничено!

👉Регистрация

Время проведения:

28 Марта (Вторник) в 19:00 по МСК

Программа практикума:

🔹ImageNet и его роль в современном глубоком обучении
🔹Сверточные нейронные сети в задачах классификации
🔹Архитектуры нейронных сетей от ResNet до Yollo

Кто ведет?

Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
А вот на просторах комьюнити выложили тетрадь с ALPACA - https://colab.research.google.com/drive/1eWAmesrW99p7e1nah5bipn0zikMb8XYC

Если очень коротко, то это языковая модель, которая +- работает на уровне GPT-3.
2
Вот краткая её история
Forwarded from Ppilif
ещё из забавного — Meta продолбала модель свою, а какие-то челы из стэнфорда доучили её, но я хз есть ли доученный варик в открытом доступе (кажется по ссылке ниже есть)

Но хочу рассказать о другой интересной новости: у meta есть большая языковая модель LLAMA которая утекла в торент, и есть GPT-3 от openai, у которой есть доступ только к API и нужно платить деньги)
Но исследователей из Стэнфорда это никак не смутило!
Они взяли LLAMA, сгенерировали 52к инструкций с помощью доступной по API модели GPT-3 (как они пишут, что на это ушло порядка $500), дообучили LLAMA за несколько часов (еще $100) и по качеству генерации полученная модель не уступает GPT-3.
Вроде бы очень простая идея, но результат супер! (назвали получившуюся модельку ALPACA)
👍6
Немного запоздалая весть, но обязан сообщить, что Твиттер выкинули в открытый доступ код своей рекомендательной системы.

Особенно полезно тем, кто ещё с рексис не освоился, а вдохновение откуда то брать нужно.

В общем, полезные практики, которые помогут расширить своё восприятие в продвижении чего-либо и создании моделей.
🔥6👍1