NEW BOT Телеграм, страница

Магия данных | Артур Сапрыкин

Хотите обучить мощную языковую модель под ваши конкретные задачи?

Вот человек дообучил GPT-2 на научных статьях.
Как он это сделал и что в итоге получил, можете прочитать в статье.

Очень полезно, особенно тем, кто никогда ничего не файнтюнил, и вообще, хочет разобраться, как готовые модели помогают тем, у кого нет лярдов долларов на подготовку и обучения новой GPT 🙂

Medium

I Fine-Tuned GPT-2 on 110K Scientific Papers. Here’s The Result

Content writing by AI is common, but is it possible for an AI to write technical essays?

🔥6👍3

522 views15:34

Магия данных | Артур Сапрыкин

Всем привет, а у нас есть уютный чат.

Заходите, можете обсуждать темы ИИ, DS и вообще IT.

Data Magic Chat

You’ve been invited to join this group on Telegram.

🎅1

423 views11:08

Магия данных | Артур Сапрыкин

Ещё хочу поделиться с вами с одним из направлений информатики - клеточные автоматы.

Да, это про известную игру Жизнь и ей подобные.

Знаете, правила и код у неё достаточно просты, но, как известно, всё гениальное просто, и я вдохновляюсь этой простотой и красотой.

Один замечательный человек на Хабре создал цикл статей, посвящённых тому, что было сделано с помощью клеточный автоматов, какие шаблоны есть. Некоторые из них влились в современную культуру (без преувеличений).

Вот список:
Статья 1
Статья 2
Статья 3
Статья 4

Наслаждайтесь и вдохновляйтесь. ☀️

Хабр

10 удивительно зрелищных простейших клеточных автоматов

?, Хабр! Осторожно, присутствуют мерцающие гифки. Они спрятаны под спойлеры , открывайте на своё усмотрение. На большом экране рекомендуется смотреть в хорошо освещённом помещении. Базовая вводная...

👍5❤1

493 views11:16

Магия данных | Артур Сапрыкин

Сегодня расскажу про поиск похожих аудио. Заходите! 🙌

Please open Telegram to view this post

VIEW IN TELEGRAM

376 views14:22

Магия данных | Артур Сапрыкин

Forwarded from Data Science by REBRAIN

Открытый практикум Data Analyst by Rebrain: Поиск похожих аудио

Успевайте зарегистрироваться. Количество мест строго ограничено!

👉Регистрация

Время проведения:

21 Марта (Вторник) в 19:00 по МСК

Программа практикума:

🔹Теория работы алгоритма Shazam
🔹Готовые инструменты, которые решают аналогичную задачу. Применение на практике

Кто ведет?

Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.

👍4🔥2❤1

362 views14:22

Магия данных | Артур Сапрыкин

Друзья, кому интересен сентимент-анализ (это когда токсичность текста классифицируем), то загляните сюда.

Здесь специалист по DS Сергей Сметанин пару лет назад провёл своё исследование на тему моделей, решающих эту задачу.

Не смотрите на давность. До сих пор актуально.

GitHub

GitHub - sismetanin/sentiment-analysis-in-russian: Fine-tuned Multilingual BERT and Multilingual USE for sentiment analysis in…

Fine-tuned Multilingual BERT and Multilingual USE for sentiment analysis in Russian. RuReviews, RuSentiment, Kaggle Russian News Dataset, LINIS Crowd, and RuTweetCorp were utilized as training data...

👍4👎1🔥1

401 views16:20

Магия данных | Артур Сапрыкин

Мне, кажется, что для многих будет полезно.

371 views17:05

Магия данных | Артур Сапрыкин

Forwarded from DL in NLP (Vlad Lialin)

Внезапно поделюсь статьёй на VC от знакомой (да, я сам удивлен). Статья на наболевшую тему составления резюме.

Четыре года назад когда я переехал на учебу в штаты именно Анна помогла мне полностью переделать CV, после чего я попал на стажировку в гугл.

В статье есть полезные советы о том что добавлять в описание опыта работы, например перечислить скилы которые вы получили там, а что не надо. Также есть ссылки на хорошие шаблоны CV в Overleaf.

vc.ru

Краткий гайд - составление Resume/CV для Data Scientist

Резюме/ CV / аккаунт LinkedIN - инструменты, с создания или обновления которых, чаще всего начинается поиск работы. Обновление резюме чаще всего необходимо, когда Вы просто ищете работу, и тем более требуется, если ищете работу Remote, с переездом в другую…

👍5🔥3

368 views17:05

Магия данных | Артур Сапрыкин

😂👍🏼

🔥10😁6😢1

392 views08:55

Магия данных | Артур Сапрыкин

Легенда ушла

360 views09:24

Магия данных | Артур Сапрыкин

Forwarded from Типичный программист

Умер сооснователь Intel Гордон Мур

Гордону Муру было 94 года. Именно он сформулировал «закон Мура». В 1965 году Мур предположил, что количество транзисторов в интегральной схеме будет удваиваться каждый год.

Press F.

#intel #история

😱2🙏2🫡2

373 views09:24

Магия данных | Артур Сапрыкин

Немного про то, почему базы данных умеют быстро находить информацию по нашему запросу.

Да, речь идёт про индексацию.
Подробностей немного, но для старта самое то!

Хабр

Как устроено индексирование баз данных

Индексирование баз данных — это техника, повышающая скорость и эффективность запросов к базе данных. Она создаёт отдельную структуру данных, сопоставляющую значения в одном или нескольких столбцах...

👍5🥰1

418 views12:03

Магия данных | Артур Сапрыкин

10 популярных библиотек на Python для работы с аудио.

Какими-то пользуюсь или пользовался я сам.
Какими-то, признаюсь, ещё не пользовалась сам, а может даже и не буду пользоваться.

Так или иначе, для новичков в работе с аудио это будет полезно 😉🦾

Python самоучитель для начинающих

10 аудиомодулей Python для воспроизведения и записи

В настоящее время язык программирования Python является ведущим из-за его удобных функций. Python также имеет много интересных модулей и библиотек, с помощью которых пользователи могут многое сделать, используя их. Одна из самых интересных особенностей языка…

🔥4

439 views13:50

Магия данных | Артур Сапрыкин

Для тех, кто уже учит нейронки, и думает насчёт размещения куда-либо, да ещё и максимально оптимально, то вот статья.

Тут ребята с Даблтап рассказали, какие способы есть для оптимизации нейронок.

Классный ликбез, рекомендую! 👍

Please open Telegram to view this post

VIEW IN TELEGRAM

Хабр

Neural Network Optimization: океан в капле

Всех приветствую, меня зовут Антон Рябых, работаю в Doubletapp . Вместе с коллегой Данилом Гальпериным мы написали статью про важный этап в процессе обучения нейронных сетей и получения необходимых...

🔥4

521 views19:48

Магия данных | Артур Сапрыкин

Заходите на огонёк 🙂

444 views13:22

Магия данных | Артур Сапрыкин

Forwarded from Data Science by REBRAIN

Открытый практикум Data Analyst by Rebrain: Алгоритмы классификации изображений

Успевайте зарегистрироваться. Количество мест строго ограничено!

👉Регистрация

Время проведения:

28 Марта (Вторник) в 19:00 по МСК

Программа практикума:

🔹ImageNet и его роль в современном глубоком обучении
🔹Сверточные нейронные сети в задачах классификации
🔹Архитектуры нейронных сетей от ResNet до Yollo

Кто ведет?

Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.

493 views13:22

Магия данных | Артур Сапрыкин

А вот на просторах комьюнити выложили тетрадь с ALPACA - https://colab.research.google.com/drive/1eWAmesrW99p7e1nah5bipn0zikMb8XYC

Если очень коротко, то это языковая модель, которая +- работает на уровне GPT-3.

Google

alpaca-lora.ipynb

Colaboratory notebook

❤2

798 views12:19

Магия данных | Артур Сапрыкин

Вот краткая её история

518 views12:20

Магия данных | Артур Сапрыкин

Forwarded from Ppilif

ещё из забавного — Meta продолбала модель свою, а какие-то челы из стэнфорда доучили её, но я хз есть ли доученный варик в открытом доступе (кажется по ссылке ниже есть)

Но хочу рассказать о другой интересной новости: у meta есть большая языковая модель LLAMA которая утекла в торент, и есть GPT-3 от openai, у которой есть доступ только к API и нужно платить деньги)
Но исследователей из Стэнфорда это никак не смутило!
Они взяли LLAMA, сгенерировали 52к инструкций с помощью доступной по API модели GPT-3 (как они пишут, что на это ушло порядка $500), дообучили LLAMA за несколько часов (еще $100) и по качеству генерации полученная модель не уступает GPT-3.
Вроде бы очень простая идея, но результат супер! (назвали получившуюся модельку ALPACA)

👍6

701 views12:20

Магия данных | Артур Сапрыкин

😁18

528 views16:47

Магия данных | Артур Сапрыкин

Немного запоздалая весть, но обязан сообщить, что Твиттер выкинули в открытый доступ код своей рекомендательной системы.

Особенно полезно тем, кто ещё с рексис не освоился, а вдохновение откуда то брать нужно.

В общем, полезные практики, которые помогут расширить своё восприятие в продвижении чего-либо и создании моделей.

GitHub

GitHub - twitter/the-algorithm: Source code for the X Recommendation Algorithm

Source code for the X Recommendation Algorithm. Contribute to twitter/the-algorithm development by creating an account on GitHub.

🔥6👍1

611 views19:50

About

Blog

Apps

Platform