Хотите обучить мощную языковую модель под ваши конкретные задачи?
Вот человек дообучил GPT-2 на научных статьях.
Как он это сделал и что в итоге получил, можете прочитать в статье.
Очень полезно, особенно тем, кто никогда ничего не файнтюнил, и вообще, хочет разобраться, как готовые модели помогают тем, у кого нет лярдов долларов на подготовку и обучения новой GPT 🙂
Вот человек дообучил GPT-2 на научных статьях.
Как он это сделал и что в итоге получил, можете прочитать в статье.
Очень полезно, особенно тем, кто никогда ничего не файнтюнил, и вообще, хочет разобраться, как готовые модели помогают тем, у кого нет лярдов долларов на подготовку и обучения новой GPT 🙂
Medium
I Fine-Tuned GPT-2 on 110K Scientific Papers. Here’s The Result
Content writing by AI is common, but is it possible for an AI to write technical essays?
🔥6👍3
Ещё хочу поделиться с вами с одним из направлений информатики - клеточные автоматы.
Да, это про известную игру Жизнь и ей подобные.
Знаете, правила и код у неё достаточно просты, но, как известно, всё гениальное просто, и я вдохновляюсь этой простотой и красотой.
Один замечательный человек на Хабре создал цикл статей, посвящённых тому, что было сделано с помощью клеточный автоматов, какие шаблоны есть. Некоторые из них влились в современную культуру (без преувеличений).
Вот список:
Статья 1
Статья 2
Статья 3
Статья 4
Наслаждайтесь и вдохновляйтесь. ☀️
Да, это про известную игру Жизнь и ей подобные.
Знаете, правила и код у неё достаточно просты, но, как известно, всё гениальное просто, и я вдохновляюсь этой простотой и красотой.
Один замечательный человек на Хабре создал цикл статей, посвящённых тому, что было сделано с помощью клеточный автоматов, какие шаблоны есть. Некоторые из них влились в современную культуру (без преувеличений).
Вот список:
Статья 1
Статья 2
Статья 3
Статья 4
Наслаждайтесь и вдохновляйтесь. ☀️
Хабр
10 удивительно зрелищных простейших клеточных автоматов
?, Хабр! Осторожно, присутствуют мерцающие гифки. Они спрятаны под спойлеры , открывайте на своё усмотрение. На большом экране рекомендуется смотреть в хорошо освещённом помещении. Базовая вводная...
👍5❤1
Сегодня расскажу про поиск похожих аудио. Заходите! 🙌
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Поиск похожих аудио
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
21 Марта (Вторник) в 19:00 по МСК
Программа практикума:
🔹Теория работы алгоритма Shazam
🔹Готовые инструменты, которые решают аналогичную задачу. Применение на практике
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
21 Марта (Вторник) в 19:00 по МСК
Программа практикума:
🔹Теория работы алгоритма Shazam
🔹Готовые инструменты, которые решают аналогичную задачу. Применение на практике
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
👍4🔥2❤1
Друзья, кому интересен сентимент-анализ (это когда токсичность текста классифицируем), то загляните сюда.
Здесь специалист по DS Сергей Сметанин пару лет назад провёл своё исследование на тему моделей, решающих эту задачу.
Не смотрите на давность. До сих пор актуально.
Здесь специалист по DS Сергей Сметанин пару лет назад провёл своё исследование на тему моделей, решающих эту задачу.
Не смотрите на давность. До сих пор актуально.
GitHub
GitHub - sismetanin/sentiment-analysis-in-russian: Fine-tuned Multilingual BERT and Multilingual USE for sentiment analysis in…
Fine-tuned Multilingual BERT and Multilingual USE for sentiment analysis in Russian. RuReviews, RuSentiment, Kaggle Russian News Dataset, LINIS Crowd, and RuTweetCorp were utilized as training data...
👍4👎1🔥1
Forwarded from DL in NLP (Vlad Lialin)
Внезапно поделюсь статьёй на VC от знакомой (да, я сам удивлен). Статья на наболевшую тему составления резюме.
Четыре года назад когда я переехал на учебу в штаты именно Анна помогла мне полностью переделать CV, после чего я попал на стажировку в гугл.
В статье есть полезные советы о том что добавлять в описание опыта работы, например перечислить скилы которые вы получили там, а что не надо. Также есть ссылки на хорошие шаблоны CV в Overleaf.
Четыре года назад когда я переехал на учебу в штаты именно Анна помогла мне полностью переделать CV, после чего я попал на стажировку в гугл.
В статье есть полезные советы о том что добавлять в описание опыта работы, например перечислить скилы которые вы получили там, а что не надо. Также есть ссылки на хорошие шаблоны CV в Overleaf.
vc.ru
Краткий гайд - составление Resume/CV для Data Scientist
Резюме/ CV / аккаунт LinkedIN - инструменты, с создания или обновления которых, чаще всего начинается поиск работы. Обновление резюме чаще всего необходимо, когда Вы просто ищете работу, и тем более требуется, если ищете работу Remote, с переездом в другую…
👍5🔥3
Немного про то, почему базы данных умеют быстро находить информацию по нашему запросу.
Да, речь идёт про индексацию.
Подробностей немного, но для старта самое то!
Да, речь идёт про индексацию.
Подробностей немного, но для старта самое то!
Хабр
Как устроено индексирование баз данных
Индексирование баз данных — это техника, повышающая скорость и эффективность запросов к базе данных. Она создаёт отдельную структуру данных, сопоставляющую значения в одном или нескольких столбцах...
👍5🥰1
10 популярных библиотек на Python для работы с аудио.
Какими-то пользуюсь или пользовался я сам.
Какими-то, признаюсь, ещё не пользовалась сам, а может даже и не буду пользоваться.
Так или иначе, для новичков в работе с аудио это будет полезно 😉🦾
Какими-то пользуюсь или пользовался я сам.
Какими-то, признаюсь, ещё не пользовалась сам, а может даже и не буду пользоваться.
Так или иначе, для новичков в работе с аудио это будет полезно 😉🦾
Python самоучитель для начинающих
10 аудиомодулей Python для воспроизведения и записи
В настоящее время язык программирования Python является ведущим из-за его удобных функций. Python также имеет много интересных модулей и библиотек, с помощью которых пользователи могут многое сделать, используя их. Одна из самых интересных особенностей языка…
🔥4
Для тех, кто уже учит нейронки, и думает насчёт размещения куда-либо, да ещё и максимально оптимально, то вот статья.
Тут ребята с Даблтап рассказали, какие способы есть для оптимизации нейронок.
Классный ликбез, рекомендую!👍
Тут ребята с Даблтап рассказали, какие способы есть для оптимизации нейронок.
Классный ликбез, рекомендую!
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Neural Network Optimization: океан в капле
Всех приветствую, меня зовут Антон Рябых, работаю в Doubletapp . Вместе с коллегой Данилом Гальпериным мы написали статью про важный этап в процессе обучения нейронных сетей и получения необходимых...
🔥4
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Алгоритмы классификации изображений
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
28 Марта (Вторник) в 19:00 по МСК
Программа практикума:
🔹ImageNet и его роль в современном глубоком обучении
🔹Сверточные нейронные сети в задачах классификации
🔹Архитектуры нейронных сетей от ResNet до Yollo
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
28 Марта (Вторник) в 19:00 по МСК
Программа практикума:
🔹ImageNet и его роль в современном глубоком обучении
🔹Сверточные нейронные сети в задачах классификации
🔹Архитектуры нейронных сетей от ResNet до Yollo
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
А вот на просторах комьюнити выложили тетрадь с ALPACA - https://colab.research.google.com/drive/1eWAmesrW99p7e1nah5bipn0zikMb8XYC
Если очень коротко, то это языковая модель, которая +- работает на уровне GPT-3.
Если очень коротко, то это языковая модель, которая +- работает на уровне GPT-3.
Google
alpaca-lora.ipynb
Colaboratory notebook
❤2
Forwarded from Ppilif
ещё из забавного — Meta продолбала модель свою, а какие-то челы из стэнфорда доучили её, но я хз есть ли доученный варик в открытом доступе (кажется по ссылке ниже есть)
Но хочу рассказать о другой интересной новости: у meta есть большая языковая модель LLAMA которая утекла в торент, и есть GPT-3 от openai, у которой есть доступ только к API и нужно платить деньги)
Но исследователей из Стэнфорда это никак не смутило!
Они взяли LLAMA, сгенерировали 52к инструкций с помощью доступной по API модели GPT-3 (как они пишут, что на это ушло порядка $500), дообучили LLAMA за несколько часов (еще $100) и по качеству генерации полученная модель не уступает GPT-3.
Вроде бы очень простая идея, но результат супер! (назвали получившуюся модельку ALPACA)
Но хочу рассказать о другой интересной новости: у meta есть большая языковая модель LLAMA которая утекла в торент, и есть GPT-3 от openai, у которой есть доступ только к API и нужно платить деньги)
Но исследователей из Стэнфорда это никак не смутило!
Они взяли LLAMA, сгенерировали 52к инструкций с помощью доступной по API модели GPT-3 (как они пишут, что на это ушло порядка $500), дообучили LLAMA за несколько часов (еще $100) и по качеству генерации полученная модель не уступает GPT-3.
Вроде бы очень простая идея, но результат супер! (назвали получившуюся модельку ALPACA)
👍6
Немного запоздалая весть, но обязан сообщить, что Твиттер выкинули в открытый доступ код своей рекомендательной системы.
Особенно полезно тем, кто ещё с рексис не освоился, а вдохновение откуда то брать нужно.
В общем, полезные практики, которые помогут расширить своё восприятие в продвижении чего-либо и создании моделей.
Особенно полезно тем, кто ещё с рексис не освоился, а вдохновение откуда то брать нужно.
В общем, полезные практики, которые помогут расширить своё восприятие в продвижении чего-либо и создании моделей.
GitHub
GitHub - twitter/the-algorithm: Source code for the X Recommendation Algorithm
Source code for the X Recommendation Algorithm. Contribute to twitter/the-algorithm development by creating an account on GitHub.
🔥6👍1