не ругайте российскую оппозицию, она ничего не сделала
😁90🤡33💩27😢10👍8🔥8🤔2🌚2👏1🤯1😈1
В какой то момент мы стали жить в ебучем четвертом сезоне атаки титанов
👍52🔥12🤡11🤬2🖕2🤮1
не давайте math phd писать код, потом будете такую хуету править:
ngpu = len(lightning_config.trainer.gpus.strip(",").split(','))
ngpu = len(lightning_config.trainer.gpus.strip(",").split(','))
🔥47😁19😱2
#чтивонаночь
Whisper
Дисклеймер:
Я буду во многом повторять пост Саши из команды Silero - гения TTS/STT и кажется одного из самых крутых speech engineer которых я знаю.
Данные:
Крауленный интернет, вычищенный от транскриптов, asr
Пунктуация минимально приводят к стандарту, мы учим seq2seq оно само выучит.
Русского к слову довольно много, модель неплохо понимает русский.
В сумме:
680 тысяч часов
Архитектурно:
encoder-decoder трансфоремер, на вхиод окно в 25 миллисекунд и шагом в 10 миллисекунд, 16кгц, которые сворачивают 2*Conv1d и прогоняют через GELU
Самая большая модель - скромные 1.5b параметров.
Скорость и точность:
1) модель сильно медленее класических asr, тут вообще без шансов
2)
- Качество сильно падает на коротких аудио;
- Галлюцинации на других языках;
- Для языков, кроме английского, правил нормализации текста нет как таковых, она выдает некое "своё" рандомное видение;
- В примерах от авторов есть только batch size 1
paper
code
большой разбор whisper
А самое главное - мой подписчик с ником Dim собрал бота с Whisper, за что большое ему спасибо
Играться с large моделькой:
@whisperOpenAIbot
Картинка украдена из поста
Whisper
Дисклеймер:
Я буду во многом повторять пост Саши из команды Silero - гения TTS/STT и кажется одного из самых крутых speech engineer которых я знаю.
Данные:
Крауленный интернет, вычищенный от транскриптов, asr
Пунктуация минимально приводят к стандарту, мы учим seq2seq оно само выучит.
Русского к слову довольно много, модель неплохо понимает русский.
В сумме:
680 тысяч часов
Архитектурно:
encoder-decoder трансфоремер, на вхиод окно в 25 миллисекунд и шагом в 10 миллисекунд, 16кгц, которые сворачивают 2*Conv1d и прогоняют через GELU
Самая большая модель - скромные 1.5b параметров.
Скорость и точность:
1) модель сильно медленее класических asr, тут вообще без шансов
2)
- Качество сильно падает на коротких аудио;
- Галлюцинации на других языках;
- Для языков, кроме английского, правил нормализации текста нет как таковых, она выдает некое "своё" рандомное видение;
- В примерах от авторов есть только batch size 1
paper
code
большой разбор whisper
А самое главное - мой подписчик с ником Dim собрал бота с Whisper, за что большое ему спасибо
Играться с large моделькой:
@whisperOpenAIbot
Картинка украдена из поста
👍5🔥3🤮1
Forwarded from Hints research
Друзья, сейчас важно помочь с релокацией тем, кто хочет уехать, но не может финансово сделать это в одиночку.
Вероятно многим в канале это не актуально, но прошу об услуге
1. Поделитесь с теми, кому это поможет
2. Поставьте в комментарии к городу, в котором вы находитесь, что вы там, это поможет запустить активность чата
——
Чат для поиска людей, с которыми можно скооперироваться для аренды жилья за границей
https://news.1rj.ru/str/friends_for_relocate
Зачем это?
- многие уезжают по одиночке
- многим дорого снимать квартиру на одного
- а если снимать вместе то сильно дешевле
- квартиры уже сильно подорожали (в 2-3 раза) плюс однушки заняты
Как использовать
- выбирайте из списка в канале город, куда собираетесь ехать
- пишите в комментарии когда собираетесь ехать, или что уже приехали и ищете соседей
- пишите тем кто едет туда же
- снимайте квартиру совместно
Зовите других людей
- многие не решаются уезжать, потому что уже очень дорого, а зарплата не позволяет
- расскажите им про чат, чтобы они увидели, с кем могут скооперироваться, как могут сэкономить, и наконец решились уехать
Вероятно многим в канале это не актуально, но прошу об услуге
1. Поделитесь с теми, кому это поможет
2. Поставьте в комментарии к городу, в котором вы находитесь, что вы там, это поможет запустить активность чата
——
Чат для поиска людей, с которыми можно скооперироваться для аренды жилья за границей
https://news.1rj.ru/str/friends_for_relocate
Зачем это?
- многие уезжают по одиночке
- многим дорого снимать квартиру на одного
- а если снимать вместе то сильно дешевле
- квартиры уже сильно подорожали (в 2-3 раза) плюс однушки заняты
Как использовать
- выбирайте из списка в канале город, куда собираетесь ехать
- пишите в комментарии когда собираетесь ехать, или что уже приехали и ищете соседей
- пишите тем кто едет туда же
- снимайте квартиру совместно
Зовите других людей
- многие не решаются уезжать, потому что уже очень дорого, а зарплата не позволяет
- расскажите им про чат, чтобы они увидели, с кем могут скооперироваться, как могут сэкономить, и наконец решились уехать
🔥15🤡5💩3👍1
Тред поиска удалённой работы.
Если у вас есть вакансия с удалённой работой, разместите ниже в следующем формате:
Что нужно делать на работе:
Вилка:
Если у вас есть вакансия с удалённой работой, разместите ниже в следующем формате:
Что нужно делать на работе:
Вилка:
👍29❤2🔥1
memeDenoscriptions.zip
208.6 MB
Подписчик напарсил мемов с текстовыми описаниями 😎
Автор: Nik
Автор: Nik
🤩24👍3🎉3🔥2
Forwarded from Градиент обреченный (Sergei Averkiev)
🔺 Woland-10
Сделал параллельный корпус на 10 языков (ru, be, uk, en, de, it, fr, es, hu, zh) из различных редакций романа Мастер и Маргарита. Всего получилось ~7.5k параллельных групп строк.
〰️ Выровнял при помощи своей выравнивалки Lingtrain (а это, напомню, проект открытый). Получилось довольно быстро, особенно с новой картой, — со своей GPU жизнь действительно заиграла новыми красками 😁
Сначала нашел и разметил 10 текстов на разных языках, потом выровнял каждую пару с оригиналом. Потом все выравнивания совместно. Могу описать подробней, если интересно.
Могут встречаться шероховатости, так как все равно надо дополнительно проверять качество, но в целом выглядит пристойно (если что — пишите), буду ещё улучшать.
Сделал параллельный корпус на 10 языков (ru, be, uk, en, de, it, fr, es, hu, zh) из различных редакций романа Мастер и Маргарита. Всего получилось ~7.5k параллельных групп строк.
〰️ Выровнял при помощи своей выравнивалки Lingtrain (а это, напомню, проект открытый). Получилось довольно быстро, особенно с новой картой, — со своей GPU жизнь действительно заиграла новыми красками 😁
Сначала нашел и разметил 10 текстов на разных языках, потом выровнял каждую пару с оригиналом. Потом все выравнивания совместно. Могу описать подробней, если интересно.
Могут встречаться шероховатости, так как все равно надо дополнительно проверять качество, но в целом выглядит пристойно (если что — пишите), буду ещё улучшать.
🇷🇺 Вино какой страны предпочитаете в это время дня?👉 GitHub
🇧🇾 Вiно з якое краiны вы любiце ў гэтую пару дня?
🇺🇦 Вино якої країни вам більше до вподоби цієї пори дня?
🇬🇧 What country's wine do you prefer at this time of day?'
🇩🇪 Den Wein welches Landes bevorzugen Sie zu dieser Tageszeit?"
🇫🇷 Du vin de quel pays préférez-vous, à cette heure de la journée ?
🇮🇹 Il vino di quale paese preferisce a quest'ora del giorno?
🇪🇸 ¿De qué país lo prefiere a esta hora del día?
🇭🇺 Milyen bort szeret a legjobban ilyenkor déltájban?
🇨🇳 平常在这个时间您喜欢喝哪国产的葡萄酒?
👍29🔥11❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Да я буду проводить референсы с атакой титанов, а что вы мне сделаете?
🤨26👍13🥰6🌚5🤔4🤣3🖕3👏1😢1😈1
Вообще это было ожидаемо, с учетом количества бесплатных юзеров балующихся с image genrators на халяву.
По сути то что его популяризировало, то и убило.
Следующими вероятно на этот путь станут Huggingface, бесплатное хранилище моделей станет сильно меньше, впилят интерации с AWS(ну вообще уже), код самой либы будет либо деградировать, либо плодить такое количество абстракций чтобы проще было взять API.
Покойся с миром colab.
😢77👍4
кажется мы оч быстро скипнули второй сезон АТ и перешли к 4
👍22🍾6⚡2🤮1
Stanford cs25
Трансформеры уважаешь?
А маму любишь?
Послушай этот курс даже если уже не первый год делаешь
YouTube
Lectures page
Трансформеры уважаешь?
А маму любишь?
Послушай этот курс даже если уже не первый год делаешь
import torch, расскажут про RL, alphafold2 и много другого.YouTube
Lectures page
👍28🔥3🤮1