Love. Death. Transformers. – Telegram
Love. Death. Transformers.
22.5K subscribers
4.26K photos
499 videos
76 files
2.79K links
❤️☠️🤗

Указанные действия не являются ресерчем, поскольку:
а) Мы не ученые;
б) Оно работает.
@transformerslovedeatch по всем вопросам
Все ситуации вымышлены, любые совпадения с реальности плот вашей фантазии.
Download Telegram
гайс, ищу человека знающего казахский
6124🔥4🤡4
Меня пугает openai.

GPT4 turbo более чем полугода, gpt4 больше года, но полноценно обогонать смогли только сейчас, причем только другие closed ai -
аnthropic.

Причем - именно что догнать, модель явно умнее, но по бенчмаркам хуже, а по lmsys разрыв около минимальный.
49👍10🤡4🤔2
Мы все живём в ебанутом романе Пелевина.

В далеком 2018 мы ходили на митинги, хотели чтобы в России стало лучше.

Мы лишены родины, стали нежелательными элементами, но несем часть той самой родины от Бали до Лос Анжелеса. Строим сервисы, рестораны, науку, основываем компании.

Вы узнаете кафе эмигрантов этой волны по рафу, по характерному миксу кухни и любви к кофе. Не забывайте кто вы, помогайте друг другу.

Не стоит забывать тех кто боролся и пытался. Недавно было 40 дней Алексея.


Видео

Помогите чем можете, тем кому можете.
👍189151🤡13914👎138👏7🤔3😢2🔥1
Starling - aka ft mistral 7в, поднялся на 13 место, обогнав gpt3.5 и Claude.

Бенч гудхартнули или мне кажется?
🤔17
😁38143🤔1
Love. Death. Transformers.
Photo
Это не чат, это Ebа́nyChat. Еба́ноязычная Chа́tGPT от лаборатории еба́ного резерча

Здарова, хабровчане!
Хайп вокруг нейросетей, заалайненых при помощи Instructions и RLHF (известных в народе под единым брендом «хуйня из под коня из каждого утюга»), трудно не заметить. Именно поэтому мы решили тоже хайпануть запрыгнуть в этот поезд!

Общий подход для обучения подобных моделей примерно такой:
1. Заиметь хорошую LLM.
2. Сделать SFT.
3. Собрать фидбек.
4. Полирнуть все RLHF’ом.

В текущем релизе мы забили хуй на все эти пункты, как один из способов максимального прироста в качестве (а кто нас проверит, лол?).

Давайте посмотрим, что же находится внутри Ebа́nyChа́t’а.
⁃ Рандомная LM, которую нам принес стажер с хагинфейса (ваще похуй че там внутри, 13B параметров сделают go brrrr (больше модельки мы не умеем файнтьюнить))
⁃ Датасет для SFT (перевели альпаку-хуяку промтом; похуй, сгодится; еще собрали каких-то случайных датасетов с ХФ’а и захардкодили промпты; все же нормально будет, да? оверфитинг? ну мы меньше итераций обучения поставим)
⁃ Затем мы начали дрочить развесовку для этих датасетов на глазок (кидали кости на доску и записывали значения в качестве веса. Наш джун после этого сошел с ума, сказал что мы занимаемся какой-то дикой поеботой и устроился на работу в нормальное место)
⁃ Разочек обучили модель (а зачем че-то там тьюнить? (а вообще к нам пришли ребята с прода и сказали освобождать железо, т.к. мы опять занимаемся хуйней)) В какой-то момент она перестала генерировать <pad> <pad> <pad> — решили что близки к AGI и остановили обучение.

Сперва мы вообще хотели забить хуй на тестирование, но наш менеджер сказал что нужны какие-то цифры. В общем, позвали деврела, показали ему 3 парных семпла с chatgpt, спросили какие из них луче. Он везде сказал что чатжпт лучше. Получилось какое-то ебаное качество, но как-то плевать, напишем что 1 к 3 лучше. (деврела уволили, кстати).

Ни метрики, ни честный Human Evaluation мы показывать конечно же не будем. Кого это ебет? Тебя это ебет?

А, да, не зарелизим претрейн. Мы его кстати назвали gpt-5. Почему? Просто.
Под катом у нас куча примеров, которые мы начерепикали, наслаждайтесь. Должно хватить на постов 10-20 где-то еще.

https://news.1rj.ru/str/ebaresearch/458
😁59👍76🤮44👎1
третий релиз русских LLM подряд одно и тоже, да чо за хуйня, почему до сих пор мемная паста описывает релизы лучше чем сами релизы
👍26😢7🤮32
Будущее с обманом роботов уже здесь.


администрация канала осуждает такое
😁114👎21👍332🤮1
из предложки
😁981943👍2
Forwarded from STACK MORE LAYERS (Alexander Mamaev)
This media is not supported in your browser
VIEW IN TELEGRAM
Посвящается всем авторам ТГ каналов про Эй Ай


Я слежу что пишет сама
Знаю все про Гэ Пэ Тэ
Ворлд модели строит Сора
подпишись на мой тэ гэ

Здесь посты и много мемов
Можно слушать и читать
Будешь лучшем в мире сеток
Клоуна не ставьте блять

Когда ты станешь самым смелым
Будешь шарить, больше знать
Будет офер, много денег
Незабудь донат прислать


https://app.suno.ai/song/71d79d32-73f1-42e4-8b55-16809ebfad33
🔥66🤡51😁751👎1👏1🤮1
в чем проблема
😁51195🤡4🤮2
ебать и приговаривать - flash attention не всегда эквивалентен, реализации разные сильно отличаются по перфомансу и качеству
39😁31👏1