NEW BOT Телеграм, страница

Выложил v2 версию Сайги Немо. Основных изменений 3:
- Я убрал 80+ примеров из SFT, в которых использовались системные промпты персонажей из ПингПонга. Они появились там до ПингПонга из логов бота, собственно сам лидерборд я собирал на их основе. Это может считаться утечкой, поэтому они убраны из обучения.
- В SimPO датасете я агрессивнее порезал длину и увеличил вес SFT лосса, чтобы укоротить ответы и уменьшить количество выдуманных слов.
- Дотюнил на Достоевском и смёржил ровно так, как я делал для Вихря.

На ПингПонге стало лучше, на арене пока нет результатов.

Если кому-то захочется остаться на v1, везде можно указать ревизию, они есть в карточке модели.

GGUF'ы будут завтра.

🤡28👍17💊3🤮22

7.09K views15:27

Love. Death. Transformers.

Forwarded from ебãные идеи для трейдинга

использовать отклонение уровня тестостерона фаундера от нормы как мультипликатор при оценке

>for testosterone, we observe that founders at the pre-seed and acquired stages had median levels below the healthy range. Seed and Series A founders were within the healthy range but below optimal levels. Only at the Series B stage did the median testosterone level enter the optimal range, although statistical significance could not be established due to the small sample size <..>

https://arxiv.org/pdf/2411.03361

9222🥴7🍌5🔥4💊4👍3😁3🤔1

8.73K views16:31

Love. Death. Transformers.

Forwarded from Разработки Теры

Я опубликовал простой аудио AE. По сути, это адаптированный SoundStream, из которого я убрал дискретные токены, оставив только латентные представления.

🔥19👍11

7.8K views12:14

Love. Death. Transformers.

Довольно ценная штука, полезно посмотреть как учить audio ae. Хотелось бы большой блогпост, надеюсь Терра напишет.

👍21

7.74K viewsedited 12:14

Love. Death. Transformers.

nvidia rtx5880 вышла))

https://www.nvidia.com/en-us/design-visualization/rtx-5880/

🍓31☃5🔥2

8.19K views15:43

Love. Death. Transformers.

ищу челиксов которые торгуют 3090/4090 с 48gb памяти, отпишитесь в @transformerslovedeatch речь про перепаянные карты с 48гб памяти

https://www.avito.ru/moskva/tovary_dlya_kompyutera/nvidia_geforce_rtx_4090_48gb_turbo_2024_4494188888

во, нормально

донейшены в trc20 usdt чтобы затестить: TU6Rzbsu1NDLYUVfpCyFcXXyUS9iFJw2hK

Авито

Nvidia GeForce RTX 4090 48GB Turbo (2024) купить в Москве по низкой цене | Электроника | Авито

Nvidia GeForce RTX 4090 48GB Turbo (2024): объявление о продаже в Москве на Авито. Цена уже указана с учетом всех расходов до Москвы. Сроки доставки примерно 7-10 дней. Версия на 48GB видеопамяти, полностью рабочая с гарантией! Пишите или звоните, отвечу…

🔥5

7.96K viewsedited 20:36

Love. Death. Transformers.

Forwarded from NLP семинар, ЛЕЯ (ВШЭ СПб)

19 ноября в 18:30 у нас выступит команда Vikhr models c докладом:

“Как мы русифицировали языковые модели и пришли к лучшей в классе открытой модели на русском”

Ссылка на видеовстречу: https://telemost.yandex.ru/j/89085873905223

🔥58👍17🤡11👏1

7.35K views12:51

Love. Death. Transformers.

Redteaming is all you need

😁83😐21😢15🥴7😨5👾5👍1🔥1

7.67K views09:15

Love. Death. Transformers.

0:51

Media is too big

VIEW IN TELEGRAM

Я в восторге от рекламы новых unitree, робособака с колесами выглядит как будущее

👍73😁10🔥7🌚5❤‍🔥4

9.82K viewsedited 19:47

Love. Death. Transformers.

Китай удар?

😁147257🤡43🙉2

7.93K views21:19

Love. Death. Transformers.

почему на сайте дойки.ком нет возмжности быстро узнать doi нужной статьи

😁119😢11🍓8🥴4🔥2

7.44K views09:10

Love. Death. Transformers.

ну раз речь про диффузии пошла...

https://huggingface.co/learn/diffusion-course/unit0/1

- почему latent>pixel diffusion
- не велосипедный код, diffusers, torch и трансформерс - короче то что от вас будут реально ждать)))
- интуиция для аудио/видео + все нужные статьи и интуиция
- имплементация ddpm - уже не очень актуальная, но все еще необходимая
- что такое guidence, class сonditioned, improved diffusion models
- Что такое SD и с чем его едят, без этой инфорамации вас не возьмут никуда

huggingface.co

Hugging Face Diffusion Models Course - Hugging Face Diffusion Course

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🍓39🔥10🗿5❤‍🔥1

8.59K viewsedited 10:05

Love. Death. Transformers.

This media is not supported in your browser

VIEW IN TELEGRAM

обзор на qwen2.5

сегодня.

✍39🎉5❤‍🔥4

6.89K viewsedited 16:04

Love. Death. Transformers.

Ищу денег на обучение Berta на 18т токенов, писать в лс @transformerslovedeatch

3351💊14🤡13💩5😍3👍2🌚2

6.53K viewsedited 17:45

Love. Death. Transformers.

Forwarded from Ruadaptная комната

В продолжении наших экспериментов с адаптацией Qwen-2.5 моделей мы выпускаем RuadaptQwen-2.5-32B-Instruct (v1)! Вероятно самая большая открытая модель на данный момент, адаптированная на русский язык (в частности у нее один из наилучших токенайзеров среди открытых моделей для русского языка).

Модель была оценена на бенчмарке MERA (см. картинку).
Некоторая особенность сабмита на MERA в том, что в нем был использован кастомный промпт (есть в карточке сабмита), но для честного сравнения мы также добавили сабмит с исходной версией модели с таким же промптом.

Ссылка на модель:
https://huggingface.co/msu-rcc-lair/RuadaptQwen-32B-instruct

GGUF версия:
https://huggingface.co/msu-rcc-lair/RuadaptQwen2.5-32B-instruct-GGUF

Попробовать можно тут:
https://huggingface.co/spaces/RefalMachine/RuadaptQwen2.5

Будем рады фидбеку по достоинствам и недостатком модели.

100🔥366👍5🍓3🤡1

6.49K views19:02

Love. Death. Transformers.

англоязычное пространство: openai, antropic, google, meta, куча китайских лаб с сотнями сотрудников дерутся за лучшие претрены, и лучшие aligemntы, опенсурс делается на огромные гранты , гиганты выдают в опенсурс llama и gemma

русскоязычное пространство: э, ну у нас есть три команды энтузиастов которые на свои деньги что то делают.
Еще есть бигтехи со своими претренами, но туда мы не ходим, там 7б модели по 20usd/m токенов

121👍91😁47😢18💯9🤷‍♂7🥱6👎2🌚1👾1

7.94K viewsedited 19:14

Love. Death. Transformers.

маленькая девочка попросила Бога: а можно в мере будет \n и \t экранированы???

вместе с девочкой плакало половина гигачата....

43🤡12❤‍🔥1👏1🤮1

6.93K viewsedited 19:23

Love. Death. Transformers.

Qwen2.5-Coder
- 23T токенов в претрене
- 23Т токенов пролито через 0.5b модель и она приросла по метрикам до уровня gemma2b которая как llama2 7b. Чтож.
- Добавили Math данных из Qwen Math
- В SandBox проверяли код на компилируемость
- Учили на FileLevel - те внутрь контекста складывали файл кода целиком
- Учили с <FILL IN THE MIDDLE> ака MLM таской - это важно для решения разных бенчей

<|repo_name|>{repo_name}
<|file_sep|>{file_path1}
{file_content1}
<|file_sep|>{file_path2}
{file_content2}
<|file_sep|>{file_path3}
<|fim_prefix|>{code_pre}<|fim_suffix|>{code_suf}<|fim_middle|>{code_fim}<|endoftext|>

вот в таком виде учили на ЦЕЛЫХ РЕПОЗИТОРИЯХ!!

- Модель на большинстве оффлайн бенчмарков на уровне gpt4o/sonnet3.5. Имея 32b параметров. 32b.
- На скрине live code bench - датасет который обновляется PRами и на нем пока что не научились оверфитится, для контекста - sonnet 3.5 - от июня выдает 38.1

paper

👍54🔥11✍3❤‍🔥2

7.86K viewsedited 21:32

About

Blog

Apps

Platform