NEW BOT Телеграм, страница - 978142941

Love. Death. Transformers.

@lovedeathtransformers

22.5K subscribers

4.26K photos

499 videos

76 files

2.79K links

❤️☠️🤗

Указанные действия не являются ресерчем, поскольку:
а) Мы не ученые;
б) Оно работает.
@transformerslovedeatch по всем вопросам
Все ситуации вымышлены, любые совпадения с реальности плот вашей фантазии.

Download Telegram

About

Blog

Apps

Platform

Love. Death. Transformers.

22.5K subscribers

Love. Death. Transformers.

Forwarded from Кононюковщина

⚡️ RussianVibe XL 2.0

Завершено обучение второй версии нейронной сети для генерации пейзажей России. На этот раз набор фотографий был почти в 6 раз больше, чем в версии 1.0!

Такое увеличение датасета существенно повлияло на качество модели:
- Улучшилась геометрия зданий. Теперь они больше похожи на привычный вид из окна)))
- Сцены стали более сложными.
- Цвета стали более разнообразными и насыщенными.

Но качество базового вывода сильно ухудшилось. Это связано с тем, что большинство фотографий из набора данных были сделаны на обычный телефон, из-за чего нейросеть генерирует слегка размытые изображения. Исправить это достаточно просто - добавьте тег low quality к negative_prompt.

Чуть позже я напишу статью на Хабре с более подробным техническим описанием того, как это работает и зачем это все вообще нужно :)

Онлайн демонстрация - https://hf.co/spaces/0x7o/RussianVibe
Файлы модели - https://hf.co/0x7o/RussianVibe-XL-v2.0
Датасет - https://hf.co/datasets/0x7o/RussianVibe-data
GitHub - https://github.com/0x7o/RussianVibe

@hikonon

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥84👍8🤮6🤡3

4.99K views13:20

Love. Death. Transformers.

Вышла Gemma - llama от google, огромный токенайзер на 260к токенов, 6T(!) токенов в претрене, хорошая токенизация русского и средний mt перфоманс(на русском на вид средне).
по метрикам что то около mistral 7b для страшей модели(7b) и phi2 для 2b модели
ссылка

Gemma release - a google Collection

Groups the Gemma models released by the Google team.

👍17❤1

5.22K viewsedited 14:14

Love. Death. Transformers.

256к токенайзер это довольно много, мало языков которые модель не видела, вероятно базовый перфоманс будет неплохой.
но то на чем тренили вызывает вопрос, почему то авторы акцентируют внимание на том что они вырезали child abuse content. Я вообще впервые такое вижу

😁501814👍1🤔1

5.63K viewsedited 14:15

Love. Death. Transformers.

This media is not supported in your browser

VIEW IN TELEGRAM

5.73K views14:15

🤔944

Love. Death. Transformers.

😁70🤡933

5.69K views14:41

Love. Death. Transformers.

Love. Death. Transformers.

👏42🤡15👍1

5.41K views14:44

Love. Death. Transformers.

Love. Death. Transformers.

256к токенайзер это довольно много, мало языков которые модель не видела, вероятно базовый перфоманс будет неплохой. но то на чем тренили вызывает вопрос, почему то авторы акцентируют внимание на том что они вырезали child abuse content. Я вообще впервые…

Нет gqa у 7в
Огромный словарь
16х ffn dim
Head size 256
В коде для хф модели нет flash attn
7B на самом деле почти 8.2(с эмбедами)

Очень странный релиз

🤔10

5.71K views04:28

Love. Death. Transformers.

Love. Death. Transformers.

Нет gqa у 7в Огромный словарь 16х ffn dim Head size 256 В коде для хф модели нет flash attn 7B на самом деле почти 8.2(с эмбедами) Очень странный релиз

По русски: у жирных карт, жирный sram который юзает flash, авторы gemmi хуй забили на не топ карты.

👍9

5.99K viewsedited 04:59

Love. Death. Transformers.

Stable diffusion 3

- 800m до 8b
- генерация текста
- пока нет папиры/хф
- трансфомерные блоки
- flow mathcing(optimal transport диффузия)
ссылка

🔥43❤44👍1

7.25K viewsedited 14:07

Love. Death. Transformers.

Love. Death. Transformers.

Stable diffusion 3 - 800m до 8b - генерация текста - пока нет папиры/хф - трансфомерные блоки - flow mathcing(optimal transport диффузия) ссылка

🔥44😁169👍1🤡1

7.59K views16:39

Love. Death. Transformers.

Ну спасибо что не world models

❤60😁20🤡752👍1

5.17K views19:39

Love. Death. Transformers.

Forwarded from Мишин Лернинг

Точность в нейминге размера модели критически важна для LLM, поскольку это влияет на справедливость сравнения, воспроизводимость результатов и понимание компромиссов между размером модели и её производительностью.

Решил создать тред на HF. так что поддержать идею о переименовании модели Gemma7B в Gemma-9B можно тут:

👉 https://huggingface.co/google/gemma-7b/discussions/34

А то ресерч-маркетологи ведут себя как на рынке, ну и вообще, камон, округление все в начальной школе проходили.

google/gemma-7b · Proposal for Renaming of Gemma-7B Model to Gemma-9B

I am reaching out to discuss a proposal regarding the Gemma-7B language model. Upon detailed analysis, it has come to attention that the Gemma-7B model comprises a total of 8.54 billion parameters,...

❤34👍10🤮5

4.63K views04:36

Love. Death. Transformers.

Forwarded from Psy Eyes (Andrey Bezryadin)

GitHub - vosen/ZLUDA: CUDA on non-NVIDIA GPUs

CUDA on non-NVIDIA GPUs. Contribute to vosen/ZLUDA development by creating an account on GitHub.

ZLUDA — поддержка CUDA на видюхах AMD.

Разработчик Андрей Яник пилил для Intel поддержку CUDA на видюхах Arc, но спустя 2 года они решили, что никакого применения у CUDA на их GPU нет и обрубили финансирование без разрешения опенсорсить проект. Андрей пришёл в AMD и какое-то время работал над реализацией под их видюхи, но потом и они решили прикрыть лавочку. Однако в этот раз код разрешили открыть.

Работает где-то быстрее, чем OpenCL, а где-то медленнее или постоянно крашится. Поддержка и совместимость с разного рода софтом пока сильно ограничена.

В FAQ проекта написано, что он заброшен, но учитывая, что на прошлой неделе вышла версия 3, а народ даже опробовал с его помощью гонять llama.cpp на RX 6800, он таки развивается.

Гитхаб

👍518❤3🔥3🤔1

5.18K views08:18

Love. Death. Transformers.

This media is not supported in your browser

VIEW IN TELEGRAM

мысли админа по ночам:

48😁167🔥6👍2❤1

5.4K viewsedited 09:20

Love. Death. Transformers.

Сегодня вечером в Ереване будет сходка

https://news.1rj.ru/str/+mXuW1ndJ3kM1YWFi

Адрес будет позже

ереван LDT

Aleksandr invites you to join this group on Telegram.

13❤3🤡3👎2🤮22🤔1

5.1K views09:11

Love. Death. Transformers.

Forwarded from The After Times

😁99👍8❤4

4.89K views14:24

Love. Death. Transformers.

Forwarded from Старший Авгур

Сайга-Гемма
Или переходим на обучение в axolotl.

Изначально идея этого эксперимента была в сравнении axolotl vs unsloth vs hf-trainer для дообучения новой базовой модели, Геммы.
Однако unsloth до сих пор её не поддерживает, а hf-trainer на 24 Гб карточке вылетает по памяти, так что остался только axolotl. Который в итоге всё равно работал только на A100 с 40 Гб.

Обучение было полностью в Колабе на A100: ссылка
Сама модель: ссылка
Училась только Лора, 6 часов.

Плюсы axolotl:
- Все параметры в одном конфиге.
- Очень удобный отладочный режим для просмотра финальной токенизации.
- Быстрая поддержка новых фичей и моделей.

Минусы axolotl:
- Довольно посредственные исходники с кучей багов.
- Как будто бы никакого выигрыша по времени и памяти по сравнению с самописным hf-trainer'ом.
- Нельзя легко сделать новый шаблон промпта (например с родным геммовским <start_of_turn>), поэтому пришлось патчить токенизатор, чтобы переделать шаблон под ChatML.

Проблемы с Геммой:
- Странные OOM'ы на 24 Гб. Я пока не понимаю, как обучение Лоры с batch_size=1 может вылетать по памяти, когда с 13B моделями с теми же настройками всё было в порядке.
- repetition_penalty отличный от 1.0 ломает модель и в HF, и в llama.cpp. Не я один это заметил, см. эту дискуссию.
- GGUF квантизация ниже 8 бит тоже ломает модель, она перестает вовремя генерировать EOS.
- Рандомные баги посреди генерации, отчасти возникающие из-за того, что нельзя поставить repetition_penalty.

Из-за всего этого SbS с Мистралем она заведомо проиграет. При этом в примерах, где багов нет, ответы вполне адекватные.
Модель пока не стоит использовать. Надеюсь через пару недель баги везде пофиксят, и станет лучше. Потенциал в ней точно есть.
Например, её можно дообучать на больших русских корпусах без изменения токенизатора.

11👍7❤3🤮3🤡2

5.16K views14:27

Love. Death. Transformers.

Media is too big

VIEW IN TELEGRAM

81🔥13❤22

6.21K viewsedited 20:15

Love. Death. Transformers.

Ищу кредиты на клауд, и вы хотите поделиться компьютом(порядка сингл ноды(dgx like) на несколько месяцев< 3) на благое дело, то вас очень сильно ждут @maxalekv

35😁9

5.78K viewsedited 20:46