NEW BOT Телеграм, страница - 64367475

Техножнец

1.63K subscribers

1.04K photos

210 videos

12 files

371 links

Канал моих увлечений и поделок. Все ,что я делаю и выкладываю здесь - делается с любовью.

Download Telegram

About

Blog

Apps

Platform

Техножнец

1.63K subscribers

Техножнец

Media is too big

VIEW IN TELEGRAM

👍9🫡2

223 views23:00

Техножнец

Вспоминается моя история с печатали, как я страдал , что дискриминатор улетает в космос по ошибке в отличие от генератора...гребаный gan ....ебаные ганы....но!

Всё оказалось прозрачнее, теперь вышла чудесная бумага, кажется старые ошибки сетей GAN уронили и принесли норм архитектуру.

https://news.1rj.ru/str/data_secrets/5891

Читать тут. Респект паблик Data secrets

GAN умер; да здравствует GAN!

Да, эта статья заслуживает внимания за одно лишь название (в оригинале на английском The GAN is dead; long live the GAN!). Однако вчера она еще и стала лидером в рейтинге Paper of the day на HF. Разбираемся 👇

Итак, GAN был…

🔥5❤1

247 views10:45

Техножнец

Щас будет небольшое объявление!

221 views15:23

Техножнец

This media is not supported in your browser

VIEW IN TELEGRAM

ЗАКИНУТЬ ДРОВ

🔤

🔤

🔤

🔤

Уважаемые, мои средства на пару дней закончились.
Скоро кончатся и google colab баллы.
Считаю, что модели отдыхать даже пару дней не надо! (надо учиться)

Поэтому...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3

237 views15:32

Техножнец

ОТЧЕТ ПО ПРОЕКТУ RUKALLAMA: ДОСТИЖЕНИЯ И ПЕРСПЕКТИВЫ

КЛЮЧЕВЫЕ ДОСТИЖЕНИЯ:

Разработана эффективная архитектура (24M параметров)
Достигнута 35x эффективность по сравнению с аналогами
Успешная работа на минимальном датасете (82MB + 100MB)
Стабильная адаптация к обновлениям токенизатора

ТЕКУЩИЙ СТАТУС:

Loss: 7.4059 (устойчивое снижение)
Стабильная работа на потребительском GPU
Успешное освоение базовой структуры языка
Эффективная интеграция инструкций

ТЕХНОЛОГИЧЕСКИЕ ПРЕИМУЩЕСТВА:

Уникальная архитектура со сплайнами Колмогорова-Арнольда
Эффективная реализация RoPE
Высокая адаптивность к изменениям
Минимальные требования к ресурсам

ОГРАНИЧЕНИЯ И ПЕРСПЕКТИВЫ:

Достижение loss 4 ограничено объемом обучающих данных
Модель достигла высокой структурной эффективности
Для семантического понимания потребуются большие датасеты
Возможна дальнейшая оптимизация в рамках текущей архитектуры

ЗАКЛЮЧЕНИЕ:

🤖Проект демонстрирует исключительную эффективность в рамках поставленных задач. 🤖

🤖

🤖

🤖

🤖

🤖

🤖

⚡️🔌

Достигнутые результаты показывают перспективность выбранного подхода для создания ресурсо-эффективных языковых моделей.

ПОДДЕРЖАТЬ ПРОЕКТ: https://yoomoney.ru/fundraise/17N44BNASIE.250111

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5❤2🤩1

238 views15:53

Техножнец

Работает! Этого хватит на (примерно) 14 часов! Мы уже суетимся...
(как подойдут закину ещё, потом ещё)

Сейчас попробуем запустить параллельно на локальной машине!

ПОДДАТЬ ДРОВ

Спасибо комьюнити ❤️

💅5👀1

291 views17:24

Техножнец

ЧАТ RUKALLAMA - 187 ЭПОХА (LOSS 7.4593)

Тем временем запущен параллельный сеанс для вас.

P.S. Скоро тоже будет всё переезжать на постоянный адрес.

👍2

303 views17:39

Техножнец

Звук обучения модели с 173 по 187 эпоху.

289 views20:37

Техножнец

🤯6

259 views20:37

Техножнец

❤2😍2

242 views20:37

Техножнец

Техножнец

Media is too big

VIEW IN TELEGRAM

Зарисовка:

Rukallama срёт токенами в лесу

🥰4😁3👀2

269 views23:42

Техножнец

Оппа. Есть что отокээрить.
Буду искать уникальные книги

👨‍💻2👍1

312 views12:18

Техножнец

Сейчас закину ваших дров в печь

🔥5

305 views12:23

Техножнец

Закинул! Продолжаем!

🔥4

265 views13:38

Техножнец

ЧАТ с 195 эпохой

оппа

🔥5👍1

242 viewsedited 13:56

Техножнец

🌋 RUKALLAMA ЭПОХА 200: НЕЙРОНКА ВЫХОДИТ НА НОВЫЙ УРОВЕНЬ! 🌋

ЧАТ С 200 ЭПОХОЙ

🍴

Rukallama сегодня отмечает 200 эпоху своей мультипликации. Этот процесс с каждым разом идёт Rukallama на пользу.

Параллельно тренируется её "злой" брат близнец (шутка - там просто на железе отдельно, батч чуть побольше, поэтому слегка вперёд бежит, мы ещё протестируем веса оттуда, когда убежит далеко)

🧠 ТЕКУЩИЙ СТАТУС:

LOSS ЛЕТИТ ВНИЗ:

Стартовали с 8.2 (было больно)
За 60 эпох скинули до 7.1842
Тренд на снижение (и это НОРМА!)
Структура всё лучше и лучше

🔬 ГЛАВНЫЕ УЛУЧШЕНИЯ:

НОВЫЙ ТОКЕНИЗАТОР:

Уже 60 эпох учит инструкции
Помогает ей в структуру общения
БОЛЬШЕ ШИЗОФАЗИИ!
Первые молекулы смысла в генерации пойдут из инструкций!

⚡️ ЧТО ИЗМЕНИЛОСЬ:

ЭПОХА 200:

Стабильное снижение лосса!
Буд-то начинает одуплять!
Более приятные ответы!
Ещё больше кеков!

💊 СЛЕДУЮЩИЕ ШАГИ:

ПЛАНЫ:

Продолжаем снижать лосс
Добавляем новые инструкции
Улучшаем структуру ответов
Ждём эпоху 300😊!

👊P.S. Те, кто ждал смысла в генерациях - ждите 😃

👊P.P.S. Будем щас изучать "двойника"

#RuKaLLaMA #НейроПрогресс #РусскийAI #ЗаМашинноеОбучение

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

265 viewsedited 23:15

Техножнец

Техножнец

🌋 RUKALLAMA ЭПОХА 200: НЕЙРОНКА ВЫХОДИТ НА НОВЫЙ УРОВЕНЬ! 🌋 ЧАТ С 200 ЭПОХОЙ 🍴 Rukallama сегодня отмечает 200 эпоху своей мультипликации. Этот процесс с каждым разом идёт Rukallama на пользу. Параллельно тренируется её "злой" брат близнец (шутка - там…

КОРРЕКТИРОВКА: Крен корабля!

После длительного анализа моего токенизатора я пришел к выводу.
Сделал не очень. Надо ещё раз постараться и подумать, посижу подумаю.

Будет ещё обновление токенизатора перед продолжением плана.
Пока что попытаюсь добиться LOSS: 6 и остановлю тренировку.
После этого внедрю новый токенизатор и буду смотреть на свойства модели.

ЕСЛИ ЧЕ - СТАРТАНЁМ ЗАНОВО!

Но уже совместным кластером - с помощью распределённого обучения.

Почему это нормально?

Лично для меня проблема - это то, что поможет сделать модель лучше.
Проблема - это понимание ситуации. Обычно пока я не понимаю, то это не проблема - а непонятка и муть.
Непонятки и муть позади: я точно уверен, что надо обновлять токенизатор.

Лол, снова придется переписывать домовую книгу токенов.
Сделаю гибкий словарь, чтобы он пополнялся автоматически.

P.S. Параллельно создал около 800 вопросов к готовящимся инструкциям. Собираю потихоньку книги. Всё продолжает двигаться.

👍11

262 views03:04

Техножнец

👍8🔥4❤3

252 views15:43

Техножнец

Мы прошли один кружок ада вместе.

Хочу вам за это выразить благодарность, потому что это начало пути в движухе it и у меня не было комьюнити наподобие вашего.

Все ,что строится тут будет иметь долгосрочные последствия.

Буду рад и дальше с вами разделять. Щас я за день на хуярю новый токенизатор, потрачу на это норм времени, удостоверюсь, что ебашит на уровне индустрии и буду делать норм. Нужен таргет токенизатора по датасетам 97-98% декодировки из токена в текст : только такой процент даст максимум усваиваемости для модели.

На данный момент применяется слишком агрессивная лемматизация

👏14👍2

286 viewsedited 23:20

Техножнец

💯10👾1

332 views23:54

Техножнец

Следует отметить, что есть люди, которым не стрёмно заделиться.

https://www.youtube.com/watch?v=l8pRSuU81PU&t=1218s&ab_channel=AndrejKarpathy

Андрюхе - юважениум.
Видос достаточно старый, но хороший!

Let's reproduce GPT-2 (124M)

We reproduce the GPT-2 (124M) from scratch. This video covers the whole process: First we build the GPT-2 network, then we optimize its training to be really fast, then we set up the training run following the GPT-2 and GPT-3 paper and their hyperparameters…

406 views03:55