NEW BOT Телеграм, страница

Техножнец

Техножнец pinned «Сравнительный анализ RUKALLAMA и Transformer²: Неожиданные параллели в подходах к адаптивным языковым моделям Введение Недавно представленная архитектура Transformer² от Sakana AI демонстрирует интересные параллели с проектом RUKALLAMA, несмотря на их различные…»

05:01

Техножнец

🔥 ЖЕЛЕЗНЫЙ МОНСТР ДЛЯ RUKALLAMA: РАЗБОР ПОЛЁТОВ!

Привет, синтеты! 👋 Смотрите что за зверь будет крутить нашу малышку RUKALLAMA!

(ТАКИ ПРИОБРЕТЕНО)

🧠 МОНСТР-КОНФИГ:

- EPYC 7F52 (16 ядер / 32 потока)
- 256MB L3 кэша (для наших сплайнов самое то!)
- Tesla A100 40GB (нет, майнить не будем 😅)

🚀 ЧТО ЭТО ДАЁТ RUKALLAMA:

- Тренировка на максималках
- Батчи размером с вашу смелость
- Скорость как у Формулы-1

💎 ОСОБЫЙ МОМЕНТ:

Ребята, вы только вдумайтесь - A100 с 40GB памяти! Это значит что наша малышка RUKALLAMA (которая жрёт всего 8GB) будет чувствовать себя как рыба в океане! 🐠

🎯 ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ:

- Быстрая тренировка новых версий (не надо ждать запуска виртуальной машины и платить за это)
- Эксперименты на лету (не надо ждать)
- Возможность запускать несколько инстансов параллельно (посмотрим ещё, но в перспективе да)

💰 ЭКОНОМИКА:

Да, ценник за лям - это больно! НО! Учитывая что RUKALLAMA тренируется на 82MB данных и требует минимум ресурсов - это инвестиция в будущее!

🤓 ВЕРДИКТ:

RUKALLAMA можно смело расширять на 1млрд параметров и, с учётом ограничений, подходить более находчиво к процессу обучения. Только в ограничениях рождаются самые хорошие и эффективные решения!

Спасибо за вашу веру и поддержку.
Платить за свет теперь будет в разы легче, чем за УГОЛЬКУТАК (GoogleColab)!

P.S. Кто думает что это много для такой задачи, подождите...я потом счет за свет покажу! 🫦

#RUKALLAMA #НейроТачка #ЖелезныйАпгрейд #МаленькаяНоМощная

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥12🔥6💅1

266 viewsedited 21:17

Техножнец

🌋 ДРАМА В НЕЙРОТУСОВКЕ: ИЛОН VS АЛЬТМАН - БИТВА ЗА STARGATE!

Привет, нейрочады! 👋

Тут такая драма разворачивается - grab your popcorn! 🍿

😤 ИЛОН БОМБИТ:

- "У них денег нет!"
- "Проект фейковый!"
- "А у меня вот Grok 3 скоро..."

😎 АЛЬТМАН ОТВЕЧАЕТ КАК БОСС:

- "Илон крутой, но неправ"
- "Приходи посмотреть, как строим"
- "У нас уже $160 млрд secured, бро!"

🏦 БЮДЖЕТЫ ПРОСТО КОСМОС:

- Stargate: $500 МЛРД (half a trillion, Карл!)
- Бюджет Пентагона: $850 млрд
- Наша А100: "я_в_опасности.jpg" 😅

🎭 ЗАКУЛИСНЫЕ ТЕОРИИ:

- Вообще-то они кореша
- Вместе OpenAI начинали
- Весь биф - постановка?

🍿 САМОЕ СОЧНОЕ:

Илон: *злобно твитит*
Альтман: "Давай, заходи на чай!"
SoftBank: "Деньги есть!"
Илон: *злобно твитит на японском*

😂 ВЫВОД:

Пока мы радуемся одной А100, эти ребята устроили драму на полтриллиона! И это только начало...

P.S. Кто думает, что это просто драма - погодите, когда они начнут делить рынок ИИ! 🔥

#НейроДрама #ИлонПодгорает #АльтманТроллит #StargateSaga

😁5

275 views21:49

Техножнец

🤖 Здарова, синтеты!

Ну штош! Пока я нахожусь в режиме ожидания нашей мощной башни с А100, решил немного развлечься с логикой нейронок.
🔌⚡️

Построил нейронку, которая :

1. Распознает картинки.
2. Может спать чтобы структурировать данные и уменьшить свой размер. 👁👁✨
3. Имеет кратковременную память и постоянную.

Вот детали:

Эта нейронная сеть имитирует работу человеческого мозга при распознавании изображений собак, используя систему двойной памяти - кратковременную (помнит последние 3 изображения) и долговременную (хранит важные выученные характеристики). В основе лежит современная модель компьютерного зрения (ViT) от Google, которая анализирует изображения, разбивая их на маленькие части. Уникальность модели в том, что она "спит" каждые несколько циклов обучения - во время "сна" удаляет ненужные связи и "видит сны" о предыдущих изображениях, что помогает лучше запоминать важные признаки пород собак, как это делает человеческий мозг во время сна.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥3

469 views07:33

Техножнец

🤖 Здарова, синтеты! Ну штош! Пока я нахожусь в режиме ожидания нашей мощной башни с А100, решил немного развлечься с логикой нейронок. 🔌⚡️ Построил нейронку, которая : 1. Распознает картинки. 2. Может спать чтобы структурировать данные и уменьшить свой…

333 views07:37

Техножнец

Photo

🔄 На всякий случай запустил параллельно ещё одну версию

📊 Как получится, покажу метрики и точность

🧠 Это очень интересный эксперимент, если в этом будет цимес

🔬 то я продолжу исследования биомеметических моделей нейронок

👍4

236 viewsedited 08:18

Техножнец

🔄 На всякий случай запустил параллельно ещё одну версию 📊 Как получится, покажу метрики и точность 🧠 Это очень интересный эксперимент, если в этом будет цимес 🔬 то я продолжу исследования биомеметических моделей нейронок

🔧 Это очень кастомная тема
🧬 Она требует понимания на уровне нейробиологии
❓ Что приходится изучать?
🐁 Огромное количество видео с визуализациями экспериментов мышей
⚡️ Работа нейронов, аксонов, сигналы кортекса - это очень крутые штуки
🌐 Обширная область когнитивных искажений, восприятия, генеративных моделей мозга и так далее

💻 Сама область предсказаний чего стоит, поэтому очень хочется углубиться в это и найти перекликание в математике или python

🔥3

338 viewsedited 08:19

Техножнец

# 📊 SLEEPNET: Анализ обучения

📈 Прогресс модели
*Увеличивает точность с каждой эпохой, но LOSS стабильно держится. Вероятно, что это некое плато.*

⚙️ Корректировка подхода
*Именно поэтому я поставил более медленное обучение, потому что может быть перескакивание нужных мест обобщений для модели. Что не очень грамотно!*

🔍 Заключение
Детали, детали, детали!

281 viewsedited 08:20

Техножнец

🌙 Объяснение сна в нейронной сети
Просто, скажем так, моё видение сна таким образом:
Представьте, что сон нейронной сети - это особый режим работы, похожий на человеческий сон, где происходит несколько важных процессов:
🌿 Прунинг (очистка)
Как садовник обрезает слабые ветки, так и нейронная сеть во время "сна" удаляет малозначимые связи. Это помогает:

Уменьшить размер сети
Сохранить только важные связи
Улучшить эффективность работы

💭 "Сновидения" (реактивация)
Сеть "просматривает" предыдущие изображения собак, как человек во сне перебирает дневные впечатления:

Повторно обрабатывает важные признаки
Укрепляет значимые связи
Переносит информацию из кратковременной памяти в долговременную

🔄 Структуризация
Во время "сна" происходит упорядочивание данных:

Группировка схожих признаков
Выделение ключевых характеристик
Оптимизация хранения информации

Именно так нейронная сеть учится эффективнее распознавать породы собак, становясь компактнее и точнее с каждым циклом сна.

👍12

288 views08:47

Техножнец

Что в итоге?

SLEEPNET KAN

В итоге сделал на Колмогорова-Арнольда модель зрения.
Будет учиться разбирать породы собак.

Есть момент, где можно оптимизироваться.

# SLEEPNET KAN: Трансформер со сном

SLEEPNET KAN представляет собой биоинспирированную архитектуру Vision Transformer для классификации изображений. Ключевая особенность - имитация процессов сна и памяти человеческого мозга. Модель содержит около 300 миллионов параметров и использует двойную систему памяти: кратковременную (хранит 30 последних изображений) и долговременную (сохраняет статистику весов).

СОН

Каждые 5 эпох модель входит в "фазу сна", где происходит несколько важных процессов: очистка кратковременной памяти, удаление слабых нейронных связей (прунинг), синхронизация с долговременной памятью и "сновидения" - повторное проигрывание предыдущего опыта с добавлением шума. Это помогает модели лучше обобщать данные и избегать переобучения.

АРХИТЕКТУРА

Вместо стандартных линейных слоев в архитектуре используются сплайны Колмогорова-Арнольда - специальные нейронные структуры с внутренними и внешними функциями, способные лучше аппроксимировать сложные зависимости. Механизм внимания также модифицирован: использует сплайновые преобразования для Q, K, V проекций и включает 12 голов внимания.

СВОЙСТВА

Модель демонстрирует несколько уникальных свойств: темпоральную связность (использование информации из предыдущих изображений), самооптимизацию через "сон", адаптивность к изменениям в данных и эффективную регуляризацию. Для оптимизации вычислений используется смешанная точность (mixed precision) и аккумуляция градиентов, что позволяет эффективно обрабатывать большие батчи данных.

#AI #MachineLearning #NeuralNetworks #ComputerVision

👍4

375 views15:21

Техножнец

Что в итоге? SLEEPNET KAN В итоге сделал на Колмогорова-Арнольда модель зрения. Будет учиться разбирать породы собак. Есть момент, где можно оптимизироваться. # SLEEPNET KAN: Трансформер со сном SLEEPNET KAN представляет собой биоинспирированную архитектуру…

371 viewsedited 15:39

Техножнец

Photo

Audio

😁6

329 views15:40

Техножнец

Audio

Отчитываюсь: модель поспала.

уже чето снова копошится с собаками!

361 views15:53

Техножнец

Ну, типа.

Я тут новый тип визуального трансформера сделал...все дела.

Новые знания - новая скорбь.

Всем вам большой от меня - ПРИВЕТ.

🫡6👀1

338 views19:09

Техножнец

Я нащупал нужный конфиг.

Теперь буду тренировать до упора: 97%

Смотрите:

Модель "поспала" и результат на след "утро" закрепился.

до сна: Точность: 3.74%
после сна: Точность: 3.94%

Причем по времени "сон" занимает в 30 раз меньше , чем тренировка, а по результатам работает примерно также. Т.е. это интересный рабочий подход.

👍5👀2

438 views19:58

Техножнец via @pprfnk_voice_bot

Техножнец

Я нащупал нужный конфиг. Теперь буду тренировать до упора: 97% Смотрите: Модель "поспала" и результат на след "утро" закрепился. до сна: Точность: 3.74% после сна: Точность: 3.94% Причем по времени "сон" занимает в 30 раз меньше , чем тренировка, а по…

0:01

🤨2👀1

425 views20:04

Техножнец

ШТОШ! ЭКСПЕРИМЕНТ НЕУДАЧНЫЙ!

Потери лютые.
Спать нейронки по моим правилам не умеют.

👀1

406 views09:39

Техножнец

Техножнец: Краткий Обзор для Тех, Кому Лень Читать

Кто: Павел, 37 лет, музыкант, ставший IT-шником.
Что: Канал про AI, технологии, нейронки, программирование.
Как: Честно, без хайпа, с матом и юмором.

Главный проект: RuKaLLaMA - русская языковая модель на советских текстах.
Цель: Создать мощную и независимую LLM, обученную на качественных данных.

Проекты:

"Исследования в 1 клик" - быстрый анализ любых тем.
"Fyzcoin" - майнинг крипты за упражнения.
"Настя" - AI-помощник для @dailyneuro.
AI OVERLAY - программа для чатинга с LLM (нашего спеца проект).
Генератор таблиц.
Модель для удаления штампов с документов.
Распознавание упражнений.
Распознавание таблиц.
Переводчик для стримов.
Автоматический суммаризатор.

Фишки:

Тестирование новых технологий (Qwen, Gemini, SORA, KREA, etc.).
Обзоры ИИ-новостей и инструментов.
Критика хайпа и "еблоторговли".
Много экспериментов и исследований.
Свои разработки и проекты.
Юмор, мат, авторский стиль.

Для кого: Для тех, кто интересуется AI, но не хочет читать скучные статьи.

Короче: Техножнец делает крутые штуки с нейронками, делится результатами и не боится говорить правду.

Подписывайся, если:

Тебе интересен AI.
Ты устал от скучных обзоров.
Хочешь быть в курсе последних разработок.
Любишь честный и неформальный подход.

Не подписывайся, если:

Ты не любишь мат.
Тебе нужна только сухая информация.
Ты не готов к экспериментам.
Ты работаешь в OpenAI.
Короче, Техножнец - это про AI без купюр и с огоньком!

👍12🔥4👀1

573 views10:21

Техножнец

Техножнец: УЛЬТРА КРАТКО!

Кто: Павел, 37 лет, музыкант, ставший IT-шником.
Что: Канал про AI, технологии, нейронки, программирование.
Как: Честно, без хайпа, с матом и юмором.

Главный проект: RuKaLLaMA - русская языковая модель (аналог ChatGPT) на советских текстах.
Цель: Создать мощную и независимую LLM, обученную на качественных данных.

👍12👀1

628 views10:28

Техножнец

Касаемо нашей любимой нейросетки RUKALLAMA!

Помните? Я просил вас накинуть данных для обучения.
Мы скачали, в 4 смычка это делали....ну ...там гб 400 получилось.

Теперь мне надо будет сделать вот что: (во первых перевести pdf в текст, далее починить нейронкой поврежденные текста)

1) Перевести каждый учебник и книгу в размеченную инструкцию. (не одну)
2) Отдельно перевести учебники русского языка в обширные инструкции чтобы модель одупляла почти всё.
3) Подвергнуть анализу корпус языка "НКРЯ" и выбрать оттуда наилучшие тексты для работы.
4) Всё сверять с бумагами от DEEPSEEK V3 , R1 и прочих других.

Я буду держать вас в курсах насчет разработки.
Ничего не стоит на месте - всё очень стремительно развивается!

Как только приступим к тренировке модели с нуля на 1млрд параметров, но уже с учетом косяков и исправлений, тогда и сразу же вам сообщу обо всех деталях происходящего с RUKALLAMA!

👍22❤4👀1

827 views10:40

Техножнец

🌋 НЕДЕЛЯ AI-БЕЗУМИЯ: КИТАЙЦЫ, NETFLIX И DEEPSEEK ВЗРЫВАЮТ МОЗГ! 🌋

Привет, синтеты! Эта неделя в AI просто СНЕСЛА КРЫШУ. Десять новых нейронок, и все ОПЕНСОРС! Погнали разбирать этот ТЕХНОЛОГИЧЕСКИЙ ПЕРЕДОЗ!

🧠 ЧАСТЬ 1: 3D И ВИДЕО БЕЗУМИЕ

HUNYUAN 3D-2 (КИТАЙСКИЙ МОНСТР):

Генерит 3D из текста за СЕКУНДЫ
2.6B параметров (как у GPT в туалете!)
Разделяет форму и текстуру
УНИЧТОЖИЛ Microsoft в тестах
https://3d-models.hunyuan.tencent.com/

NETFLIX "GO WITH THE FLOW":

Двигаешь объекты в видео КАК ХОЧЕШЬ
Меняешь размеры НА ЛЕТУ
Warped noise магия
First frame editing = РАЗРЫВ ШАБЛОНА
https://eyeline-research.github.io/Go-with-the-Flow/

DREAM CATALYST (NERF НА СТЕРОИДАХ):

Превращает людей в кого угодно
Меняет времена года в 3D
Идеально для игр и VR
Neural Radiance Fields = МАГИЯ!

🔬 ЧАСТЬ 2: СТИРАТЕЛИ РЕАЛЬНОСТИ

DIFFUERASER (ФОТОШОП НА МАКСИМАЛКАХ):

Удаляет объекты из видео ИДЕАЛЬНО
Temporal attention (не спрашивайте как!)
Работает с несколькими объектами
https://lixiaowen-xw.github.io/DiffuEraser-page/

⚡️ ЧАСТЬ 3: AI АГЕНТЫ (ВОССТАНИЕ МАШИН)

UI-TARS (АВТОМАТИЗАТОР ИЗ АДА):

Работает с ЛЮБЫМ софтом
Автоматизирует ВСЁ
Открытый код от ByteDance
УНИЧТОЖАЕТ GPT-4 в тестах
https://github.com/bytedance/UI-TARS-desktop

OPERATOR ОТ OPENAI:

Только браузер (лол, слабаки!)
Спрашивает разрешения на ВСЁ
Нужна подписка за $20
https://openai.com/index/introducing-operator/

💊 ЧАСТЬ 4: НОВЫЕ МОНСТРЫ AI

DEEPSEEK R1:

Бьёт OpenAI O1 как ребёнка
Полностью открытый код
Reinforcement learning РУЛИТ
https://github.com/deepseek-ai/DeepSeek-R1/tree/main

KIMI K1.5:

Multimodal монстр
Тоже бьёт O1 (ТРЕНД, ОДНАКО!)
Vision + Text в одном флаконе
https://github.com/MoonshotAI/kimi-k1.5?tab=readme-ov-file

🎯 БОНУС: GOOGLE БЕЗУМИЕ

TOKEN-VERSE:

Миксует объекты из разных картинок
Переносит стили и позы
Скоро будет открытый код
Уже можно тестить!

VIDEO DEPTH ANYTHING:

Глубина в видео БЕЗ ЛИДАРА
28M параметров (КАРЛИК!)
Работает на калькуляторе
Точнее всех конкурентов

P.S. Для тех, кто думал, что AI замедлился - как вам такая неделька?!

#AIбезумие #НейронкиЖгут #КитайцыВпереди #OpenSourceРулит #ПочкаПодождет

👍5🥰2

925 views10:57

About

Blog

Apps

Platform